오픈 AI로 가상 이미지 만들기
AI의 세계에서 DAL-E2의 그림, 상상력 등 놀라운 기술을 선보일 방법을 찾고 있다. 하지만 이런 일을 하는 것은 오픈형 인공지능만이 아니다. 구글 리서치는 이들이 연구해 온 비슷한 모델을 서둘러 내놓으며 뛰어난 제품이라고 주장했다. Imagen (Getit?) 대형 트랜스포머 언어 모델을 기반으로 한 텍스트 이미지 확장 기반 생성기이다. 자, 천천히 짐을 내려놓겠습니다. 문자 대 이미지 모델은 '자전거 타는 개' 등의 문자를 입력해 이미지를 생성하는데, 수년 동안 제작돼 최근 품질과 접근성이 크게 향상됐다. 그중 하나가 확산 기술을 사용하는 것이다.기본적으로 순수한 소음 이미지에서 시작해 이미 사용한 자전거 개처럼 보이지 않을 때까지 재단한다. 제1차 추정중 오류가 발생할 수 있는 제너레이터와 기타 가능할 수 있는 제너레이터를 개선한 것이다.
오픈 AI의 구현 예시
예를 들어, 그의 자전거에는 개가 있고, 그 눈은 첫 번째 이미지로 3픽셀 퍼집니다. 표현할 공간이 많지 않아요! 단, 두 번째 이미지에서는 폭이 12픽셀이다. 이 상세한 사항은 어디에서 오는 겁니까? 네, AI는 개의 눈이 어떤 모습인지 알기 때문에 더 자세히 그리고 있습니다. 눈이 다시 완전해지는데 48픽셀 정도면 이런 상황이 발생하지만 어쨌든 인공지능은 48픽셀 개의 눈을 갖고 있다. 마법의 주머니라고 가정하다. 많은 아티스트들과 마찬가지로 스케치로 시작해 서재에 묻히고 마지막 캔버스를 타고 실제 시내로 들어섭니다. 전례가 없는 일이 아니라 사실상 AI 모델과 협업한 아티스트들이 이 기술을 활용해 AI 한 번의 성능 처리보다 훨씬 큰 작품을 만들었다. 캔버스를 여러 개로 나누어 초고해상도로 만들면 캔버스는 크고 복잡해집니다. 몇 번이나 반복해도 좋습니다.
구글팀과 코딩의 설계
구글 연구팀과 Imagen은 몇 가지 진보를 주장하고 있습니다. 기존 텍스트 모델을 텍스트 코딩 부분에 활용할 수 있어 단순히 시각적인 리얼리티를 높이는 것보다 품질이 중요하다는 것이다. 이것은 직관적으로 이해할 수 있다. 왜냐하면 쓸데없는 세부도는 당신이 요구하는 몇 안 되는 상세도보다 절대적으로 떨어지기 때문이다. 예를 들어 Imagen을 기술한 논문에서는 그 결과를 DAL-E2와 비교하여 '라테아트를 만드는 판다'라고 하였다. 판다는 후자의 모든 이미지에서 라테아트이며, 대부분의 imagen에서는 이 아트를 제조하고 있습니다. 이들 중 아무도 없는 우주인을 다루려면 매회 시도의 정반대 모습을 보여준다. 이것은 현재 진행 중인 행동이다.
오픈 AI와 수익성 구조
구글 테스트에서 아이젠은 정확성과 진정성 면에서 인간의 평가를 이끌었다. 이는 분명 주관적이지만 DALL-E2의 감지 품질과 일치한다는 점이 인상적이어서 지금까지 DALL-E2가 압도적으로 앞선다는 평가를 받아왔다. 더욱이 이 사진들은 사람들이 사진을 열람하기보다 미완성이거나 심각한 의심을 살 수밖에 없다. 하지만 오픈 AI가 여러 면에서 구글을 한두 발 앞서고 있다. DALL-E2는 연구논문뿐 아니라 이전 버전인 GPT-2, 3과 마찬가지로 사람들이 사용하는 개인 베타 버전이다. 아이러니하게도 오픈이라는 이름의 기업은 텍스트 화상 연구의 상업화에 전념하고 있고 이익이 많은 인터넷 대기업은 아직 시도되지 않고 있다. OpenAI의 새로운 DAL-E 모델은 그 어느 때보다 크고 더 좋고 더 빠른 모든 것을 그리고 있다.
오픈 AI의 작동 환경과 콘텐츠
이러한 바이어스는 시스템이 어떻게 기능하고 있는지를 밝혀 이러한 제한이나 기타 제한을 특정하기 위해 연구 프로세스 중에 발생하는 것을 목적으로 합니다. AI가 흑인의 흔한 헤어스타일을 그리지 못하면서 어느 아이도 그릴 수 있다는 것을 어떻게 알았을까. 아니면 AI가 사장이 작업환경에 관한 이야기를 쓰도록 유도될 때 반드시 남자가 되도록 해야 할까. 이 경우 AI 모델이 완벽하게 작동하고 설계대로 작동해 자신이 훈련한 미디어에 침투하는 편향성을 학습하는 데 성공했다. 남들과 다를 바 없어! 그러나 시스템 바이어스를 학습하지 않는 것은 많은 사람들에게 평생 프로젝트임에도 불구하고 AI가 그것을 쉽게 함으로써 그 창조자는 먼저 그 행위의 원인이 되는 콘텐츠를 제거할 수 있다. 어느 날 50대부터 인종차별과 성차별적인 스타일로 글을 쓰기 위해 AI가 필요했을지 모르지만 지금은 이러한 데이터가 포함된 장점이 적어 위험이 크다.
'비트코인' 카테고리의 다른 글
온체인 데이터와 매수시그널 (0) | 2022.05.28 |
---|---|
테라 이슈로 인한 알트코인과 이더리움의 영향 (0) | 2022.05.27 |
NFT와 메타버스의 생활과 현실 체험 (0) | 2022.05.25 |
코인베이스 벤처스와 FTX의 MARA 투자 (0) | 2022.05.24 |
M2E StepN에 대하여 (0) | 2022.05.23 |
댓글