GenType Alphabet Creator를 만든 방법

6월 10, 2024
Trudy Painter Creative Lab

Labs.google은 생성형 AI가 할 수 있는 일의 한계를 뛰어넘기 위한 곳으로, AI 도구 사용을 위한 새로운 방법과 독특한 시각적 미학, 즐거운 상호작용을 탐구하는 공간입니다.

이 공간에서의 최신 실험 중 하나인 GenType을 소개합니다. 이 도구는 생성형 AI를 사용하여 여러분이 원하는 그 무엇으로도 알파벳을 만들어 줍니다.


아이디어의 시작

어린 자녀를 둔 한 팀원은 Imagen을 사용해 자녀의 알파벳 학습을 도와주고 싶었습니다. 그래서 아이가 친숙하게 여기는 물건으로 알파벳을 만들어 학습 과정을 더 재미있고 시각적으로 만들었습니다. 아래 동영상은 해당 실험의 결과입니다.

저희는 이렇게 창의적으로 생성형 AI를 사용하는 방법이 정말 마음에 들었을 뿐만 아니라 재미있고 예상치 못한 재료로 만든 각 알파벳 문자를 Imagen으로 생성한 결과를 보니 기뻤습니다.

이 알파벳 중심의 사용 사례를 보며 단일 사용자 입력에서 전체 알파벳을 생성하는 도구를 만들 수 있다면 어떨까? 하는 의문이 떠올랐습니다.


만든 방법: Imagen 2 API를 사용하여 개발

Google의 Imagen 모델과 간단한 프롬프트 레시피를 사용하여 GenType을 만들었습니다. 알파벳의 각 문자는 프롬프트 레시피에 따라 생성됩니다.

{prompt}로 만든 '{letter}'자

Our prompt recipe for GenType

예를 들어, 이 'A'는 프롬프트로 생성되었습니다.

토스트 위에 포도 젤리로 만든 글자 'A', 공중 샷

Example output for “A” made out of grape jelly on toast

GenType 도구는 사용자로부터 단일 입력을 받아 전체 알파벳 26자로 변환해 주는 영리한 도구입니다.

작동 방식은 이렇습니다.

  1. 사용자 입력: 사용하려는 재료 또는 객체를 도구에 알려줍니다. 예를 들어, '포도 젤리, 토스트 위, 공중 샷'을 입력할 수 있습니다.

2. 프롬프트 레시피: 그러면 GenType은 해당 사용자 입력을 사용하여 알파벳의 각 문자를 A부터 Z까지 만듭니다. '토스트 위에 포도 젤리로 만든 글자 'A', 공중 샷 ' 같은 형식을 사용하여 각 문자에 대해 별도로 요청합니다.

3. 자동화: GenType은 한 번에 하나의 요청을 하는 대신 이 프로세스를 자동화합니다. 그래서 '포도 젤리, 토스트 위, 공중 샷'을 처음 입력하면 각 문자마다 하나씩 26개의 요청을 보냅니다. 그 결과 선택한 테마에 부합하는 고유한 문자 집합이 완성됩니다.

GenType에 간단한 입력 정보를 하나 제공하면 창의적이고 사용자 설정된 전체 알파벳 집합을 얻을 수 있습니다. 이렇게 하면 하나의 아이디어가 전체 알파벳 문자 집합으로 바뀌는 것을 매우 쉽게 볼 수 있습니다!

'포도 젤리, 토스트 위, 공중 샷'이라는 입력에 대해 전송된 26개 요청의 다이어그램

문자를 만든 후 GenType 도구로 수행할 수 있는 작업은 다음과 같습니다.

  1. 문구 입력: 이름부터 특별한 생일 메시지까지 원하는 어떤 내용이든 사용자 설정 문자를 사용해 표현할 수 있습니다.

2. 저장 및 복사: 좋아하는 문구, 전체 사용자 설정 알파벳 또는 개별 문자를 저장할 수 있습니다. 또한 복사해서 다른 애플리케이션에서 사용할 수도 있습니다.

3. 문자 재생성: 특정 문자를 변환한 결과가 만족스럽지 않으면 동일한 프롬프트를 사용하여 다른 스타일이나 모양을 시도해 문자를 다시 생성할 수 있습니다.

'포도 젤리, 토스트 위, 공중 샷'으로 생성된 알파벳을 사용하여 표현한 문장, 'Want to get lunch'

멋진 알파벳 생성을 위한 레시피

대부분의 이미지 생성 사례와 마찬가지로, 구체성이 성공적인 생성의 핵심입니다. 특히, 유사한 스타일로 여러 이미지를 생성할 때 명확하고 구체적으로 입력하면 미적 특징을 전체 알파벳에 일관되게 유지하는 데 도움이 됩니다.

A breakdown of our prompt recipe for GenType
'녹색 잎사귀 위 무당벌레, 공중 사진'이라는 프롬프트로 표현한 전경, 배경, 스타일로 생성된 다이어그램

일관된 알파벳 프롬프트는 일반적으로 전경, 배경, 스타일이라는 세 가지 특성이 강력하게 결합되어 있습니다.

  1. 전경 - 문자를 무엇으로 만들 건가요?

문자 형태 지정(예: '무당벌레')

2. 배경: 각 문자의 배경은 무엇인가요?

배경 설명(예: '녹색 잎사귀 위')

3. 스타일: 각 문자의 전체적인 모양은 어떤가요?

미적 특징 정의(예: '공중 사진')

이를 모두 합쳐 '녹색 잎사귀 위 무당벌레, 공중 사진'이라는 알파벳 프롬프트로 일관된 알파벳을 생성합니다.


실제 활용 사례

GenType은 사용 사례에서 융통성을 발휘하도록 설계되어 사용자가 처리 시간을 단축하고 실제 창작에 더 많은 시간을 할애하도록 도와줍니다. 저희 팀에서는 주얼리 제작부터 고유한 타이틀 시퀀스 디자인, 새로운 유형의 디자인에 대한 자유로운 제안, 이벤트 초대장과 포스터에 독창적인 감각을 더하는 등 다양한 사용 사례에서 이미 활용되고 있습니다.

상상력이 커질수록 도구는 더 유용해집니다.


체험해 보기

GenType은 labs.google/gentype에서 다양하게 활용해 볼 수 있습니다.


GenType에 대한 마지막 참고 사항

새로운 기술인 AI가 압도적이고 위협적으로 느껴질 수 있습니다. 그러나 이 신기술에 훨씬 더 쉽게 접근해서 심지어 유쾌하고 재미있게 활용할 수 있는 가능성이 있습니다. GenType과 같은 도구는 AI가 기술 발전을 가능하게 했듯이 창의력이 피어나는 세상을 만드는 데 작은 역할을 합니다. 저희는 GenType과 같은 도구가 사람들이 이전에는 떠올리지 못했을 아이디어를 탐색하는 데 도움이 되기를 바랍니다.


실험 결과 제출

Google은 GenType과 같은 실험 결과를 더욱 활발하게 제출하도록 공개 모집 오디션을 발표했습니다. 재미있게 만든 작품을 제출해 주시면 labs.google에 게시할 예정입니다. Google은 동영상부터 게임, 도구, 실험용 인터페이스 등 다양한 방식으로 AI를 보다 접근하기 쉽고 재미있게 만드는 모든 결과물을 환영합니다.