Processo de criação: criador de alfabetos GenType

JUN 10, 2024
Trudy Painter Creative Lab

O Labs.google é um lugar para ultrapassar os limites do que a IA generativa pode fazer. Um lugar para explorar uma estética visual única, interações encantadoras e novas maneiras de usar as ferramentas de IA.

Um de nossos experimentos mais recentes da série é o GenType. Essa ferramenta usa a IA generativa para criar um alfabeto a partir de qualquer coisa que você deseje.


Geração de ideias

Um de nossos colegas de equipe tem filhos pequenos e queria usar o Imagen para ajudá-los a aprender o alfabeto. Ele gerou cartas a partir de objetos com os quais as crianças estavam familiarizadas, para tornar a aprendizagem mais divertida e visual. O vídeo abaixo é o resultado desses experimentos.

Adoramos essa maneira criativa de usar a IA generativa e ficamos encantados com os resultados do Imagen de letras individuais feitas de materiais divertidos (e inesperados).

Este caso de uso centrado no alfabeto provocou a pergunta: e se nós pudéssemos criar uma ferramenta que gerasse um alfabeto inteiro a partir de uma única entrada do usuário?


Como fizemos: criando com o uso da API Imagen 2

Criamos o GenType com o uso do modelo Imagen do Google e um roteiro de prompt simples. Cada letra de um alfabeto é gerada seguindo este roteiro de prompt:

The letter "{letra}" made out of {prompt}

Our prompt recipe for GenType

Por exemplo, este "A" foi gerado apenas com o prompt:

The letter "A" made out of grape jelly, on toast, aerial shot

Example output for “A” made out of grape jelly on toast

A ferramenta GenType é inteligente porque pega uma única entrada do usuário e a transforma em um alfabeto completo de 26 letras.

Como funciona esse novo recurso?

  1. Entrada do usuário: você diz à ferramenta qual material ou objeto deseja usar. Por exemplo, você pode digitar "grape jelly, on toast, aerial shot" (geleia de uva, sobre uma torrada, vista aérea).

2. Roteiro do prompt: a ferramenta usa essa entrada para criar cada uma das letras do alfabeto, de A a Z. Ela faz uma solicitação separada para cada letra usando um formato como este: "The letter 'A' made out of grape jelly, on toast, aerial shot" (A letra "A" feita de geleia de uva, sobre uma torrada, vista aérea).

3. Automação: em vez de fazer uma solicitação por vez, o GenType automatiza o processo. Ele envia 26 solicitações, uma para cada letra, tudo a partir da entrada inicial de "grape jelly, on toast, aerial shot". O resultado é um conjunto completo de letras exclusivas, todas consistentes com o tema escolhido.

Ao dar ao GenType uma entrada simples, você obtém um conjunto completo de letras criativas e personalizadas. Isso torna superfácil ver uma ideia se transformar em um alfabeto inteiro!

Diagrama das 26 solicitações enviadas para a entrada "grape jelly, on toast, photoreal, aerial shot" (geleia de uva, sobre uma torrada, fotorrealista, vista aérea)

Veja o que você pode fazer com a ferramenta GenType depois de criar as letras:

  1. Digitar frases: com as letras personalizadas, você pode soletrar o que quiser, desde o seu nome até uma mensagem especial de aniversário.

2. Salvar e copiar: você pode salvar suas frases favoritas, todo o alfabeto personalizado ou letras individuais. Também é possível fazer uma cópia para usar em outros aplicativos.

3. Gerar as letras novamente: se você não gostar do resultado de uma determinada letra, poderá gerá-la novamente usando o mesmo prompt para tentar um estilo ou uma aparência diferente.

"Want to get lunch" (quero almoçar) soletrado usando um alfabeto gerado com "grape jelly, on toast, aerial shot"

Roteiro para a geração de um alfabeto incrível

Tal como acontece com a maioria das instâncias de geração de imagens, a especificidade é essencial para o sucesso. Em particular, ao gerar várias imagens em um estilo similar, ser claro e específico ajuda a manter uma estética consistente em todo o alfabeto.

A breakdown of our prompt recipe for GenType
Diagrama do primeiro e do segundo planos e do estilo no prompt "Ladybugs, on a green leaf, aerial photo" (Joaninhas, sobre uma folha verde, foto aérea)

Os prompts de alfabeto consistentes geralmente têm uma sólida combinação de três qualidades: primeiro plano, segundo plano e estilo.

  1. Primeiro plano: do que são feitas as letras?

Especifique a forma da letra, por exemplo, "Ladybugs".

2. Segundo plano: qual é o plano de fundo de cada letra?

Descreva o plano de fundo, por exemplo, "on a green leaf".

3. Estilo: qual é a aparência geral de cada letra?

Defina a estética, por exemplo, "aerial photo".

Nosso prompt de alfabeto completo, "Ladybugs, on a green leaf, aerial photo", produz um alfabeto consistente.


No mundo real

O GenType foi projetado para ser flexível em seus casos de uso, ajudando os usuários a gastar menos tempo no processamento e mais tempo na criação. E, em nossa equipe, ele já foi adotado em uma ampla gama de casos de uso, como para criar joias, projetar sequências de títulos exclusivas, discutir novos designs de tipos e adicionar um toque original a convites e cartazes de eventos.

Quanto mais solta a imaginação, mais útil a ferramenta se torna.


Experimente

Você pode brincar com o GenType em: labs.google/gentype.


Uma observação final sobre o GenType

Por ser uma nova tecnologia, a IA pode parecer assustadora e intimidadora. No entanto, ela tem o potencial de se tornar muito mais acessível, e até mesmo divertida. Uma ferramenta como o GenType é uma pequena parte da criação de um mundo onde a IA pode capacitar a criatividade da mesma forma que o progresso tecnológico. Em geral, esperamos que ferramentas como o GenType ajudem as pessoas a explorar ideias que, de outra forma, não teriam tido.


Envie o seu experimento

O Google lançou um chamado aberto para mais envios de experimentos como o GenType. Se você tiver criado algo divertido, envie-o para ser um dos destaques do labs.google. A Google aceita envios que vão de um vídeo até um jogo e de ferramentas até uma interface experimental, ou seja, qualquer coisa que torne a IA mais acessível e divertida.