How it's Made: GenType アルファベット作成ツール

6月 10, 2024
Trudy Painter Creative Lab

Labs.google は、生成 AI ができることを広げる場所であり、ほかにはない見た目の美しさ、楽しいインタラクション、新たな AI ツールの使い方を模索することができます。

このシリーズの最新の実験の 1 つが GenType です。このツールでは、生成 AI を使って、何でも好きなものからアルファベットを作ります。


着想

チームメンバーの 1 人は幼い子供の親で、Imagen を使って子供にアルファベットを学ばせたいと思っていました。そして子供がよく知っているものから文字を生成し、楽しく視覚的に学習できるようにしました。次の動画は、その実験の結果です。

この独創的な生成 AI の使い方は大好評で、Imagen が楽しい(そして予想外の)素材から作った文字は、どれもうれしい結果となりました。

このユースケースはアルファベットに特化していますが、そこから疑問が生まれました。ユーザーが 1 回入力するだけで、アルファベット全体を生成するツールを作れないでしょうか?


制作方法: Imagen 2 API で開発する

Google の Imagen モデルとシンプルなプロンプト レシピを使って GenType を作成しました。アルファベットの各文字は、次のプロンプト レシピに従って生成されます。

The letter “{letter}” made out of {prompt}

Our prompt recipe for GenType

たとえば、下の「A」は次のプロンプトで生成されました。

The letter “A” made out of grape jelly, on toast, aerial shot

Example output for “A” made out of grape jelly on toast

GenType ツールは賢く、ユーザーが 1 回入力するだけで、26 文字の完全なアルファベットに変換してくれます。

以下で、その仕組みについて説明します。

  1. ユーザー入力: 使う素材やものをツールに伝えます。たとえば、“grape jelly, on toast, aerial shot.”(ブドウジャム、トーストの上、上から見たもの)と入力します。

2. プロンプト レシピ: ツールは、この入力から、A から Z までのアルファベットの各文字を作成します。それぞれの文字に対して、"The letter 'A' made out of grape jelly, on toast, aerial shot."(ブドウジャム、トーストの上、上から見たもので作った文字「A」)のような形式で個別にリクエストします。

3.自動化: GenType では、一度に 1 つのリクエストを行うのではなく、このプロセスを自動化しています。“grape jelly, on toast, aerial shot” という最初の入力から、1 文字に 1 つずつ、26 のリクエストが送信されます。その結果、選んだテーマに沿って、他にはない文字セットが完成します。

GenType に 1 回シンプルな入力を与えるだけで、創造性あふれるカスタム文字セットが完成します。アイデアがアルファベットに変わる様子を、とても簡単に見ることができます!

入力 “grape jelly, on toast, photoreal, aerial shot” によって 26 のリクエストが送信される様子を示した図

GenType ツールでは、文字を作成した後、次のことができます。

  1. フレーズを入力: 名前から特別な誕生日メッセージまで、作成したカスタム文字を使って好きな言葉を書くことができます。

2. 保存とコピー: お気に入りのフレーズやカスタム アルファベット全体、個々の文字を保存できます。コピーしてほかのアプリケーションで使うこともできます。

3. 文字を再生成: 気に入らない文字があった場合は、同じプロンプトを使い、別のスタイルや外観で文字を再生成することができます。

“grape jelly, on toast, aerial shot” で生成したアルファベットで書いた “want to get lunch”

すばらしいアルファベットを生成するためのレシピ

ほとんどの画像生成の例と同じく、成功の鍵となるのは特異度です。特に、同じようなスタイルで複数の画像を生成する場合、明確な特徴があれば、アルファベット全体が一貫した美しいものになります。

A breakdown of our prompt recipe for GenType
プロンプト “Ladybugs, on a green leaf, aerial photo” の前景、背景、スタイルを示した図

通常は、前景、背景、スタイルという 3 つの強力な組み合わせを用いると、一貫性のあるアルファベットを生成するプロンプトができます。

  1. 前景: 文字を何で作るか?

”Ladybugs”(てんとう虫)など、文字の形となるものを指定します。

2. 背景: 何を文字の背景にするか?

”on a green leaf”(緑色の葉の上)のように、背景を説明します。

3. スタイル: 各文字の全体的な外観はどのようなものか?

“aerial photo”(上から見た)のように、外観を定義します。

さきほどのアルファベット プロンプト ”Ladybugs, on a green leaf, aerial photo” はこれを合わせたものです。このようにすると、一貫性のあるアルファベットが生成されます。


実際の用途

GenType は、ユースケースに柔軟に対応できるように設計されており、ユーザーは処理に費やす時間を減らし、創作に費やす時間を増やすことができます。私たちのチームは、すでに幅広いユースケースで活用しています。たとえば、ジュエリーの作成、独特なタイトル シーケンスのデザイン、新しいタイプのデザインのブレインストーミング、オリジナルなタッチを加えたイベントの招待状やポスターなどです。

想像力次第で、どのようにでも活用できるツールです。


試してみる

GenType は、labs.google/gentype で試すことができます。


GenType について最後に一言

新しいテクノロジーである AI は、複雑で敷居が高いように感じられるかもしれません。しかしそれは、はるかに身近で、遊び心や楽しさを感じられるようにする可能性を秘めています。AI は世界に技術的進展をもたらしていますが、それと同じくらい、創造性をもたらすものでもあります。GenType のようなツールは、そのような世界を作る取り組みの一端です。GenType のようなツールが、こういったツールならではのアイデアに触れる手助けとなることを願っています。


試したものをお送りください

Google は、GenType のような実験を募集しています。何か楽しいものができたら、ぜひお知らせください。labs.google で紹介いたします。動画、ゲーム、ツール、試験的なインターフェースなど、AI を親しみやすく、楽しくするものであれば、なんでも大歓迎です。