CalCam: Gemini API で食品トラッキングを変革

3月 05, 2025
Vishal Dharmadhikari Product Solutions Engineer

画像を知見に変える: CalCam の Gemini API ワークフロー


Gemini API を使うと、デベロッパーやスタートアップ企業が Gemini モデルを短時間でアプリケーションに組み込むことができます。Polyverse のようなデベロッパーは、Gemini 2.0 Flash を活用し、ユーザーがまったく新しい方法で栄養を追跡できるようにしています。Polyverse の最新のアプリ CalCam は、AI 健康コンパニオンとして動作し、食事の写真を撮るだけで簡単にカロリー摂取量を追跡できます。このアクションは一見シンプルに思えますが、Gemini API、とりわけ Gemini 2.0 Flash の高度な機能を活用しています。

Polyverse にとって、Gemini API の主なメリットは次のようなことでした。

  • スピードと効率: CalCam のユーザー エクスペリエンスは、食事の写真分析のスピードにかかっています。Polyverse は、Gemini 1.5 Flash の先行ユーザーとして、以前のモデルよりも約 1 秒速く結果が表示されたことを報告しました。Gemini 2.0 Flash への移行後は、分析の深さと知見の実用性が向上し、応答スピードもさらに上がったため、一層高い精度と効率で食事を分析できるようになっています。ユーザー エクスペリエンスが向上したことで、一瞬でシームレスな追跡ができるようになり、最先端のアプリケーション開発に不可欠なモデルとしての Gemini Flash の地位は確固たるものになりました。

  • 認識精度の向上: CalCam の精度は、正確な食品認識と栄養分析に基づいています。Gemini 2.0 Flash はこの分野を得意としており、Polyverse によると、認識結果に対するユーザー満足度がなんと 20% も高くなっています。この精度の向上は、CalCam ユーザーのエクスペリエンスに対する信頼性向上につながります。このモデルは、料理だけでなく、ソースや調味料まで識別できるので、主要な栄養素を包括的に分析できます。

  • シームレスな連携に役立つ構造化出力: Gemini 2.0 Flash の構造化 JSON 出力機能は、Polyverse にとってのゲームチェンジャーでした。この機能のおかげで、モデルの出力を効率的に CalCam のワークフローに組み込み、料理の名前、成分、主要栄養素情報、栄養評価をすばやく処理できるようになったため、ユーザーに情報を表示するまでの時間を短縮できました。

  • Google AI Studio で開発が簡単に: Polyverse は、Google AI Studio のユーザー フレンドリーな機能、特にツールの構造化出力ビジュアル エディタが役立ったと述べています。プログラマー以外のチームメンバーが出力の構造化や編集に貢献できたため、コーディングの専門知識がなくても行える作業が増え、開発プロセスがスピードアップしました。


構造化がもたらした成功: 複雑なデータを処理する

CalCam のコア機能は、食品の画像を理解して分析する能力に由来しています。そこで活躍するのが、Gemini API のマルチモーダル機能です。このワークフローはエレガントで効率的です。

  1. 画像のアップロードと検証: ユーザーが食事の写真をアップロードすると、CalCam はまず、画像が実際に食品であることを確認します。

2. Gemini Flash による認識と分析: Gemini 2.0 Flash で画像処理を行います。慎重に作成された一連のプロンプトを通じて、食品の識別、成分の分解、料理の重量推定を行い、主要栄養素の分布(ソースや調味料などの微妙な要素を含む)を計算します。

3. 構造化出力と改善: Gemini 2.0 Flash は、分析結果を含む構造化出力を返します。この出力を、セカンダリ ワークフローで Gemini 2.0 Flash にフィードバックします。この反復プロセスにより、栄養知識と論理に照らして情報を詳しく評価し、結果の正確性と一貫性を高めます。必要な場合は、ユーザーが修正することもできます。モデルに再評価を要求すると、改善された新たな分析が生成されます。

4. 栄養に関する知見とユーザー エンゲージメント: CalCam は最後に、食事の栄養成分の内訳をユーザーにわかりやすく提示します。そこには、健康的な食事の選択に関する簡単な評価やガイダンスも含まれます。個人に合わせたカロリー ポスターや食事の評価など、楽しい機能が満載されているので、ユーザーの健康増進意欲を喚起できます。


Gemini API: 次世代 AI アプリケーション開発のためのツールキット

Polyverse の経験から、最先端の AI アプリケーション開発を目指すスタートアップ企業における Gemini API の価値がよくわかります。Gemini 2.0 Flash の組み込みの容易さ、速度と精度、そして Google AI Studio のサポートツールのおかげで、Polyverse は CalCam を大幅に強化し、開発プロセスを効率化できました。Polyverse はこれからも Gemini モデルを活用し、AI 主導のレシピやコーチングといったインタラクティブでパーソナライズされた機能を開発することを通して、楽しく健康的な生活をユーザーに届けるという CalCam の使命を実現したいと考えています。


Gemini API のドキュメントを確認して、AI の未来を作り始めましょう。