Gemini en profundidad: explora las apps de inicio en AI Studio

DIC 18, 2024
Kat Kampf Product Manager Google AI Studio

¿Quieres comenzar a compilar con Gemini 2.0? Lanzamos un conjunto de apps de inicio diseñadas para mostrar las capacidades principales de Gemini y proporcionarte una base sólida para tu próximo proyecto impulsado por IA. No son solo demostraciones de juguetes, son plataformas de código abierto en GitHub y ahora se integran a la perfección con Google AI Studio.

Los desarrolladores ya están aprovechando estas apps de inicio dentro de Google AI Studio para crear demostraciones y prototipos impresionantes. Echa un vistazo a cómo Bilawal Sidhu usó la app Analizador de video para crear una demostración de resumen de video, todo dentro de Google AI Studio. El afamado desarrollador y escritor Simon Willison también destacó estas aplicaciones en su reciente entrada de blog, donde enfatizó aun más su utilidad para la creación rápida de prototipos y la experimentación.

Veamos en detalle lo que ofrecen estas apps de inicio y cómo pueden acelerar tu flujo de trabajo de desarrollo, especialmente dentro del entorno optimizado de Google AI Studio:


1. Comprensión espacial: desbloquea la comprensión avanzada de escenas con esta app

La app de comprensión espacial, ahora disponible en Google AI Studio, te permite crear apps con una IA visual sofisticada. Esta aplicación muestra la capacidad de Gemini para analizar imágenes y va más allá del reconocimiento básico de objetos para proporcionar una comprensión matizada de las relaciones espaciales, incluidas las capacidades avanzadas de los cuadros de límite en 2D y 3D.

  • Explora el razonamiento espacial avanzado: experimenta con la capacidad de Gemini para comprender las relaciones espaciales entre los objetos dentro de una imagen, todo a través de la interfaz fácil de usar de Google AI Studio.

  • Experimenta con cuadros de límite en 2D y 3D: ve más allá de la simple detección de objetos. Esta app te permite explorar las capacidades avanzadas de los cuadros de límite de Gemini, incluidos los cuadros de límite experimentales en 3D, para identificar las ubicaciones de los objetos con mayor precisión.

  • Comienza a usar casos de uso complejo: ideal para aplicaciones como robótica, realidad aumentada, búsqueda basada en imágenes o análisis automatizado de datos visuales complejos. Obtén los componentes básicos del razonamiento espacial avanzado desde el primer momento.

  • Conoce el código en profundidad en GitHub: ¿quieres personalizar la app o integrarla en tus propios proyectos? El código fuente completo está disponible en GitHub, lo que te permite adaptarlo a tus necesidades específicas.

Link to Youtube Video (visible only when JS is disabled)

2. Analizador de video: crea experiencias de video interactivas con este marco de trabajo

La app Analizador de video, lista para usar en Google AI Studio, proporciona un marco de trabajo para crear apps que interactúan con el contenido de video de manera sofisticada. Este reproductor de video interactivo utiliza Gemini para extraer una gran cantidad de datos de las transmisiones de video.

  • Creación rápida de prototipos para la interacción de video: usa Google AI Studio para crear rápidamente prototipos de interacciones de video, como resúmenes, descripciones de escenas y extracción de texto.

  • Explora la detección y el seguimiento de objetos: experimenta con la capacidad de Gemini para identificar objetos y hacer un seguimiento de ellos dentro de los videos.

  • Adáptala según tus necesidades: amplía fácilmente las funcionalidades básicas para crear herramientas de búsqueda de videos personalizadas, sistemas automatizados de etiquetado de contenido, plataformas educativas interactivas o cualquier otra cosa que te imagines.

  • Acceso al código completo en GitHub: para una personalización e integración avanzadas, la base de código completa está disponible en GitHub.

Link to Youtube Video (visible only when JS is disabled)

3. Explorador de mapas: fusiona la inteligencia de Gemini con la API de Google Maps para la innovación basada en la ubicación

La app Explorador de mapas, ahora incluida en Google AI Studio, es tu puerta de entrada para crear apps inteligentes con reconocimiento de la ubicación. Integra a la perfección las habilidades de razonamiento de Gemini con el poder de la API de Google Maps.

  • Descubrimiento de ubicación conversacional: descubre cómo la IA conversacional de Gemini puede ayudar a los usuarios a descubrir ubicaciones en función de las consultas en lenguaje natural, todo dentro de la interfaz optimizada de Google AI Studio.

  • Experimenta con interacciones basadas en la ubicación: crea prototipos de interacciones basadas en la ubicación y explora las posibilidades de combinar Gemini con la API de Google Maps.

  • Bases para los servicios basados en la ubicación: crea la próxima generación de herramientas de planificación de viajes, juegos basados en la ubicación o sistemas de recomendación inteligentes. Esta app proporciona las bases esenciales.

  • Personaliza y amplía en GitHub: el código fuente completo también está disponible en GitHub, lo que te brinda la flexibilidad de aprovechar la funcionalidad principal e integrarla en tus propios proyectos.


Pon manos a la obra con las apps de inicio

Estas apps están listas para tus contribuciones

Hicimos el trabajo pesado para que puedas comenzar a crear experiencias de IA de vanguardia. Estas apps de inicio son más que solo ejemplos, ya que se diseñaron diseñadas para que sean el punto de partida de tus propios proyectos innovadores.

Puedes hacer lo siguiente:

  • Clonar los repositorios: obtén acceso instantáneo al código fuente y comienza a explorar.

  • Personalizar y ampliar: adapta las apps según tus necesidades específicas y aprovecha la funcionalidad existente.

  • Integrarlas en tus proyectos: integra sin problemas estas capacidades en tus apps existentes.

  • Contribuir a la comunidad: comparte tus avances y ayúdanos a mejorar estas herramientas para todos.

  • Probarlas en Google AI Studio: usa las apps directamente en Google AI Studio para la creación rápida de prototipos y la experimentación.


Tenemos muchas ganas de ver lo que creas. Comparte tus proyectos y deja tu opinión en los comentarios o en nuestro foro de desarrolladores.