Desde el lanzamiento de la familia Gemini 2.0 Flash, los desarrolladores están descubriendo nuevos casos de uso para estos modelos altamente eficientes. Gemini 2.0 Flash ofrece un rendimiento más sólido que 1.5 Flash y 1.5 Pro, además de precios simplificados que hacen que nuestra ventana de contexto de 1,000,000 de tokens sea más accesible.
Actualmente, Gemini 2.0 Flash-Lite está disponible a nivel general en la API de Gemini para uso en producción en Google AI Studio y para clientes empresariales en Vertex AI. 2.0 Flash-Lite ofrece un rendimiento mejorado con respecto a 1.5 Flash en comparativas de razonamiento, multimodales, matemáticas y factuales. Para proyectos que requieren ventanas de contexto extensas, 2.0 Flash-Lite es una solución aún más rentable, con precios simplificados para solicitudes de más de 128,000 tokens.
Los desarrolladores ya están aprovechando la velocidad, la eficiencia y la rentabilidad de la familia Flash 2.0 para crear aplicaciones increíbles. Estos son algunos ejemplos:
Desarrollar una IA conversacional efectiva, particularmente asistentes de voz, requiere velocidad y precisión. Un Time-to-First-Token (TTFT) rápido, además de la capacidad de manejar instrucciones complejas e interactuar con otros sistemas a través de llamadas a funciones, es esencial para crear una sensación natural y receptiva.
Daily está aprovechando Gemini 2.0 Flash-Lite para ayudar a los desarrolladores a crear experiencias de IA de voz de vanguardia. Utilizando su framework de código abierto y agnóstico de proveedores Pipecat para agentes de voz y conversacionales multimodales, Daily creó una demostración de código de instrucción del sistema para detectar de manera confiable los sistemas de correo de voz y adaptar los mensajes de manera acorde.
Dawn está revolucionando la forma en que los equipos de ingeniería monitorean sus productos de IA en producción brindando información profunda y significativa impulsada por Gemini 2.0 Flash. El canal de "monitoreo semántico" de Dawn permite a los equipos de ingeniería revisar de manera instantánea flujos masivos de interacciones de los usuarios para encontrar cualquier comportamiento que estén buscando, como niveles de frustración del usuario, duración de las conversaciones y comentarios de los usuarios, y realizar un seguimiento continuo de ellos como problemas o temas recurrentes para identificar anomalías y errores ocultos en la producción.
Con los precios simplificados, los resultados estructurados confiables y las capacidades de contexto extendido de Gemini 2.0 Flash, Dawn pudo acortar significativamente los tiempos de búsqueda (de horas a poco menos de un minuto) cuando cambió de modelo, reducir los costos en más del 90% y ver una mayor confiabilidad en las evaluaciones y el monitoreo de la producción.
Mosaic está transformando tareas de edición de video complejas y lentas con un nuevo paradigma agéntico que utiliza Gemini 2.0 Flash. Su solución incorpora agentes de edición multimodales que utilizan las capacidades de contexto extenso de Gemini 2.0 Flash para acelerar las tareas secundarias de edición de video de horas a segundos, para que puedas hacer cosas como recortar YouTube Shorts desde cualquier parte de un video de formato largo con una única instrucción.
El nuevo precio simplificado para Gemini 2.0 Flash de USD 0.10 por 1,000,000 de tokens de entrada en Google AI Studio hace que las ventanas de contexto enormes sean un 33% más accesibles, lo que habilita nuevas posibilidades para los flujos de trabajo de edición de video impulsados por IA.
Nos entusiasma ver lo que la familia de modelos Gemini 2.0 Flash está posibilitando para desarrolladores como Daily.co, Mosaic y Dawn. Ya sea que estés trabajando en asistentes de voz, herramientas de edición de video o algo completamente nuevo, esperamos que la familia Gemini 2.0 Flash te resulte buena en cuanto a rendimiento y costo. Comienza a crear hoy mismo en Google AI Studio.