- Google Developers Blog

21 DE JULIO DE 2025 / Gemini

Segmentación de imágenes conversacionales con Gemini 2.5

La función avanzada de Gemini para la segmentación de imágenes conversacionales permite una interacción intuitiva con datos visuales a través de la comprensión de frases complejas, lógica condicional y conceptos abstractos, agilizando la experiencia del desarrollador y abriendo puertas para nuevas aplicaciones en edición de medios, monitoreo de seguridad y evaluación de daños.

Conversational image segmentation with Gemini 2.5

17 DE JULIO DE 2025 / Gemini

Compila con Veo 3, ahora disponible en la disponible en la API de Gemini

Veo 3, el modelo de generación de video de IA de Google más reciente, ahora está disponible en versión preliminar pagada a través de la API de Gemini y Google AI Studio. Presentado en Google I/O 2025, Veo 3 puede generar tanto video como audio sincronizado, y puede incluir diálogos, sonidos de fondo e incluso ruidos de animales. Este modelo ofrece efectos visuales realistas, iluminación natural y física, con una sincronización de labios y un sonido precisos que coinciden con la acción en pantalla.

Build with Veo 3, now available in the Gemini API and Google AI Studio

16 DE JULIO DE 2025 / AI

Descubre el razonamiento de Gemini: una guía paso a paso de logprobs en Vertex AI

La función "logprobs" se introdujo oficialmente en la API de Gemini en Vertex AI. Proporciona información sobre la toma de decisiones del modelo al mostrar puntajes de probabilidad para tokens elegidos y alternativos. Esta guía paso a paso te mostrará cómo habilitar e interpretar esta función, y aplicarla a casos de uso poderosos, como la clasificación segura, el autocompletado dinámico y la evaluación cuantitativa de RAG.

16 DE JULIO DE 2025 / Cloud

Modelo fundacional de Marin de Stanford: el primer modelo totalmente abierto desarrollado con JAX

El proyecto Marin tiene como objetivo ampliar la definición de "abierto" en IA para incluir todo el proceso científico, no solo el modelo en sí, haciendo que el proceso de desarrollo completo sea accesible y reproducible. Esta iniciativa, impulsada por el framework JAX y su herramienta Levanter, permite realizar un profundo escrutinio, confiar y compilar sobre modelos básicos, fomentando un futuro más transparente para la investigación en IA.

16 DE JULIO DE 2025 / Gemini

Simplifica el flujo de “creación con vibra” de tu agente con el ADK y la CLI de Gemini

El Agent Development Kit (ADK) actualizado simplifica y acelera el proceso de creación de agentes de IA proporcionando a la CLI una comprensión profunda y rentable del marco de trabajo del ADK, lo que permite a los desarrolladores crear, generar, probar y mejorar rápidamente los agentes funcionales a través de indicaciones conversacionales, con lo que se elimina la fricción y se mantiene a los agentes en un estado de “flujo” productivo.

ADK + Gemini CLI: Supercharge Your Agent Building Vibe

14 DE JULIO DE 2025 / Cloud

Verdad empresarial en acción: el concentrador de APIs de Apigee impulsa los potentes portales para desarrolladores

El concentrador de APIs de Apigee y los portales para desarrolladores son partes distintas, pero interconectadas, de la plataforma Apigee que ayudan a las organizaciones a descubrir y administrar APIs para diferentes perfiles ficticios, revelando el potencial de la API y acelerando la innovación.

Enterprise Truth in Action: API hub Fueling Powerful Developer Portals

14 DE JULIO DE 2025 / Gemini

Gemini Embedding ahora disponible de forma general en la API de Gemini

El modelo de texto Gemini Embedding ahora está disponible de forma general en la API de Gemini y Vertex AI. Este versátil modelo se ha clasificado constantemente como el número 1 en el ranking multilingüe de MTEB desde su lanzamiento experimental en marzo, admite más de 100 idiomas, tiene una longitud máxima de token de entrada de 2,048 y tiene un precio de USD 0.15 por 1 millón de tokens de entrada.

Gemini Embedding now generally available in the Gemini API

10 DE JULIO DE 2025 / Gemini

Anunciamos GenAI Processors: compila aplicaciones basadas en Gemini potentes y flexibles

GenAI Processors es una nueva biblioteca Python de código abierto de Google DeepMind diseñada para simplificar el desarrollo de aplicaciones de IA, especialmente aquellas que manejan entradas multimodales y requieren capacidad de respuesta en tiempo real, al proporcionar una interfaz de “procesador” coherente para todos los pasos, desde el manejo de entradas hasta el procesamiento de llamadas y salidas de modelos, para un encadenamiento sin interrupciones y una ejecución simultánea.

Announcing GenAI Processors: Streamline your Gemini application development

10 DE JULIO DE 2025 / Cloud

Avances en el desarrollo de IA agéntica con Firebase Studio

Las actualizaciones en Firebase Studio incluyen nuevos modos de agente, soporte fundamental para el protocolo de contexto de modelo (MCP) e integración de Gemini CLI, todos diseñados para redefinir el desarrollo asistido por IA, lo que permite a los desarrolladores crear aplicaciones de pila completa a partir de una sola indicación e integrar potentes capacidades de IA directamente en su flujo de trabajo.

Advancing agentic AI development with Firebase Studio

9 DE JULIO DE 2025 / Gemma

T5Gemma: una nueva colección de modelos Gemma codificadores-decodificadores

T5Gemma es una nueva familia de LLM de codificador-decodificador desarrollados mediante la conversión y adaptación de modelos preentrenados de solo decodificador basados en el marco Gemma 2, que ofrecen un rendimiento y una eficiencia superiores en comparación con sus contrapartes de solo decodificador, en particular para tareas que requieren una profunda comprensión de entrada, como resúmenes y traducción.

Buscar

Tipo de contenido

Producto

Tecnología