34 resultados
15 DE AGOSTO DE 2025 / Google AI Studio
Google anuncia la disponibilidad general de Imagen 4, su modelo avanzado de texto a imagen, en la API de Gemini y Google AI Studio, con mejoras significativas en la representación de texto. El nuevo modelo Imagen 4 Fast, diseñado para la velocidad y la generación rápida de imágenes, ahora está disponible junto con Imagen 4 e Imagen 4 Ultra, que también admiten la generación de imágenes con una resolución de hasta 2K.
12 DE AGOSTO DE 2025 / Kaggle
Crea y entrena un modelo GPT2 desde cero usando JAX en las TPU de Google, con un notebook completo de Python para Colab o Kaggle de nivel gratuito. Aprende a definir una malla de hardware, parámetros del modelo de partición y datos de entrada para el paralelismo de datos, y a optimizar el proceso de entrenamiento de modelos.
17 DE JULIO DE 2025 / Gemini
Veo 3, el modelo de generación de video de IA de Google más reciente, ahora está disponible en versión preliminar pagada a través de la API de Gemini y Google AI Studio. Presentado en Google I/O 2025, Veo 3 puede generar tanto video como audio sincronizado, y puede incluir diálogos, sonidos de fondo e incluso ruidos de animales. Este modelo ofrece efectos visuales realistas, iluminación natural y física, con una sincronización de labios y un sonido precisos que coinciden con la acción en pantalla.
16 DE JULIO DE 2025 / Cloud
El proyecto Marin tiene como objetivo ampliar la definición de "abierto" en IA para incluir todo el proceso científico, no solo el modelo en sí, haciendo que el proceso de desarrollo completo sea accesible y reproducible. Esta iniciativa, impulsada por el framework JAX y su herramienta Levanter, permite realizar un profundo escrutinio, confiar y compilar sobre modelos básicos, fomentando un futuro más transparente para la investigación en IA.
24 DE JUNIO DE 2025 / Gemini
La nueva Google Colab con prioridad en la IA aumenta la productividad con mejoras impulsadas por funciones como las consultas iterativas para codificación conversacional, un Agente de ciencia de datos de última generación para flujos de trabajo autónomos y transformación de la codificación simplificada. Los usuarios pioneros informan un significativo aumento en la productividad a través de la aceleración en los proyectos de AA, depuración más rápida del código y creación sin esfuerzo de visualizaciones de alta calidad.
24 DE JUNIO DE 2025 / Gemini
Imagen 4, el modelo avanzado de texto a imagen de Google, ahora está disponible en versión preliminar pagada a través de la API de Gemini y Google AI Studio, y ofrece mejoras de calidad significativas, especialmente para la generación de texto dentro de las imágenes. La familia de Imagen 4 incluye Imagen 4 para tareas generales e Imagen 4 Ultra para una adherencia de alta precisión a las indicaciones, con todas las imágenes generadas con una marca de agua SynthID no visible.
24 DE JUNIO DE 2025 / Kaggle
KerasHub permite a los usuarios mezclar y combinar arquitecturas y pesos de modelos en diferentes marcos de trabajo de aprendizaje automático, de modo que los puntos de control de fuentes como Hugging Face Hub (incluidos los creados con PyTorch) se puedan cargar en los modelos de Keras para usar con JAX, PyTorch o TensorFlow. Gracias a esta flexibilidad, puedes aprovechar una amplia gama de modelos ajustados por los miembros de la comunidad, al tiempo que mantienes un control total sobre el marco de trabajo de backend elegido.
23 DE JUNIO DE 2025 / Kaggle
Los desarrolladores adaptan los LLM como Gemma a diversos idiomas y contextos culturales, lo que demuestra el potencial de la IA para cerrar las brechas de comunicación globales al abordar desafíos como la traducción de textos antiguos, la localización de la comprensión matemática y la mejora de la sensibilidad cultural en la traducción lírica.
17 DE JUNIO DE 2025 / Gemini
Google presenta actualizaciones en su familia de modelos Gemini 2.5, incluidos los modelos Gemini 2.5 Pro y Flash, que son estables y cuentan con disponibilidad general, y los nuevos “modelos de pensamiento” Gemini 2.5 Flash-Lite en versión preliminar, que ofrecen rendimiento y exactitud mejorados. Además, Flash-Lite ofrece una opción de menor costo.
20 DE MAYO DE 2025 / Android
Los principales anuncios de Google I/O 2025 se centran en la compilación a través de las plataformas de Google y en la innovación con modelos de IA de Google DeepMind, con un enfoque clave en nuevas herramientas, APIs y funciones diseñadas para mejorar la productividad de los desarrolladores y crear experiencias impulsadas por IA utilizando Gemini, Android, Firebase y la web.