24 resultados
17 DE JULIO DE 2025 / Gemini
Veo 3, Google’s latest AI video generation model, is now available in paid preview via the Gemini API and Google AI Studio. Unveiled at Google I/O 2025, Veo 3 can generate both video and synchronized audio, including dialogue, background sounds, and even animal noises. This model delivers realistic visuals, natural lighting, and physics, with accurate lip syncing and sound that matches on-screen action.
16 DE JULIO DE 2025 / Cloud
The Marin project aims to expand the definition of 'open' in AI to include the entire scientific process, not just the model itself, by making the complete development journey accessible and reproducible. This effort, powered by the JAX framework and its Levanter tool, allows for deep scrutiny, trust in, and building upon foundation models, fostering a more transparent future for AI research.
24 DE JUNIO DE 2025 / Gemini
La nueva Google Colab con prioridad en la IA aumenta la productividad con mejoras impulsadas por funciones como las consultas iterativas para codificación conversacional, un Agente de ciencia de datos de última generación para flujos de trabajo autónomos y transformación de la codificación simplificada. Los usuarios pioneros informan un significativo aumento en la productividad a través de la aceleración en los proyectos de AA, depuración más rápida del código y creación sin esfuerzo de visualizaciones de alta calidad.
24 DE JUNIO DE 2025 / Kaggle
KerasHub permite a los usuarios mezclar y combinar arquitecturas y pesos de modelos en diferentes marcos de trabajo de aprendizaje automático, de modo que los puntos de control de fuentes como Hugging Face Hub (incluidos los creados con PyTorch) se puedan cargar en los modelos de Keras para usar con JAX, PyTorch o TensorFlow. Gracias a esta flexibilidad, puedes aprovechar una amplia gama de modelos ajustados por los miembros de la comunidad, al tiempo que mantienes un control total sobre el marco de trabajo de backend elegido.
24 DE JUNIO DE 2025 / Gemini
Imagen 4, el modelo avanzado de texto a imagen de Google, ahora está disponible en versión preliminar pagada a través de la API de Gemini y Google AI Studio, y ofrece mejoras de calidad significativas, especialmente para la generación de texto dentro de las imágenes. La familia de Imagen 4 incluye Imagen 4 para tareas generales e Imagen 4 Ultra para una adherencia de alta precisión a las indicaciones, con todas las imágenes generadas con una marca de agua SynthID no visible.
23 DE JUNIO DE 2025 / Kaggle
Los desarrolladores adaptan los LLM como Gemma a diversos idiomas y contextos culturales, lo que demuestra el potencial de la IA para cerrar las brechas de comunicación globales al abordar desafíos como la traducción de textos antiguos, la localización de la comprensión matemática y la mejora de la sensibilidad cultural en la traducción lírica.
17 DE JUNIO DE 2025 / Gemini
Google presenta actualizaciones en su familia de modelos Gemini 2.5, incluidos los modelos Gemini 2.5 Pro y Flash, que son estables y cuentan con disponibilidad general, y los nuevos “modelos de pensamiento” Gemini 2.5 Flash-Lite en versión preliminar, que ofrecen rendimiento y exactitud mejorados. Además, Flash-Lite ofrece una opción de menor costo.
20 DE MAYO DE 2025 / AI Edge
Se implementaron mejoras en LiteRT para aumentar el rendimiento y la eficiencia del modelo de IA en dispositivos móviles mediante la utilización efectiva de GPU y NPU, que ahora requieren mucho menos código, lo que permite una selección simplificada del acelerador de hardware y ofrece más capacidades para lograr un rendimiento óptimo en el dispositivo.
20 DE MAYO DE 2025 / Android
Los principales anuncios de Google I/O 2025 se centran en la compilación a través de las plataformas de Google y en la innovación con modelos de IA de Google DeepMind, con un enfoque clave en nuevas herramientas, APIs y funciones diseñadas para mejorar la productividad de los desarrolladores y crear experiencias impulsadas por IA utilizando Gemini, Android, Firebase y la web.
13 DE MAYO DE 2025 / TensorFlow
Keras Recommenders (KerasRS) es una nueva biblioteca que se creó con el objetivo de ayudar a los desarrolladores a crear sistemas de recomendación utilizando APIs con elementos fundamentales para clasificación y recuperación, y se puede instalar mediante pip con compatibilidad con backends de JAX, TensorFlow o PyTorch.