Agente de ciencia de datos de Colab: el futuro del análisis de datos con Gemini

MAR 03, 2025
Jane Fine Senior Product Manager
Mahi Kolla Associate Product Manager
Ilai Soloducho Senior Technical Program Manager

Google Colab es un entorno sin costo de Jupyter Notebook alojado en la nube, en el que puedes escribir y ejecutar código Python directamente en tu navegador. Proporciona acceso sin cargo a GPUs y TPUs de Google Cloud, lo que lo cambia todo al momento de ejecutar modelos de IA y simplifica la colaboración en proyectos.

En diciembre, compartimos cómo el Agente de ciencia de datos de Colab crea notebooks para verificadores de confianza que usan Gemini, lo que elimina las tareas de configuración tediosas como importar bibliotecas, cargar datos y escribir código estándar. Los verificadores de confianza están entusiasmados con el agente de ciencia de datos: informaron que pueden agilizar los flujos de trabajo y obtener estadísticas más rápido que nunca.

Hoy, nos complace llevar el Agente de ciencia de datos a los usuarios de Colab mayores de 18 años y en países e idiomas seleccionados. Esto amplía nuestras asociaciones con universidades para ayudar a los laboratorios de investigación a ahorrar tiempo en el procesamiento y el análisis de datos al generar notebooks de Colab completas y funcionales a partir de descripciones simples en lenguaje natural.


El Agente de ciencia de datos funciona de la siguiente manera:

  1. Empieza desde cero: abre una notebook de Colab en blanco.

2. Agrega tus datos: sube el archivo de datos.

3. Describe tus objetivos: describe qué tipo de análisis o prototipo deseas compilar en el panel lateral de Gemini (por ejemplo, “Visualizar tendencias“, “Compilar y optimizar el modelo de predicción”, “Completar los valores faltantes”, “Seleccionar la mejor técnica estadística”).

4. Observa el trabajo del Agente de ciencia de datos: relájate y observa cómo se generan el código necesario, las bibliotecas de importación y el análisis en una notebook de Colab funcional.

Agente de ciencia de datos que automatiza el análisis, desde la comprensión de los datos hasta la entrega de información en una notebook Colab (Secuencias acortadas. Resultados con fines ilustrativos. El Agente de ciencia de datos puede cometer errores).

Beneficios del Agente de ciencia de datos

  • Notebooks de Colab completamente funcionales: no son solo fragmentos de código, sino notebook completas y ejecutables.

  • Soluciones modificables: personaliza y amplía el código generado con facilidad para adaptarlo a tus necesidades específicas.

  • Resultados que se pueden compartir: colabora con tus colegas utilizando las funciones estándar para compartir de Colab.

  • Ahorro de tiempo: concéntrate en obtener información de tus datos en lugar de lidiar con problemas relacionados con la configuración y el código estándar.

Además, el Agente de ciencia de datos obtuvo el 4.º lugar en el DABStep: Data Agent Benchmark for Multi-step Reasoning en HuggingFace, por delante de los agentes ReAct basados en GPT 4.0, Deepseek, Claude 3.5 Haiku y Llama 3.3 70B.


Da el primer paso con el Agente de ciencia de datos

Pruébalo simplemente subiendo algunos datos y describiendo tus objetivos de análisis en el panel lateral de Gemini. Puedes explorar conjuntos de datos en Kaggle o Data Commons, pero aquí tienes algunos ejemplos de datos e instrucciones para probar:

  • Iris Species: pide "Calcular y visualizar las correlaciones de Pearson, Spearman y Kendall en estos datos".


Esperamos que esto transforme tu flujo de trabajo de análisis de datos. Queremos conocer tu opinión, así que únete a nuestra comunidad de Google Labs en Discord y al canal #data-science-agent.