La ejecución de código les da a los modelos de Gemini acceso a una zona de pruebas de Python, lo que les permite ejecutar código y aprender de los resultados. Con la ejecución de código habilitada, los modelos de Gemini pueden realizar cálculos, analizar conjuntos de datos complejos y crear visualizaciones sobre la marcha, lo que sirve para dar mejores respuestas a las consultas de los usuarios. Ahora está disponible tanto en Google AI Studio como en la API de Gemini a través de los modelos Gemini 2.0.
Puedes habilitar la ejecución de código con el botón del panel "Herramientas" de Google AI Studio, o bien desde la API de Gemini como una variable de herramientas (que se muestra a continuación).
desde google importar genai
desde google.genai importar tipos
client = genai.Client(api_key="GEMINI_API_KEY")
response = client.models.generate_content(
model='gemini-2.0-flash',
contents="""
¿Cuál es la suma de los primeros 50 números primos?
Genera y ejecuta el código para el cálculo.
""",
config=types.GenerateContentConfig(
tools=[types.Tool(
code_execution=types.ToolCodeExecution
)]
)
)
Cuando la ejecución de código se agrega como una herramienta, el modelo puede acceder a la caja de arena de ejecución de código para ejecutar código hasta 30 segundos a la vez, y hasta 5 veces sin volver a solicitarlo. El entorno de ejecución de código incluye bibliotecas como Numpy, Pandas y Matplotlib (para la representación de gráficos). La lista completa de bibliotecas disponibles se puede consultar en nuestros documentos de API, y esperamos expandirla pronto.
Con Gemini 2.0, actualizamos nuestra herramienta de ejecución de código para permitir la entrada de archivos en la zona de pruebas de ejecución de código, así como resultados en gráficos y tablas utilizando Matplotlib. Estas actualizaciones facilitan un conjunto más amplio de casos de uso para la ejecución de código. Con estas actualizaciones, puedes hacer lo siguiente:
Veamos dos ejemplos prácticos de ejecución de código en acción:
Al combinar la API Multimodal Live y la ejecución de código, esta demostración presenta una conversación en tiempo real con el modelo Gemini, utilizando tanto la entrada de voz como la ejecución de código. Pedimos a los modelos de Gemini que hagan una lista de las películas de Tom Cruise, las clasifiquen por duración, y luego creen un gráfico de barras que visualice estos datos utilizando Matplotlib. Los modelos de Gemini generan el código de Python para realizar estas tareas y actualizan el gráfico en función de nuestras siguientes solicitudes (cambiar los colores de las barras).
Esta demostración utiliza el modelo experimental Flash Thinking de Gemini 2.0 y la ejecución de código para resolver un desafío de optimización clásico. Pedimos a Gemini que encuentre la ruta más corta para que un vendedor visite cinco ciudades españolas y regrese a su punto de partida. Gemini genera código de Python, lo depura de forma iterativa (corrigiendo un error inicial de la biblioteca), calcula las distancias, y visualiza la ruta óptima en un gráfico de Matplotlib.
¿Quieres probar todo esto? Echa un vistazo a GitHub para ponerte manos a la obra con la ejecución de código. Para obtener más ejemplos y demostraciones, consulta los documentos de la API de Gemini, que muestran escenarios de ejecución de código y mucho más.
Te invitamos a unirte al foro de desarrolladores de API de Gemini para compartir tus casos de uso y comentarios sobre cómo podemos mejorar la ejecución de código. A corto plazo, queremos ampliar la compatibilidad de la biblioteca; ofrecer otras modalidades de entrada, como archivos PDF, y habilitar el uso de varias herramientas. ¡Que te diviertas desarrollando!