Gemini 2.0 심층 분석: 코드 실행

3월 06, 2025
Jason Stephen Product Manager
Luciano Martins Developer Advocate Google AI

Gemini 모델은 코드 실행을 통해 Python 샌드박스에 액세스할 수 있으며, 이를 통해 모델은 코드를 실행하고 그 결과로부터 학습할 수 있습니다. 코드 실행이 활성화된 Gemini 모델은 계산을 수행하고 복잡한 데이터 세트를 분석하고 즉석에서 시각화를 생성할 수 있으며 궁극적으로는 사용자 쿼리에 대해 더 나은 답변을 제공할 수 있습니다. 이제는 정식 출시되어 Gemini 2.0 모델을 통해 Google AI StudioGemini API에서 모두 사용할 수 있습니다.


도구로서의 코드 실행

Google AI Studio의 'Tools' 패널에서 전환을 통해 코드 실행을 활성화하거나 Gemini API에서 도구 변수로 코드 실행을 활성화할 수 있습니다(아래에 나와 있음).

from google import genai
from google.genai import types
 
client = genai.Client(api_key="GEMINI_API_KEY")
 
response = client.models.generate_content(
  model='gemini-2.0-flash',
  contents="""
     What is the sum of the first 50 prime numbers?
     Generate and run code for the calculation.
  """,
  config=types.GenerateContentConfig(
    tools=[types.Tool(
      code_execution=types.ToolCodeExecution
    )]
  )
)

코드 실행이 도구로 추가되면 모델은 코드 실행 샌드박스에 액세스하여 한 번에 최대 30초 동안 코드를 실행할 수 있고, 프롬프트 재작성 없이 최대 5회까지 코드를 실행할 수 있습니다. 코드 실행 환경에는 Numpy, Pandas, Matplotlib(그래프 렌더링용) 등의 라이브러리가 포함됩니다. 사용 가능한 라이브러리의 전체 목록은 API 문서에서 확인할 수 있으며 지원되는 라이브러리 세트를 곧 확장할 예정입니다.


파일 IO 및 그래프 출력

Gemini 2.0에서는 코드 실행 샌드박스에서 파일 입력을 허용하고 Matplotlib를 사용한 그래프 및 차트 출력을 지원하도록 코드 실행 도구를 업데이트했습니다. 이러한 업데이트는 더 광범위한 코드 실행 사용 사례로 이어집니다. 이제 이러한 업데이트를 통해 다음을 수행할 수 있습니다.

  • 사용자가 업로드한 복잡한 파일을 이해하기 위한 논리적 분석을 수행할 수 있습니다.

  • Matplotlib에서 지원하는 차트와 그래프로 데이터를 시각화할 수 있습니다.

  • 로컬 코드 파일을 디버그할 수 있습니다.

  • [실험용] Multimodal Live API로 코드 실행의 실시간 기능을 활용할 수 있습니다.

  • [실험용] Google 검색을 사용해 그라운딩 같은 도구와 코드 실행을 결합할 수 있습니다.

  • [실험용] Gemini 2.0 Thinking Mode에서 코드 실행을 활용할 수 있습니다.

  • 기타 등등...

코드 실행을 실제로 사용하는 두 가지 실례를 살펴보겠습니다.


Gemini 모델을 사용한 실시간 데이터 분석 및 시각화

이 데모는 Multimodal Live API와 코드 실행을 결합함으로써 음성 입력과 코드 실행을 모두 활용하는 Gemini 모델과의 실시간 대화를 보여줍니다. 톰 크루즈가 출연한 영화 목록을 제공하고 상영 시간별로 순위를 매긴 다음 Matplotlib를 사용하여 이 데이터를 시각화하는 막대형 차트를 만들어 달라고 Gemini 모델에 요청합니다. Gemini 모델은 이러한 작업을 수행하고 추가 요청(막대 색상 변경)에 따라 차트를 업데이트하는 Python 코드를 생성합니다.

(오디오를 들으려면 마우스 오른쪽 버튼을 클릭하고 새 창에서 동영상을 여세요)

Thinking 모델과 코드 실행을 결합하여 복잡한 문제 해결

이 데모는 Gemini 2.0 Flash Thinking Experimental 모델과 코드 실행을 사용하여 고전적인 최적화 문제를 해결합니다. 영업사원이 스페인의 5개 도시를 방문한 후 출발점으로 돌아갈 수 있는 최단 경로를 찾아달라고 Gemini에 요청합니다. Gemini는 이러한 작업을 수행하는 Python 코드를 생성하고 반복적으로 디버깅하고(초기 라이브러리 오류 수정) 거리를 계산한 후 최종적으로 Matplotlib 그래프에서 최적 경로를 시각화합니다.

(오디오를 들으려면 마우스 오른쪽 버튼을 클릭하고 새 창에서 동영상을 여세요)

Gemini 2.0 코드 실행 시작하기

직접 해보고 싶으세요? GitHub에서 코드 실행을 직접 실습해 보세요. 추가 예제와 데모를 보려면 사용 중인 코드 실행 시나리오와 그 밖의 유용한 정보가 담긴 Gemini API 문서를 참조하세요.


Gemini API 개발자 포럼에 참여하여 사용 사례와 코드 실행 개선 방법에 대한 의견을 공유해 주시면 감사하겠습니다. 단기적으로는 확장된 라이브러리 지원, PDF 등 다른 입력 형식 지원, 다중 도구 사용 지원 등을 모색하고 있습니다. 즐겁게 개발해 보세요!