Colab의 Data Science Agent: Gemini를 통한 데이터 분석의 미래

3월 03, 2025
Jane Fine Senior Product Manager
Mahi Kolla Associate Product Manager
Ilai Soloducho Senior Technical Program Manager

Google Colab은 브라우저에서 직접 Python 코드를 작성 및 실행할 수 있는 무료 클라우드 호스팅 Jupyter Notebook 환경입니다. Google Colab은 Google Cloud GPU 및 TPU에 대한 무료 액세스 권한을 제공하는데, 이는 AI 모델 실행을 위한 게임 체인저이자 프로젝트 협업을 더 쉽게 만들어 줍니다.

12월에는 Colab의 Data Science Agent가 Gemini를 사용하여 신뢰할 수 있는 테스터를 위한 노트북을 만드는 방법을 공유했습니다. 덕분에 라이브러리 가져오기, 데이터 로드, 상용구 코드 작성 같은 지루한 설정 작업을 할 필요가 없어졌습니다. 신뢰할 수 있는 테스터들은 Data Science Agent에 뜨거운 호응을 보내며 워크플로를 간소화하고 그 어느 때보다 빠르게 유용한 정보를 발견할 수 있다고 전했습니다.

오늘, 일부 국가와 언어에 한하여 18세 이상의 Colab 사용자에게 Data Science Agent를 제공하게 되어 기쁩니다. 이를 통해 연구실에서 간단한 자연어 설명을 통해 완전하고 효과적인 Colab 노트북을 생성하여 데이터 처리 및 분석에 드는 시간을 절약할 수 있도록 대학과의 파트너십을 확대합니다.


Data Science Agent의 작동 방식은 다음과 같습니다.

  1. 새로 시작: 빈 Colab 노트북을 엽니다.

2. 데이터 추가: 데이터 파일을 업로드합니다.

3. 목표 설명: Gemini 사이드 패널에 구축하려는 분석 또는 프로토타입의 종류를 설명합니다(예: '추세 시각화', '예측 모델 개발 및 최적화', '누락된 값 채우기', '최상의 통계 기법 선택').

4. Data Science Agent의 작동 상황 지켜보기: 작동하는 Colab 노트북에서 필요한 코드, 라이브러리 가져오기, 분석이 생성되는 모습을 편안히 앉아서 지켜보세요.

데이터 이해부터 효과적으로 작동하는 Colab 노트북에서 유용한 정보를 제공하는 일까지, Data Science Agent의 분석 자동화 (시퀀스 단축. 예시 목적의 결과. Data Science Agent는 실수를 할 수도 있습니다.)

Data Science Agent의 이점

  • 제대로 기능하는 Colab 노트북: 코드 스니펫뿐만 아니라 완전하고 실행 가능한 노트북.

  • 수정 가능한 솔루션: 생성된 코드를 특정한 필요에 맞게 쉽게 맞춤 정의하고 확장할 수 있습니다.

  • 공유 가능한 결과: 표준 Colab 공유 기능을 사용하여 팀원과 협업할 수 있습니다.

  • 시간 절약: 설정 및 상용구 코드로 씨름하는 대신 데이터에서 유용한 정보를 도출하는 데 집중할 수 있습니다.

Google의 Data Science Agent는 GPT 4.0, Deepseek, Claude 3.5 Haiku, Llama 3.3 70B에 기반한 ReAct 에이전트를 제치고 DABStep: Data Agent Benchmark for Multi-step Reasoning on HuggingFace에서 4위를 차지하기도 했습니다.


Data Science Agent 시작하기

간단하게 데이터를 업로드하고 Gemini 사이드 패널에서 데이터 분석 목표를 요약하여 직접 한번 체험해 보세요. Kaggle 또는 Data Commons에서 데이터 세트를 탐색할 수 있지만, 다음 몇 가지 샘플 데이터와 프롬프트를 사용해 보세요.

  • 붓꽃 종: "이 데이터에서 피어슨 상관계수, 스피어먼 상관계수, 켄들 상관계수를 계산하고 시각화해줘"라고 요청해 보세요.

  • 유리 분류: "이 데이터 세트에서 랜덤 포리스트 분류기를 학습해 줘"라고 요청해 보세요.


Data Science Agent로 데이터 분석 워크플로를 혁신할 수 있기를 바랍니다. 개발자 여러분의 의견을 꼭 듣고 싶습니다. Google Labs Discord 커뮤니티와 #data-science-agent 채널에 가입하여 활발하게 소통하세요.