Google Colab 是一个免费的云托管 Jupyter Notebook 环境。在该环境下,您可以直接在浏览器中编写和运行 Python 代码。Google Colab 还支持免费访问 Google Cloud GPU 和 TPU,这对运行中的 AI 模型具有划时代意义,并简化了项目协作。
去年 12 月,我们分享了 Colab 中的数据科学代理如何使用 Gemini 为受信任的测试人员创建 notebook,从而省去了导入库、加载数据和编写样板代码等繁琐的设置任务。受信任的测试人员对数据科学代理充满了热情,并反映他们能够简化工作流,还能比以往更快地发掘见解。
今天,我们很高兴能向 18 岁以上、位于特定国家且使用特定语言的 Colab 用户推出数据科学代理。我们可借此扩大与大学的合作伙伴关系,进而通过从简单的自然语言描述中生成完整且可运行的 Colab notebook,帮助研究实验室节省数据处理和分析的时间。
2. 添加数据:上传您的数据文件。
3. 描述您的目标:在 Gemini 侧面板中描述您希望构建的分析或原型(例如,“可视化趋势”、“构建和优化预测模型”、“填充缺失值”、“选择最佳统计技术”等)。
4. 静待数据科学代理完成工作:运行的 Colab notebook 中将创建必要的代码、导入库并生成分析,您只需坐享其成。
在 HuggingFace 发布的测评“DABStep:多步推理的数据代理基准”中,我们的数据科学代理排名第四,领先于基于 GPT 4.0、Deepseek、Claude 3.5 Haiku 和 Llama 3.3 70B 的 ReAct 代理。
您只需上传数据,并在 Gemini 侧面板概述数据分析目标,即可体验数据科学代理。您可以在 Kaggle 或 Data Commons 上探索数据集,但您可以用以下示例数据和提示尝试一下:
我们希望这能改变您的数据分析工作流。我们迫切希望得到您的宝贵反馈,请加入我们的 Google Labs Discord 社区和 #data-science-agent
频道与我们交流。