搜索

4 结果

清除过滤器
  • 2025年7月16日 / Cloud

    斯坦福大学推出 Marin 基础模型:首个使用 JAX 开发的完全开放模型

    Marin 项目旨在通过使整个开发过程公开且可复现,将 AI 中“开放”的定义扩展至涵盖整个科研过程,而不仅仅局限于模型本身。这项工作由 JAX 框架及其 Levanter 工具提供支持,使得基础模型得以被深入检验、信任,并进一步构建,从而推动 AI 研究迈向更加透明的未来。

    Stanford Marin project in JAX
  • 2025年7月9日 / Gemma

    T5Gemma:全新 Encoder-Decoder 架构的 Gemma 模型系列

    作为 Encoder-Decoder LLM 的新系列,T5Gemma 通过转换和调整基于 Gemma 2 框架的预训练 Decoder-only 模型开发而成,与其对应的 Decoder-only 模型相比,具有更出色的性能和效率,尤其适用于需要深度输入理解的任务,例如摘要和翻译。

    T5Gemma: A New Collection of Encoder-Decoder Gemma Models
  • 2025年6月24日 / Kaggle

    结合使用 KerasHub 与 Hugging Face,轻松实现端到端机器学习工作流

    KerasHub 使用户能够混合搭配不同机器学习框架的模型架构和权重,支持将来自 Hugging Face Hub 等来源的检查点(包括使用 PyTorch 创建的检查点)加载到 Keras 模型中,并与 JAX、PyTorch 或 TensorFlow 配合使用。这种灵活性意味着,您可以充分利用大量经过社区微调的模型,同时完全掌控您所选择的后端框架。

    How to load model weights from SafeTensors into KerasHub for multi-framework machine learning
  • 2025年2月19日 / Gemma

    隆重推出 PaliGemma 2 mix:用于多种任务的视觉语言模型

    PaliGemma 2 mix 是一款升级的视觉语言模型,现已正式发布。它具备图像字幕生成、OCR 及目标检测等功能,并提供多种规格以满足不同需求。

    Paligemma 2 Mix