发帖人 Paul Suganthan

1 结果

清除过滤器
  • 2025年7月9日 / Gemma

    T5Gemma:全新 Encoder-Decoder 架构的 Gemma 模型系列

    作为 Encoder-Decoder LLM 的新系列,T5Gemma 通过转换和调整基于 Gemma 2 框架的预训练 Decoder-only 模型开发而成,与其对应的 Decoder-only 模型相比,具有更出色的性能和效率,尤其适用于需要深度输入理解的任务,例如摘要和翻译。

    T5Gemma: A New Collection of Encoder-Decoder Gemma Models