成本降低一倍,大模型训练性能提高两倍!谷歌发布第五代TPU

2023-08-30 11:45:44 来源:EETOP
AI 军备竞赛持续进行下,Google 在年度大会为云端、AI 展现运算火力,更有合作伙伴英伟达(NVIDIA)力挺。

在29 日所举行的Cloud Next 2023 大会上,Google Cloud 公开加速AI 运算的新款自研芯片Cloud TPU v5e,配备NVIDIA H100 GPU 的A3 VM 下个月上线,更宣布与AI 芯片龙头NVIDIA 扩大合作伙伴关系。

1.jpg

NVIDIA CEO 黄仁勋出席Cloud Next 2023 大会力挺合作伙伴。

Cloud TPU v5e 专为精进大中型模型的训练、推理性能以及成本效益所设计。与上一代相比,Cloud TPU v5e 为大型语言模型提供的训练性能提高了2 倍、推理性能提高了2.5 倍。Cloud TPU v5e 成本不到上一代的一半,使企业能够训练和部署更大、更复杂的AI 模型。

为了支持企业云端服务,Google Cloud 整合加入20 个AI 模型,使总数达到100 个,透过其AI 基础设施,可让客户使用包括Meta Llama 2 模型、Anthropic Claude 2 聊天机器人等,自由选择最能满足营运需求的AI 模型。

Google Cloud 也对既有AI 模型提高性能并添加功能,例如文字处理方面的PaLM 模型可支援用户输入更多文字量,以便处理篇幅较长的报导、书籍文章或者法院判决文件等。

这次Google Cloud 也推出企业级新工具,包括「SynthID」可为AI产生的图片加上隐形浮水印,以人眼看不见的方式更改数位图片档,即使AI 图片被编辑或篡改也能保有完整性。

Google Workspace 办公套件将为用户提供Duet AI 新产品,预计今年稍晚向所有用户开放,可在Google 文件、试算表、简报中运用AI 助手帮助更快完成工作。


  1. EETOP 官方微信

  2. 创芯大讲堂 在线教育

  3. 创芯老字号 半导体快讯

相关文章

全部评论

  • 最新资讯
  • 最热资讯
@2003-2024 EETOP