初创公司Cerebras推出 WSE-3 AI芯片, 4万亿个晶体管!

2024-03-14 作者: 编辑

Cerebras Systems 推出了其晶圆级引擎 3 (WSE-3),这是一款突破性的 AI 晶圆级芯片,其性能是其前身 WSE-2 的两倍。这款新器件包含 4 万亿个晶体管,采用 TSMS 的 5nm 级制造工艺制造;900,000 个 AI 核心;44GB 片上 SRAM;并具有 125 FP16 PetaFLOPS 的峰值性能。Ceberas 的 WSE-3 将用于训练一些业界最大的 AI 模型。

 

WSE-3 为 Cerebras 的 CS-3 超级计算机提供动力,该超级计算机可用于训练具有多达 24 万亿个参数的 AI 模型——与由 WSE-2 和其他现代 AI 处理器驱动的超级计算机相比,这是一个重大飞跃。超级计算机可以支持 1.5TB、12TB 或 1.2PB 的外部存储器,这使得它可以在单个逻辑空间中存储大量模型,而无需分区或重构,从而简化训练过程并提高开发人员效率。

 

图片
图片

(图片来源:Cerebras)

 

在可扩展性方面,CS-3 可以配置在多达 2048 个系统的集群中。这种可扩展性使其能够在一天内通过四系统设置微调 700 亿个参数模型,并在同一时间范围内从头开始全尺寸训练 Llama 70B 模型。

 

最新的 Cerebras 软件框架为 PyTorch 2.0 提供原生支持,还支持动态和非结构化稀疏性,可以加速训练——比传统方法快 8 倍。

 

图片
图片

(图片来源:Cerebras)

 

Cerebras 强调了 CS-3 卓越的电源效率和易用性。尽管性能翻了一番,但 CS-3 的功耗与其前身相同。它还简化了大型语言模型 (LLM) 的训练,与 GPU 相比,所需的代码最多可减少 97%。例如,据该公司称,一个 GPT-3 大小的模型只需要 Cerebras 平台上的 565 行代码。

 

该公司已经对CS-3产生了浓厚的兴趣,并且有来自各个领域的大量积压订单,包括企业、政府和国际云。Cerebras 还与阿贡国家实验室和梅奥诊所等机构合作,突出了 CS-3 在医疗保健领域的潜力。

 

Cerebras 和 G42 之间的战略合作伙伴关系也将随着 Condor Galaxy 3 的建设而扩大,Condor Galaxy 3 是一款具有 64 个 CS-3 系统(包含高达 57,600,000 个内核)的 AI 超级计算机。两家公司已经共同创造了世界上最大的两台人工智能超级计算机:Condor Galaxy 1(CG-1)和Condor Galaxy 2(CG-2),它们位于加利福尼亚州,具有8个ExaFLOP的综合性能。此次合作旨在在全球范围内提供数十个 exaFLOP 的 AI 计算。

 

G42集团首席技术官Kiril Evtimov表示:“我们与Cerebras的战略合作伙伴关系在推动G42的创新方面发挥了重要作用,并将为加速全球范围内的人工智能革命做出贡献。“Condor Galaxy 3 是我们的下一台 AI 超级计算机,拥有 8 exaFLOP,目前正在建设中,很快将使我们系统的 AI 计算总产量达到 16 exaFLOP。”

 

免责声明:文章来源于Tom's Hardware,发布/转载只作交流分享。如有异议请及时联系,谢谢。

微信扫一扫,一键转发