眼看着 ChatGPT 持续爆火了几个月,期间微软、谷歌、Meta 等科技巨头接连入局,如今英特尔也终于官宣“参赛”。
上周末,在德国汉堡举行的国际超级计算大会 (ISC) 高性能会议 (HPC)上,英特尔不仅展示了其在 HPC 和 AI 工作负载方面的领先性能,还宣布了一项出人意料的计划:与阿贡国家实验室携手,用 Aurora 超级计算机开发生成式 AI 模型 Aurora genAI,参数量将多达1万亿!
要知道,ChatGPT 的参数规模仅为1750亿,即 Aurora genAI 模型将比它至少大5倍。
AI 模型将由 Aurora 超算提供算力
据了解,英特尔 Aurora genAI 模型将以两个框架为基础:NVIDIA 的 Megatron 和微软的 DeepSpeed。
▶ Megatron:用于分布式训练大规模语言模型的架构,专门针对 Transformer 进行了优化,不仅支持传统分布式训练的数据并行,也支持模型并行。
▶DeepSpeed:专注于优化大型深度学习模型的训练,通过提高规模、速度、成本和可用性,释放了训练1000亿参数模型的能力,极大促进大型模型的训练。
除了这两个框架,Aurora genAI 模型还将由 Aurora 超级计算机来提供算力——这台英特尔为阿贡国家实验室设计的超级计算机,在经历了各种推迟后,如今终于成型了。
根据目前公开的资料显示,Aurora 超级计算机由英特尔 Xeon CPU Max 和 Xeon GPU Max 系列芯片提供支持,总共有10624个节点,拥有63744个 Ponte Vecchio GPU、21248个 Sapphire Rapids 至强CPU、1024个分布式异步对象存储 (DAOS) 存储节点以及10.9PB 的 DDR5傲腾持久内存。
评论列表 (条)