据英伟达官方网站公告,亚马逊云现已正式推出由英伟达 H100Tensor Core GPU 驱动的全新 Amazon Elastic Compute Cloud(EC2)P5实例。
新的 EC2P5实例使用户能够通过浏览器轻松扩展生成式 AI、高性能计算(HPC)和其他应用。
据了解, H100GPU 的一个重要特点是其对 Transformer 的优化,这是许多最新的先进 AI 应用所使用的关键技术,确保 H100在这些应用中提供更高的性能和效率。
尽管亚马逊 AWS 尚未公开承诺将 AMD MI300芯片集成到其云服务中,但亚马逊弹性计算云副总裁 Dave Brown 确认 AWS 正在积极考虑这一方案。
英伟达表示,开发人员和研究人员几乎每天都在利用大型语言模型(LLMs)探索 AI 的新应用,而将这些新用例推向市场需要加速计算效率。
通过架构创新,NVIDIA H100GPU 提供了超级计算级别的性能,包括第四代 Tensor Cores、用于加速 LLMs 的新 Transformer 引擎以及最新的 NVLink 技术,可提供出色的性能。
据悉,EC2P5实例非常适合训练和运行复杂的 LLMs 和计算机视觉模型推理。这些神经网络驱动着最复杂和计算密集型的生成式人工智能应用程序,例如问答、代码生成、视频和图像生成以及语音识别等。
评论列表 (条)