Meta 的 Llama 2 基础模型现已在亚马逊 SageMaker JumpStart 中提供 2023-07-20 11:07:56

亚马逊公司宣布，Meta 开发的 Llama 2 基础模型可通过 Amazon SageMaker JumpStart 向客户提供。Llama 2 系列大型语言模型 (LLM) 是预先训练和微调的生成文本模型的集合，其规模从 70 亿到 700 亿个参数不等。

经过微调的 LLM，称为 Llama-2-chat，针对对话用例进行了优化。用户可以轻松尝试这些模型并将其与 SageMaker JumpStart 结合使用。

Amazon SageMaker JumpStart 是一个机器学习 (ML) 中心，提供预训练模型、内置算法和预构建解决方案，帮助用户快速开始使用 ML。只需在 SageMaker Studio 中单击几下即可部署和使用 Llama 2 基础模型，或者通过 SageMaker Python SDK 以编程方式部署和使用 Llama 2 基础模型。

Llama 2 是一个使用优化的 Transformer 架构的自回归语言模型。Llama 2 旨在用于商业和研究用途的使用。它有多种参数大小可供选择——70 亿、130 亿和 700 亿，以及预训练和微调变体。

根据 Meta 的说法，微调版本使用有监督的微调（SFT）和人类反馈的强化学习（RLHF）来对齐人类对有用性和安全性的偏好。Llama 2 的预训练数据来自公开可用的 2 兆 tokens 数据。微调模型旨在用于类似助手的聊天，而预训练模型可以适应各种自然语言生成任务。

无论开发人员使用哪个版本的模型，Meta 的负责任使用指南都可以帮助指导可能需要进行的额外微调，以定制和优化模型，并采取适当的安全措施。

此前微软的 Azure 云计算服务也提供了 Meta 新人工智能大语言模型 Llama 2 服务。

本文地址：/news/2359.html

相关标签： Meta 的 LLaMA 2 基础模型现已在亚马逊