大模型混战，阿里百度华为谁将成就AI时代的“新地基”？ 2023-04-14 18:21:17

自2022年stable diffusion模型的进步推动AIGC的快速发展后，年底，ChatGPT以“破圈者”的姿态，快速“吸粉”亿万，在全球范围内掀起了一股AI浪潮，也促使了众多海外巨头竞相发布属于自己的大模型。

而在国内，实际上很久之前，阿里、华为、腾讯等公司便早已有所布局:2019年，阿里开始布局大模型研发，去年9月发布“通义”大模型系列的众多大模型;华为在2021年基于昇腾AI与鹏城实验室联合发布了鹏程盘古大模型;而腾讯的思路也与阿里相似，发布了混元AI大模型;第二梯队的京东、网易、360、字节跳动等企业，也纷纷官宣了自己在AI大模型方面的布局。

而进入2023年以来，随着文心一言的发布，成为了中国第一个类ChatGPT产品后，各家的大模型也纷纷亮相，一时间，国内仿佛陷入了“大模型之战”中。

截至目前，百度文心大模型、华为盘古大模型、商汤大模型、阿里大模型都已亮相，而后还有许多大模型正在准备粉墨登场。

那么，在这匆匆发布的背后，是真的技术成熟，还是鱼龙混杂?各个大模型的实力又是怎样?

本文将从语言大模型、算力与技术底座与具体应用层面状况三大角度，来分析和研究目前已经发布的大模型的技术基础、应用场景和用户生态，看看哪些大模型更有可能在这混战中成功突围。

1

ChatGPT不该止于C端

ChatGPT，作为最早出圈的大模型产品应用，其问答的流畅程度与准确程度，可以很好地体现NLP模型的水平。

而目前，国内厂商百度、阿里也都发布了类似模型，那么，相比之下，文心一言与通义千问的表现如何?

首先是最近对话式AI们经常出现的一个典型问题，面对自己知识库中没有，或本身就是错误的提问时，仍能对着错误描述侃侃而谈，简称一本正经的胡说八道。

于是，我先问了通义千问这样一个问题:你知道唐僧为什么要上梁山吗?

通义千问在思考后，给出了这样的回答:它首先简单对唐僧进行了介绍，然后将其带入了《水浒传》中宋江的角色，但最后却又回到了《西游记》中，还讲“这一情节体现了唐僧的坚定和决心，也反映了他作为一个有信仰的人物的形象。”