自2022年stable diffusion模型的进步推动AIGC的快速发展后,年底,ChatGPT以“破圈者”的姿态,快速“吸粉”亿万,在全球范围内掀起了一股AI浪潮,也促使了众多海外巨头竞相发布属于自己的大模型。
而在国内,实际上很久之前,阿里、华为、腾讯等公司便早已有所布局:2019年,阿里开始布局大模型研发,去年9月发布“通义”大模型系列的众多大模型;华为在2021年基于昇腾AI与鹏城实验室联合发布了鹏程盘古大模型;而腾讯的思路也与阿里相似,发布了混元AI大模型;第二梯队的京东、网易、360、字节跳动等企业,也纷纷官宣了自己在AI大模型方面的布局。
而进入2023年以来,随着文心一言的发布,成为了中国第一个类ChatGPT产品后,各家的大模型也纷纷亮相,一时间,国内仿佛陷入了“大模型之战”中。
截至目前,百度文心大模型、华为盘古大模型、商汤大模型、阿里大模型都已亮相,而后还有许多大模型正在准备粉墨登场。
那么,在这匆匆发布的背后,是真的技术成熟,还是鱼龙混杂?各个大模型的实力又是怎样?
本文将从语言大模型、算力与技术底座与具体应用层面状况三大角度,来分析和研究目前已经发布的大模型的技术基础、应用场景和用户生态,看看哪些大模型更有可能在这混战中成功突围。
1
ChatGPT不该止于C端
ChatGPT,作为最早出圈的大模型产品应用,其问答的流畅程度与准确程度,可以很好地体现NLP模型的水平。
而目前,国内厂商百度、阿里也都发布了类似模型,那么,相比之下,文心一言与通义千问的表现如何?
首先是最近对话式AI们经常出现的一个典型问题,面对自己知识库中没有,或本身就是错误的提问时,仍能对着错误描述侃侃而谈,简称一本正经的胡说八道。
于是,我先问了通义千问这样一个问题:你知道唐僧为什么要上梁山吗?
通义千问在思考后,给出了这样的回答:它首先简单对唐僧进行了介绍,然后将其带入了《水浒传》中宋江的角色,但最后却又回到了《西游记》中,还讲“这一情节体现了唐僧的坚定和决心,也反映了他作为一个有信仰的人物的形象。”
相关标签: 大模型混战 阿里百度华为谁将成就AI时代的 新地基
评论列表 (条)