首页 > 热点资讯内容详情

文心大模型3.5勇夺三个冠军领跑，中文完爆GPT-4！国际权威报告7项满分「全班第一」 2023-07-20 13:43:10

编辑导读：百度公司推出了开源的文心大模型 3.5 版本，该模型在 AI 大模型领域取得了重大突破，被称为中文完爆 GPT-4。国际权威机构 IDC 发布的报告中，文心大模型 3.5 获得了 7 项满分，包括算法模型第一和行业覆盖第一等。该模型在基础模型、精调技术、知识点增强等方面都取得了显著进步，模型效果提升了 50%，训练速度提升了 2 倍，推理速度提升了 30 倍。文心大模型还新增了插件功能，使其能够生成视频、文档摘要等多种形式的内容。同时，文心大模型还在搜索技术、文学创作、角色扮演等方面表现出色。文心大模型的发布将进一步推动 AI 技术的发展和应用。

声明:本文来自于微信公众号新智元（ID:AI_era），作者:新智元，授权转载发布。

一觉醒来，好不热闹，Meta深夜投出重磅炸弹，Llama2既开源还能商用，简直让大模型领域变了天了。

在Azure上可部署，在Huggingface上可下载，Meta再次回到AI主战场，牛到不可思议。

短短一周内，硅谷是真卷起来了。Bing推出Bing Chat企业版，Anthropic发布GPT-4最强竞品Claude2，谷歌Bard也发布大量更新……

就在刚刚，小编也体验到了百度文心一言最新的文生视频、ChatFile插件等新功能。

现在，文案、视频，全都能交给它来解决——

根据自己生成的内容，文心一言可以分分钟输出一个视频，连视频配文都帮你贴心地写好。UP主们简直要笑疯!

据介绍，文字转视频的能力、直接生成视频的能力，目前是在百度内部测试。

IDC「AI大模型评估报告」，文心大模型全班第一

与此同时，国际权威IDC发布了业内首个大模型评估报告——《AI大模型技术能力评估报告，2023》。

报告中，IDC从多维度测评大模型的能力，将大模型分为三大层服务生态、产品技术以及行业应用。

每个指标有1分-5分五个层级，得分越高代表厂商大模型技术能力越强。

值得一提的是，百度文心大模型3.5拿下12项指标的7个满分，综合评分第一，算法模型第一，行业覆盖第一。

这三个绝对第一，体现了百度文心大模型的基础技术深度和产业应用覆盖广度。

根据IDC的报告，百度AI大模型整体竞争力位于领先水平，在模型能力、工具平台、生态布局以及行业覆盖上优势明显，并已提前进入商业化落地探索阶段。

从3月16日文心一言发布到5月，文心一言的「内核」文心大模型就升级到了3.5版本。

它实现了基础模型升级、精调技术创新、知识点增强、逻辑推理增强，插件机制等，模型效果提升了50%，训练速度提升了2倍，推理速度提升了30倍。

既然文心大模型3.5是文心一言的内核，那就让我们看看23年6月30日上线的V2.2.0版文心一言，究竟强在了哪?

文心大模型3.5，功能全面升级

这次，文心一言升级后最大的变化，就是全新的「插件」功能了。

可以说，插件就像给大模型们上了一层buff，被禁锢的能力，瞬间就被释放出来。

比如GPT-4搭载的Code Interpreter就强到令人发指，甚至很多人说应该叫它GPT-4.5才对。

文心一言，当然也少不了强大插件的加持。

检索（热点实时追踪）

在搜索技术上，百度积累了大量优势。

「百度搜索」插件背后，是更强的搜索技术和更强的搜索底层架构。

而集成插件之后的文心大模型3.5，现在可以对互联网各个角落的信息了如指掌。

比如今天的爆炸性新闻，Meta发布了开源且免费商用的Llama2，还和微软云服务Azure、高通芯片都展开了合作。所以这对全世界大模型的格局会带来哪些改变?

文心一言指出，Meta在AI领域重新拿回了影响力，大模型的商业模式也被彻底改变。

Meta此举对于OpenAI和谷歌的商业版图，会有何影响呢?

文心一言总结得全面又透彻——增加竞争压力、激发创新活力、扩大市场份额、加速行业变革。

搜索和大模型的能力一结合，开了挂的文心一言，简直分分钟化身商业分析师。

文档（PDF/Word都可以）

除了联网，百度这次还给文心一言新加入了一款ChatFile插件。

在上传文档之后，用户只要用自然语言，就能对其中的内容进行问答检索和总结摘要。

而且，通过这种超长文档的回答，ChatFile可以大幅拓展模型处理文字的长度了。

在使用过程中，ChatFile会对文档的每一个段落都进行语义索引和向量化建库。

最近，猎聘大数据研究院重磅发布了一份《AIGC就业趋势大数据报告2023》，都有哪些核心内容?上传文档，文心一言几秒就能帮你做出又快又好的总结。

你还可以就文档细节，让它给你做个归纳总结。

或者让文心一言帮你总结一篇arXiv论文。

有了文心一言的ChatFile插件，以后看论文，是省时又省力了。

更懂中国人的大模型

文心一言，显然是更适合中国宝宝体质的大模型。

无论是文言文，还是知乎、小红书这类社交媒体文案的创作，当然还是我们自己的中文大模型最擅长。

进化后的文心大模型3.5，直逼GPT-4

正在热映的「长安三万里」，为我们重现了一把大唐的极致浪漫。

年少意气风发的李白，命运几番浮沉。

他曾写下的「轻舟已过万重山」，也再次成为大家关注的焦点。

谪仙人李白写下这句诗时，究竟是怎样的心境?

在诗词歌赋这类中国传统文化方面的表现，文心一言可谓是相当出色。

不仅对答如流，而且还能分析出诗句的含义和妙处。

甚至，还给难（kao）读(dian)的词语，标上了拼音。

而GPT-4这边，堪称一个「缝合怪」。

一方面，通篇都没有原作曹操什么事，还把李白写的《赠汪伦》安在了陆游身上。

另一方面，诗句的补全更是离奇。前四句还好好的，然而从第五句往后，GPT-4就开始放飞自我了……

再比如，北宋文学家欧阳修的《生查子•元夕》中，「月上柳梢头，人约黄昏后」描写的是哪个传统节日?

文心一言答:元宵节。

GPT-4不仅误判成了中秋节，而且还替苏轼「写」了一首「临江仙·满江红」……

此外，对于成语的理解，文心一言也相当拿手。

正确与否，我们贴上来自「百度百科」的回答，就一目了然了。

相比之下，GPT-4再一次陷入到了自己的幻觉当中。

中文创作，全面发展

写起古诗来，文心大模型3.5也是完胜GPT-4。

比如以「思念无期」写一首藏头诗。

文心一言不仅完美藏了头，离别之苦、思君之愁的感觉也一并表达了出来。

GPT-4写的藏头诗，相比之下可是逊色了不少。

一句话:写诗，还得看咱们自己的大模型!

另外，文心一言不仅是一位「文学大师」，还是一位「文案高手」，可以根据不同平台的风格调性，创作贴合的文案。

用知乎体回答一下:「人生中拿到一副烂牌被自己打好了是种怎样的体验?」

「谢邀」俩字一出，张口就知是老知乎er了。

最近，「特种兵旅游」、「夕阳红老年团游」都out了，现在流行的是Citywalk。那就请文心一言写一份北京的citywalk线路吧。

经常上网冲浪的盆友们，你们是不是经常遇到这种文案，文采飞扬、意境绝佳，但就是不知所云。

有了文心一言，对方来一句，咱们来十句。讲不讲得通另说，要的就是一个气势。

就在刚刚，2023年的暑期档电影票房已经超过了90亿元。

虽然不能亲自到影院，但会上网的文心一言，写起影评来是真不在话下。

有人说，大龄程序员的归宿就是送外卖和开奶茶店。

干到三十多卷不动了，带着50万存款回老家开一家奶茶店可行吗?文心一言帮你分析。

玩梗，它是独树一帜

对于那些独属于中文互联网的热梗，文心一言就更加如鱼得水了。

在「百度搜索」插件的加持下，文心一言把最近流行的「白人饭」给解释得明明白白。

面对同样的问题，GPT-4也必须开启一些「科技与狠活」，才能get到。

至于回答的质量，两个大模型可以说是不相上下。

相比之下，无法联网的GPT-3.5，就一脸懵圈了。

「哈基米」也算是一个洗脑了无数人的bgm。所以，这究竟是什么梗?

文心一言立马说出了「哈基米」的出处，其实在日语中，原音为はちみ。没想到，被网友用来给猫猫视频配音后，火遍全网。

除了热梗，文心一言还很懂流行的emoji，比如常见的

本文地址：/news/2387.html

版权声明：如无特殊标注，文章均为本站原创，转载时请以链接形式注明文章出处。

相关标签：文心大模型3 5勇夺三个冠军领跑中文完爆GPT 4 国际权威报告7项满分

评论列表（条）

发布评论取消回复