天津大学大模型评测报告：GPT-4和百度文心一言显著领先 2023-08-15 08:42:20

8月12日，天津大学和信创海河实验室举办了一次大模型技术与评测研讨会，会上发布了首份大模型评测报告。

该报告对国内外14个大语言模型进行了中文综合能力评测，结果显示，GPT-4和百度文心一言相对于其他模型综合性能领先。

在此次评测中，GPT-4对参评模型的主观题回答进行了打分，结果显示，GPT-4认为文心一言生成的中文内容质量更高。相比人工评价，在基于 GPT-4的自动评测中，文心一言的总得分超过了 GPT-4，位居榜首。

天津大学表示，大模型有望重塑人工智能的发展模式，国产大模型正在迎头赶上国际类似模型，并在某些指标上实现了超越。百度文心一言在评测中展现了强大的实力，具备了在相关行业落地的技术基础。

百度表示，百度在大模型生态的构建上具备先发优势，目前已经有15万家企业申请接入文心一言测试。

DALL-E3、Midjourney、Stable Diffusion等模型展现出了强大的创造能力，...

中科大和 IDEA 研究院封神榜团队合作开发了一款名为 ChiMed-GPT 的中文医疗领域大语言模...

...

要点: MIT的研究团队推出了MechGPT，...

要点: 1. GPT-4在文生图表领域的应用，...

一场被称为“科技春晚”的OpenAI开发者大会，让渐冷的AIGC行业再度变得火热。...

在 Openai DEV day 上，Openai推出了 GPT Stores，允许用户通过聊天、直...

据报道，OpenAI 前 CEO Sam Altman与前总裁Greg Brockman在 Open...

随手一画就能生成网页!GPT-4V新玩法登顶GitHub热榜，狂揽3000...

随手一画就能生成网页!GPT-4V新玩法登顶GitHub热榜，狂揽3000...

**划重点:** 1. OpenAI首席运营官...

ChatGPT可能要上新一项重大功能了。那就...