8月8日消息:百川智能今天发布了公司旗下第三款大模型产品——Baichuan-53B。据王小川介绍,Baichuan-53B 定位闭源大模型,目前在写作、文本创作能力方面,已经达到行业最好的水平。
Baichuan-53B 主要面向 B 端用户提供服务,发布后,该大模型也将启动内测,预计下个月将会开放 API 等相关组件。
百川智能创始人、CEO 王小川今日在与媒体沟通时表示,做大模型比做搜索引擎时成就感更大。王小川表示,当初做搜索的时候,没有人说「小川,你特别适合做搜索」。但是今天,很多人都说,「小川,你特别适合做大模型」。王小川指出,当初做搜索,想变成问答,一直没有转化过来,但现在做大模型,与搜索的模型做了一定程度的结合,事情比原来更吸引人了。
在谈及近期王慧文退出光年之外时表示,他是国内做这么多大模型企业中,唯一一个没有技术背景的,做大模型需要做大量的技术决策,如招什么人、走什么技术路线、需要多少计算资源,没有技术背景做大模型压力会大很多,但是技术足够的话,其实是件挺愉悦的事情。
另外,此前王小川回应了外界对百川智能开源模型 Baichuan-7B 套壳 Meta 开源模型 LLaMa 的质疑。王小川提到,搜索公司干了 20 年,团队对语言数据有深入的理解,知道取得高质量语料的渠道,模型迭代速度很快,「国内开源模型的能力目前已经可以达到 LLaMa」。
相关标签: 王小川谈王慧文做大模型 没有技术背景做大模型压力会大很多
评论列表 (条)