首页 > 热点资讯内容详情

GLM技术团队宣布代码模型CodeGeeX2-6B开源 2023-07-26 11:53:49

GLM技术团队宣布,「代码生成模型 CodeGeeX2-6B」正式开源。

CodeGeeX2是多语言代码生成模型 CodeGeeX 的第二代模型,基于 ChatGLM2架构注入代码实现。得益于 ChatGLM2的更优性能,CodeGeeX2-6B 在多项指标上取得了较大的性能提升。与150亿参数的 StarCoder-15B 相比,CodeGeeX2-6B 凭借60亿参数便具备了近10% 的优势。

具体特性如下:

更强大的代码能力:基于 ChatGLM2-6B 基座语言模型,CodeGeeX2-6B 进一步经过了600B 代码数据预训练,相比一代模型,在代码能力上全面提升,HumanEval-X 评测集的六种编程语言均大幅提升 (Python 57%, C 71%, Java 54%, JavaScript 83%, Go 56%, Rust 321%),在Python上达到35.9% 的 Pass@1一次通过率,超越规模更大的 StarCoder-15B。

更优秀的模型特性:继承 ChatGLM2-6B 模型特性,CodeGeeX2-6B 更好支持中英文输入,支持最大8192序列长度,推理速度较一代 CodeGeeX-13B 大幅提升,量化后仅需6GB显存即可运行,支持轻量级本地化部署。

更全面的AI编程助手:CodeGeeX插件(VS Code, Jetbrains)后端升级,支持超过100种编程语言,新增上下文补全、跨文件补全等实用功能。结合 Ask CodeGeeX 交互式AI编程助手,支持中英文对话解决各种编程问题,包括且不限于代码解释、代码翻译、代码纠错、文档生成等,帮助程序员更高效开发。

更开放的协议:CodeGeeX2-6B 权重对学术研究完全开放。

代码地址:https://github.com/THUDM/CodeGeeX2

相关标签: GLM技术团队宣布代码模型CodeGee 6B开源

发布评论