谷歌推超大规模语言模型CodeGemma, 可生成高质量代码

中关村在线2024-04-10 15:45:00  71

近日,谷歌公司发布了CodeGemma,这是一款专为生成代码和理解指令而设计的先进大语言模型。这款模型是基于Gemma模型进行优化和微调而成,旨在使全球开发人员能够更轻松地获得高质量的代码辅助工具。

CodeGemma包含三种不同参数的基础模型:

-20亿参数基础模型:该模型主要用于快速高效地提供补全和生成代码功能,特别适用于注重延迟和隐私的情况下。

-70亿参数基础模型:除了具备补全和生成代码的功能外,该模型还整合了自然语言处理技术,增强了其在完成代码和理解语言生成任务时的实用性。

-用于指导追踪的70亿参数模型:用户可以与开发人员进行关于代码、编程和数学推理等主题的对话,并且该模型将成为寻求指导或注释的重要资源。

这些三个基础模型使用预先训练过的Gemma检查点,并进行了额外的英语、数学和各种编码语言中5000亿个词块的训练。在逻辑和数学推理方面表现出超凡的能力,为代码生成和完成树立了新的标杆。

特别是在Python、Java、JavaScript和C++等编程语言中,70亿参数基础模型表现出了出色的表现。在HumanEval和MultiPL-E基准测试中取得了优异成绩,并在GSM8K评估中名列前茅,证明了其多功能性和有效性。

对于那些关注数字化行业发展的专业人士来说,这是一个非常值得注意的新闻。CodeGemma将为他们带来更多的可能性和机会,在日常工作中更加高效地利用各种数字化工具和技术。

转载此文是出于传递更多信息目的。若来源标注错误或侵犯了您的合法权益,请与本站联系,我们将及时更正、删除、谢谢。
https://www.414w.com/read/188827.html
0
最新回复(0)