北大开源aiXcoder-7B:企业级AI编程工具,引领软件开发新纪元
来源: | 作者:DE.News | 发布时间: 2024-04-28 | 977 次浏览 | 分享到:

    在AI代码生成技术日益成熟的今天,北京大学软件工程研究所孵化的aiXcoder团队宣布开源其最新力作——aiXcoder-7B Base版,一个专为企业软件开发场景量身定制的代码大模型。这款70亿参数的模型在多个主流评测集上的表现超越了340亿参数的Codellama,标志着其在AI编程领域的领先地位。

关键技术元素:

  1. aiXcoder-7B Base版:一个70亿参数的代码大模型,专为企业级软件开发设计。

  2. 性能卓越:在HumanEval、MBPP和MultiPL-E评测集中平均得分超过Codellama。

  3. 企业级优化:专注于真实开发场景,提供代码生成补全能力和跨文件分析能力。

  4. 易于私有化部署:考虑到企业代码数据的私密性,aiXcoder-7B Base版便于在企业内部部署和个性化定制。

  5. 个性化定制:支持企业根据自有软件开发框架和API库进行模型训练和优化。

  6. MoE架构:未来将采用Mixture of Experts架构,为企业提供更加定制化的服务。

  7. 开源数据集:提供了一个更大的测评代码生成补全数据集,与模型一同开源。

  8. 智能化补全:aiXcoder-7B Base版在补全时倾向于使用更短的代码,提高代码的可读性和减少Bug。

  9. 全自研:模型训练数据包括1.2T Unique Tokens,经过严格的语法分析和静态分析,确保代码质量。

技术实现步骤:

  1. 模型训练:使用大量Unique Tokens和针对性训练方法,对模型进行项目级代码的结构化语义训练。

  2. 多文件处理:在训练过程中构建多文件之间的相互注意力关系,提升模型的跨文件分析能力。

  3. 私有化部署:企业可以在本地环境部署aiXcoder-7B Base版,根据具体需求进行个性化训练。

  4. 智能化补全:模型能够根据用户输入的流畅性和实时反馈调整补全策略,优化用户体验。

结论:

aiXcoder-7B Base版的开源,不仅体现了北京大学软件工程研究所在AI编程领域的深厚实力,也为整个软件开发行业带来了创新的动力。通过其高性能的代码生成和补全能力,aiXcoder-7B Base版有望大幅提高企业的研发效率,推动软件开发自动化的进程。

项目开源地址:

通过上述内容,我们可以看到aiXcoder-7B Base版的主要技术元素包括其专为企业级软件开发设计的模型架构、卓越的性能表现、易于私有化部署和个性化定制的特性,以及智能化的代码补全能力。这些元素共同构成了aiXcoder-7B Base版的核心特性,使其成为推动软件开发自动化的有力工具。


注:数据公开渠道收集发布,版权出版方所有,此处不构成任何投资建议
返回