作加

国产AI编程新标杆:快手720亿参数模型登顶代码生成领域


快手开源KAT-Dev-72B-Exp,刷新代码生成能力纪录

国产AI在代码生成领域再创里程碑!快手旗下Kwaipilot团队正式开源其重磅研究成果——KAT-Dev-72B-Exp,这是一款拥有720亿参数的实验性大语言模型。该模型在权威评测SWE-Bench Verified中斩获74.6%的准确率,一举登顶开源代码模型排行榜,标志着国产AI编程助手迈入全新阶段。

性能惊艳,对标顶级闭源模型

KAT-Dev-72B-Exp的表现令业内瞩目,尤其是在软件工程领域的核心测试集SWE-Bench上。该测试平台模拟真实开发场景,专注于代码修复与系统优化,被誉为代码AI的“硬核考场”。KAT-Dev-72B-Exp不仅刷新了开源模型的上限,其准确率甚至可与部分顶级闭源模型媲美。

更值得一提的是,评估采用的是严格的SWE-agent脚手架标准,确保结果具备高度参考价值。这意味着,KAT-Dev-72B-Exp不仅“能写代码”,更能“写好代码”,在复杂工程任务中展现出出色的稳定性和实用性。

创新架构,训练效率大幅提升

这款模型的核心优势在于其创新的训练架构。Kwaipilot团队引入了大规模强化学习机制,并结合自研训练引擎,成功实现两项关键技术突破:

  • 共享前缀轨迹:通过复用高频代码片段的前缀路径,显著提升训练效率和稳定性。
  • 熵塑优势策略:借鉴信息论原理,动态平衡探索与利用,避免模型陷入局部最优,提升泛化能力。

这两项技术的结合,不仅降低了训练成本,还为未来模型迭代提供了可复用的研究路径。KAT-Dev-72B-Exp作为KAT-Coder系列的强化学习预览版,专为研究社区设计,目前已在Hugging Face平台开放下载,欢迎全球开发者试用并反馈。

开源赋能,推动全球开发者生态

快手此次开源KAT-Dev-72B-Exp,不仅展示了国产AI的技术实力,也为全球开源生态注入新活力。通过降低高端AI编程工具的使用门槛,KAT-Dev-72B-Exp为中小型开发团队提供了免费、高效的解决方案。

此外,快手旗下的StreamLake平台已上线KAT Coder的在线试用服务,用户可每日免费体验其强大功能,即时感受AI编程的未来趋势。

从辅助工具到核心生产力

随着国产大模型在参数规模和任务适应性上的持续突破,AI编程助手的角色正在发生根本性转变——从最初的代码补全工具,进化为支持代码修复、系统重构乃至工程决策的核心生产力工具

Kwaipilot团队表示,他们将持续推进KAT系列的技术演进和商业化落地,为全球开发者提供更智能、更高效的编程支持。

即刻体验国产AI编程新标杆

KAT-Dev-72B-Exp现已在Hugging Face官方仓库开放下载。无论你是个人开发者、科研人员还是企业技术团队,都可以免费获取并体验这一国产AI编程的里程碑之作。

国产AI,正在用实力改写全球代码生成的未来格局。