近日,知名大模型训练平台 Together AI 与智能体平台 Agentica 携手,联合开源了一款全新的代码生成模型 ——DeepCoder-14B-Preview,这一举措在人工智能领域引发了广泛关注。
DeepCoder-14B-Preview 基于经过蒸馏优化的 140 亿参数预训练模型 Deepseek-R1-Distilled-Qwen-14B,并通过分布式强化学习(RL)进行了精细调整。在代码生成任务的表现上,该模型展现出了令人瞩目的实力。尤其在知名代码测试平台 LiveCodeBench 的测试中,DeepCoder-14B-Preview 成功斩获了 60.6% 的准确率 。这一成绩相当亮眼,足以与 OpenAI 的 o3-mini 模型相媲美,甚至在部分评测维度上实现了超越。同时,在 Codeforces、AIME2024 等其他权威平台的评测数据中,DeepCoder-14B-Preview 同样表现出色,几乎与 o1、o3-mini 处于同一水平。
除了优异的性能表现,Together AI 与 Agentica 的此次开源行动还具有重大意义。他们不仅开源了 DeepCoder-14B 的模型权重,更是将训练数据集、训练方法、训练日志以及优化方法毫无保留地全部公开。这一全面开源的举措,为广大开发者提供了深入了解模型开发全流程的宝贵机会,极大地降低了强化学习在大型语言模型(LLM)领域的应用门槛,有望进一步推动相关技术的发展与创新,促进整个社区的繁荣。
随着 DeepCoder-14B-Preview 的开源,预计将在开发者群体中掀起一股研究和应用的热潮。它不仅能够为开发者提供高效的代码生成辅助工具,帮助解决复杂的编程难题,提升编码效率,还可能在诸如代码自动补全、单元测试生成、代码调试辅助等多个方面发挥重要作用,为软件开发流程带来新的变革。
© 版权声明
本站内容文章版权归作者所有,未经允许请勿转载,如转载必须注明出处。
THE END
暂无评论内容