4 月 7 日,安徽省量子计算工程研究中心传出喜讯:本源量子计算科技(合肥)股份有限公司、合肥综合性国家科学中心人工智能研究院等机构携手合作,成功在我国第三代自主超导量子计算机 “本源悟空” 上,完成了全球首次十亿参数级 AI 大模型微调任务。这一成果标志着量子计算与 AI 的融合迈出了关键一步,为解决大模型 “算力焦虑” 开辟了新路径。
大模型微调,即在通用大模型的基础上,通过进一步训练特定领域数据,使其适应医疗诊断、金融风控等专业场景。传统低秩微调在性能、泛化能力方面存在瓶颈,而量子计算凭借叠加态和纠缠态特性,可同时探索海量参数组合,提升大模型微调效率。
本源量子副总裁窦猛汉介绍,团队创新设计了 “量子加权张量混合参数微调” 方法,将模型权重转化为量子神经网络与张量网络混合架构。其中,量子神经网络通过量子门操作提取高维非线性特征,张量网络则用于压缩参数规模。这一创新使 “本源悟空” 在量子芯片上单批次数据可生成数百个量子任务并行处理。
实验数据显示,该方法在参数量减少 76% 的情况下,AI 大模型训练效果反而提升 8.4%。在心理咨询对话数据集(CPsyCountD)上,优化后的模型训练损失降低 15%;数学推理任务(R1-Distill-SFT)的严格准确率从 68% 提升至 82%。合肥综合性国家科学中心人工智能研究院副研究员陈昭昀表示:“这是量子计算首次‘真机实战’大模型任务,证明现有硬件已能初步支撑大模型微调。”
“本源悟空” 于 2024 年 1 月上线运行,搭载 72 位自主超导量子芯片 “悟空芯”,国产化率超 80%。自上线以来,已为全球 139 个国家和地区的超 2300 万人次提供量子算力云服务,完成 35 万个量子运算任务,广泛覆盖流体动力学仿真、金融建模、生物医药研发等前沿领域。今年 2 月,其全球访问量突破 2000 万次,刷新我国自主量子算力服务规模纪录。
此前,科研团队已在中国第三代自主超导量子计算机 “本源悟空” 上,成功完成全球最大规模的量子计算流体动力学仿真,相关成果发表于国际期刊《应用力学与工程中的计算机方法》。此外,“本源悟空” 还接入了金融量子云实验平台,积极探索金融领域更高效的问题解决方案。
当前,AI 大模型面临算力成本高、部署难度大等挑战,量子计算的介入为轻量化微调提供了革命性方案。此次 “本源悟空” 完成十亿参数级 AI 大模型微调任务,不仅验证了量子计算在大模型优化中的可行性,更推动量子技术从理论验证迈向实际应用。随着金融、医疗等行业对定制化 AI 模型需求的迅速增长,“本源悟空” 的突破为量子计算与垂直领域的深度融合奠定了坚实基础。
然而,量子计算要实现更广泛应用,仍面临诸多挑战。例如,量子比特的稳定性和纠错问题有待进一步解决,量子计算的硬件成本较高,且相关人才相对匮乏。但科研团队并未停下探索的脚步,他们透露,下一步将聚焦量子纠错技术,提升量子比特的稳定性和规模,为构建通用量子计算机奠定基础。
中国科学院院士郭光灿指出,此次突破是我国量子计算 “从实验室走向产业化” 的重要一步。随着技术的不断发展与完善,量子计算与 AI 的深度融合有望为更多领域带来创新变革,推动各行业加速进入智能化时代。
暂无评论内容