斯坦福报告显示中美 AI 技术差距缩至 0.3%

图片[1]-斯坦福报告显示中美 AI 技术差距缩至 0.3%-牛仔AI

4 月 8 日,由 AI 科学家李飞飞领衔的斯坦福大学人工智能研究所发布的《2025 年人工智能指数报告》显示,中美顶级 AI 大模型性能差距已由 2023 年的 17.5% 大幅缩至 0.3%,几乎抹平。

 

报告指出,在 2024 年全球 61 个重要 AI 大模型中,美国入选 40 个,中国入选 15 个。其中,谷歌、OpenAI 分别入选 7 个,并列第一,阿里以 6 个入选,位列全球第三。在业内顶级专家评选出的 32 项 “2024 年 AI 领域重要发布” 中,中国的阿里 Qwen2、Qwen2.5 及 DeepSeek-V3 三大发布上榜。

 

在性能方面,2023 年,美国领先的人工智能模型在性能上大幅优于中国模型,但到了 2024 年底,这一差距已大幅收窄。具体数据显示,2023 年底,在 MMLU、MMMU、MATH 和 HumanEval 等基准测试中,美国模型的性能分别领先中国模型 17.5、13.5、24.3 和 31.6 个百分点;而到 2024 年底,这些差距已分别缩小至 0.3、8.1、1.6 和 3.7 个百分点。

 

报告认为,随着小模型性能提升,达到 GPT-3.5 水平的推理成本在两年间下降 280 倍,硬件成本以每年 30% 的速度递减,能效年提升率达 40%。在 MMLU 基准测试中达到 GPT-3.5 水平(MMLU 准确率 64.8%)的 AI 模型调用成本,已从 2022 年 11 月的 20 美元 / 每百万 token,骤降至 2024 年 10 月的 0.07 美元 / 每百万 token(谷歌 DeepMind 的 Gemini-1.5-Flash-8B 模型)。

 

在全球范围内,虽然美国在数量上保持领先,但中国模型在质量上迅速缩小差距。在 MMLU 和 HumanEval 等主要基准测试上,二者的性能差距从 2023 年的两位数缩小到了 2024 年的接近持平。排名第一和第十的模型之间的 Elo 分数差距从一年前的 11.9% 缩小到了 5.4%,排名前两位的模型差距从 4.9% 骤降至仅 0.7%。

 

从 AI 研究论文和专利方面来看,该报告汇编的数据显示,到 2023 年,中国已处在 AI 研究论文的全球领先地位,研究论文数量占全球总数的 23.2%,而欧洲和印度的这一比例分别为 15.2% 和 9.2%。中国在 AI 专利授权方面也处于领先地位,占 2023 年全球 AI 专利总数的 69.7%,其次是美国(14.2%)。不过,中国在私人投资、专利产出、研究论文引用和创建全球公认的 AI 模型等领域依然落后。
© 版权声明
THE END
您的赞美是我们持续创作/分享的动力,欢迎点赞/分享/关注。
点赞9 分享
评论 抢沙发
头像
欢迎您留下宝贵的见解!
提交
头像

昵称

取消
昵称表情代码图片

    暂无评论内容