GPT-4.5 成功通过三方图灵测试

2025 年 4 月 3 日,一则振奋 AI 领域的消息从《科创板日报》传出:美国加州大学圣地亚哥分校所开展的一项研究取得了突破性进展,首次以实证方式证明了人工智能系统能够通过标准三方图灵测试。这一成果的公布,为 AI 技术的发展历程添上了浓墨重彩的一笔。
在此次意义非凡的研究中,研究团队精心挑选了四种具有代表性的 AI 系统参与测试,它们分别是 GPT – 4.5、LLaMa – 3.1 – 405B、GPT – 4o 以及 ELIZA。测试过程严格遵循三方图灵测试规则,每一轮对话环节,裁判都需要同时与两名人类和一个 AI 系统展开交流互动,而后凭借交流中的感受和判断,甄别出其中的 AI 系统。令人惊叹的是,当 GPT – 4.5 被赋予特定角色设定,例如模拟熟悉流行文化的年轻人时,它成功迷惑了裁判,被误判为人类的比例高达 73%。这一数据不仅远远高于真实人类参与者被误认的概率,更是大幅超越了历史上定义 AI 通过图灵测试的关键指标 ——50% 的概率标准,充分彰显了 GPT – 4.5 在模拟人类对话方面的卓越能力。
研究团队还深入探究了不同提示条件对 AI 模型测试表现的影响。结果显示,当缺乏角色提示时,GPT – 4.5 的总体胜率骤降至 36%,而 GPT – 4o 和 ELIZA 的表现则更为逊色,胜率分别仅为 21% 和 23%。这一发现有力地表明,合适的提示对于 AI 在图灵测试中展现出接近人类的对话能力起着至关重要的作用。
尽管 GPT – 4.5 成功通过三方图灵测试,展现出令人瞩目的成果,但研究人员也保持着理性与谨慎。他们明确指出,通过图灵测试并不等同于 AI 模型真正具备了像人类一样理解事物的能力。这仅仅意味着,以 GPT – 4.5 为代表的 AI 系统,在模拟人类交互、生成类人对话方面的技术正日益精进,向着更加成熟的方向不断迈进 。
© 版权声明
THE END
您的赞美是我们持续创作/分享的动力,欢迎点赞/分享/关注。
点赞48 分享
评论 抢沙发
头像
欢迎您留下宝贵的见解!
提交
头像

昵称

取消
昵称表情代码图片

    暂无评论内容