GPT-4.5 成功通过三方图灵测试-牛仔AI

2025 年 4 月 3 日，一则振奋 AI 领域的消息从《科创板日报》传出：美国加州大学圣地亚哥分校所开展的一项研究取得了突破性进展，首次以实证方式证明了人工智能系统能够通过标准三方图灵测试。这一成果的公布，为 AI 技术的发展历程添上了浓墨重彩的一笔。

在此次意义非凡的研究中，研究团队精心挑选了四种具有代表性的 AI 系统参与测试，它们分别是 GPT – 4.5、LLaMa – 3.1 – 405B、GPT – 4o 以及 ELIZA。测试过程严格遵循三方图灵测试规则，每一轮对话环节，裁判都需要同时与两名人类和一个 AI 系统展开交流互动，而后凭借交流中的感受和判断，甄别出其中的 AI 系统。令人惊叹的是，当 GPT – 4.5 被赋予特定角色设定，例如模拟熟悉流行文化的年轻人时，它成功迷惑了裁判，被误判为人类的比例高达 73%。这一数据不仅远远高于真实人类参与者被误认的概率，更是大幅超越了历史上定义 AI 通过图灵测试的关键指标 ——50% 的概率标准，充分彰显了 GPT – 4.5 在模拟人类对话方面的卓越能力。

研究团队还深入探究了不同提示条件对 AI 模型测试表现的影响。结果显示，当缺乏角色提示时，GPT – 4.5 的总体胜率骤降至 36%，而 GPT – 4o 和 ELIZA 的表现则更为逊色，胜率分别仅为 21% 和 23%。这一发现有力地表明，合适的提示对于 AI 在图灵测试中展现出接近人类的对话能力起着至关重要的作用。

尽管 GPT – 4.5 成功通过三方图灵测试，展现出令人瞩目的成果，但研究人员也保持着理性与谨慎。他们明确指出，通过图灵测试并不等同于 AI 模型真正具备了像人类一样理解事物的能力。这仅仅意味着，以 GPT – 4.5 为代表的 AI 系统，在模拟人类交互、生成类人对话方面的技术正日益精进，向着更加成熟的方向不断迈进。

本站内容文章版权归作者所有，未经允许请勿转载，如转载必须注明出处。

THE END

行业资讯