OpenAI 宣布 GPT-4 退役,全面升级至多模态模型 GPT-4o

图片[1]-OpenAI 宣布 GPT-4 退役,全面升级至多模态模型 GPT-4o-牛仔AI

4 月 12 日,全球 AI 领域迎来重大变革。OpenAI 正式宣布,自 4 月 30 日起将在 ChatGPT 中全面停用 GPT-4 模型,转而推出其迭代版本 GPT-4o。这一决策标志着 AI 技术从单一文本处理向多模态交互的跨越,也为全球开发者和企业用户带来新的机遇与挑战。

技术升级:从文本到多模态的全面突破

GPT-4o 的核心突破在于其 “omni”(全能)特性。作为 OpenAI 首个原生多模态模型,它支持文本、音频、图像的混合输入输出,能够在 232 毫秒内实现音频实时响应,达到人类对话级别的交互速度。与 GPT-4 相比,GPT-4o 在三大领域实现显著提升:

 

  1. 多模态交互:通过统一神经网络处理多模态数据,用户可直接上传图片或语音进行复杂任务。例如,实时解析财务图表、生成带情感的语音回复,甚至在视频通话中识别对方情绪。
  2. 性能优化:响应速度较 GPT-4 Turbo 提升 2 倍,价格降低 50%,同时支持每分钟 1000 万 token 的高吞吐量,满足企业级应用需求。
  3. 任务泛化:在 GLUE 基准测试中,GPT-4o 的文本理解准确率达 90%,较 GPT-4 提升 5 个百分点;在 STEM 领域,其数学解题能力在高考模拟测试中得分 73 分,超越多数国内大模型。

服务延续:GPT-4 API 持续开放

尽管 ChatGPT 将停用 GPT-4,但该模型仍将通过 API 为开发者提供服务。OpenAI 强调,GPT-4 的 8K 上下文窗口和高精度文本生成能力,将继续满足代码生成、数据分析等专业场景需求。此外,GPT-4o 的 API 也将分阶段开放,首批支持多模态交互的接口预计于 5 月推出。

行业影响:从技术迭代到生态重构

此次升级对 AI 行业产生深远影响:

 

  • 开发者生态:GPT-4o 的免费版为中小企业提供低成本试错机会,但 3 小时 40 条消息的限制可能影响高频应用。付费用户则可享受 5 倍调用额度,适配企业级开发需求。
  • 硬件创新:苹果、微软等厂商已开始整合 GPT-4o。例如,AI PC 通过语音直接调用模型,而 iOS 18 计划将 GPT-4o 集成至 Siri,实现自然语言控制设备。
  • 国内竞争:中信建投分析师指出,GPT-4o 的多模态能力为国内大模型设定了新标杆,倒逼企业加速技术突破。目前国内模型在文本处理上已接近 GPT-4,但在多模态实时交互方面仍有差距。

专家观点:技术革命与伦理挑战并存

“GPT-4o 的发布是 AI 从工具到智能体的关键一步。” 斯坦福大学 AI 实验室主任李飞飞表示,模型的情感识别和多模态推理能力,可能重塑教育、医疗等领域的交互模式。但她同时提醒,多模态内容的滥用风险需警惕,例如伪造视频或语音诈骗。

 

OpenAI 首席执行官萨姆・奥尔特曼则强调,此次升级旨在平衡创新与普惠:”我们希望 GPT-4o 不仅是技术标杆,更能通过免费服务降低 AI 使用门槛,让更多人受益。”

 

随着 GPT-4o 的全面落地,AI 行业正站在新的十字路口。这场技术革命将如何重塑人类与机器的交互方式?或许正如奥尔特曼所言:”未来的 AI,将更像一个真正的智能伙伴。”
© 版权声明
THE END
您的赞美是我们持续创作/分享的动力,欢迎点赞/分享/关注。
点赞38 分享
评论 抢沙发
头像
欢迎您留下宝贵的见解!
提交
头像

昵称

取消
昵称表情代码图片

    暂无评论内容