​亚马逊推出Nova Act智能体技术

2025 年 3 月 31 日,亚马逊正式推出Nova Act,这是一款具备自主网页浏览器操作能力的 AI 智能体,旨在通过自动化执行日常任务(如订餐、预约、表单填写等)提升用户效率。以下是该技术的核心信息与行业影响:

image

 

核心功能与技术特性

  1. 网页操控能力
    Nova Act 可模拟人类行为,自主浏览网页、填写表单、选择日期等,无需依赖传统 API 接口。其混合架构结合了自然语言理解与屏幕交互技术,支持复杂网页结构(如下拉菜单、弹窗)的处理。
  2. 开发者生态构建
    配套的Nova Act SDK允许开发者快速构建智能体原型,提供任务分解工具(如将复杂流程拆解为 “搜索 – 下单 – 支付” 等原子指令),并支持人工介入节点的自定义配置,以增强可靠性。
  3. 性能表现
    亚马逊宣称 Nova Act 在内部基准测试中表现优异:在衡量屏幕文本交互能力的ScreenSpot Web Text测试中得分 94%,超越 OpenAI 的 CUA 模型(88%)和 Anthropic 的 Claude 3.7 Sonnet(90%)。但尚未公开其在行业通用标准(如 WebVoyager)中的成绩。

战略布局与技术背景

  1. AGI 实验室的首个成果
    Nova Act 由亚马逊旧金山 AGI 实验室研发,该实验室由前 OpenAI 研究员 David Luan(曾创立 Adept)和机器人专家 Pieter Abbeel 共同领导。团队认为智能体是实现通用人工智能(AGI)的关键步骤,目标是构建 “能协助用户完成计算机上任何任务的 AI 系统”。
  2. 与 Alexa + 的协同
    Nova Act 未来将为亚马逊下一代生成式 AI 语音助手 Alexa+ 提供核心能力,使其从单纯对话升级为可执行任务的 “数字助理”,覆盖智能家居、电商等场景。
© 版权声明
THE END
您的赞美是我们持续创作/分享的动力,欢迎点赞/分享/关注。
点赞49 分享
评论 抢沙发
头像
欢迎您留下宝贵的见解!
提交
头像

昵称

取消
昵称表情代码图片

    暂无评论内容