NVIDIA 发布 Nemotron-H 硬件平台

 

image

 


2025 年 3 月 26 日,NVIDIA 在 GTC 2025 技术大会上正式推出全新 Nemotron-H 硬件平台,这一专为代理式 AI(Agentic AI)与多模态应用设计的异构计算系统,标志着人工智能硬件进入 “场景化智能” 新阶段。该平台集成了 Blackwell Ultra 架构 GPU、量子级互联技术及定制化加速模块,为企业级 AI 智能体开发、机器人控制及实时决策系统提供了突破性解决方案。


硬件架构革新:突破算力与能效边界
Nemotron-H 基于 Blackwell Ultra 架构打造,采用双芯片封装设计,集成两颗 5nm 工艺的 Blackwell GPU 与 Grace CPU,搭配 12 层堆叠的 HBM3e 显存,实现 288GB 显存容量与 1.8TB/s 的 NVLink 互联带宽。其 FP4 精度推理性能达 1.1 ExaFLOPS,较前代 Hopper 架构提升 68 倍,能效比突破 3.5 倍。平台支持第五代 NVLink 与 Spectrum-X 800G 硅光交换机,可构建万卡级 AI 集群,单机柜节点间通信延迟降至微秒级,满足大规模分布式推理需求。


多模态计算引擎:重塑人机交互范式
针对视觉语言模型(VLM)与物理模拟的特殊需求,Nemotron-H 新增专用计算模块:


  • Omniverse 加速单元:支持实时 3D 场景渲染与物理仿真,为机器人路径规划、自动驾驶决策提供毫米级精度模拟。
  • 时序建模引擎:集成 Mamba 神经算子,可处理超长序列数据,在视频理解、语音交互等场景中实现 20 倍推理速度提升。
  • 量子近似优化器:通过量子计算预训练模型参数,将复杂优化问题求解效率提高两个数量级。


软件生态协同:构建端云一体智能体开发闭环
NVIDIA 同步发布 Nemotron-H 专属软件栈:


  1. NIM 微服务框架:将 Llama Nemotron 70B、Cosmos Nemotron 等模型轻量化部署,支持在单台 RTX 50 系列 PC 上实现企业级推理。
  2. AIQ Agent 蓝图:提供欺诈检测、供应链优化等 12 个行业模板,开发者可通过低代码平台快速构建定制化智能体。
  3. Dynamo 推理引擎:通过自动模型压缩与分布式调度,使大模型部署成本降低 90%,推理吞吐量提升 5 倍。


行业应用落地:开启智能体工业化时代
目前,Nemotron-H 已在多个领域实现商业化验证:


  • 机器人领域:傅利叶智能通过该平台驱动人形机器人 GR-1,实现复杂环境下的动态路径规划与多任务协同。
  • 自动驾驶:Mobileye 基于 Nemotron-H 构建城市级世界模型,将决策延迟从 80ms 缩短至 15ms。
  • 企业服务:SAP Joule 平台接入 Llama Nemotron Super 49B 模型,为全球 500 万用户提供实时业务流程优化建议。


NVIDIA CEO 黄仁勋表示:“Nemotron-H 不仅是硬件的迭代,更是 AI 生产力的革命。它让每个开发者都能像组装乐高一样构建智能体,推动 AI 从通用工具向垂直场景渗透。” 随着 Rubin 架构(2026 年)与量子计算模块的集成,NVIDIA 正加速实现 “算力无限、智能无处不在” 的愿景。
© 版权声明
THE END
您的赞美是我们持续创作/分享的动力,欢迎点赞/分享/关注。
点赞26 分享
评论 抢沙发
头像
欢迎您留下宝贵的见解!
提交
头像

昵称

取消
昵称表情代码图片

    暂无评论内容