4 月 27 日,在清华大学建校 114 周年之际,国内大模型领域领军企业智谱 AI(Z.ai)与视频生成技术先锋生数科技(shengshu.com)正式签署战略合作协议。作为清华系人工智能企业的深度协同案例,双方将依托各自在大语言模型与多模态生成领域的技术积累,在联合研发、产品联动、行业解决方案整合等层面展开全方位合作,共同推动国产 AI 技术在垂直场景的规模化落地。
根据协议内容,智谱 AI 旗下 MaaS(模型即服务)平台将全面接入生数科技自主研发的视频大模型 Vidu API。这一融合将为开发者和企业客户提供 “文本 – 视频” 全链路生成能力:通过智谱 GLM 大模型的自然语言理解与逻辑推理优势,结合 Vidu 在视频生成领域的行业领先技术,用户可实现从创意构思到视频产出的端到端智能化生产。例如,输入 “中式园林四季变换” 的文本描述,系统将自动生成包含多镜头切换、光影变化和自然元素动态的 1080P 高清视频,整个过程仅需数分钟。
生数科技 CEO 骆怡航在签约仪式上表示:”Vidu 作为国内首个纯自研视频大模型,已在影视、广告、动漫等领域实现规模化应用。此次与智谱 AI 的合作,将打通大语言模型与视频生成的技术壁垒,为企业提供 ‘ 一键式 ‘ 视频内容生产解决方案。” 他透露,Vidu 的核心技术突破在于首创的 “主体参照” 功能,能够在视频生成过程中保持人物、物体的一致性,这一技术已成功应用于电影《熊猫计划》的角色动画制作。
智谱 AI CEO 张鹏指出,此次合作是其 “大模型生态战略” 的重要落地。作为国内首个实现千亿参数模型商用的企业,智谱 AI 的 MaaS 平台已服务超过百万开发者,覆盖政务、金融、医疗等 20 余个行业。”接入 Vidu API 后,平台将形成 ‘ 文本 – 图像 – 视频 ‘ 多模态能力矩阵,帮助企业构建更具沉浸感的智能应用。” 张鹏举例称,某文旅企业通过智谱 MaaS 平台调用 Vidu 技术,已实现景区虚拟导览视频的自动化生成,成本降低 70%。
技术层面,Vidu 的 U-ViT 架构采用扩散模型与 Transformer 融合技术,支持 4 秒视频片段 30 秒极速生成,同时具备多风格化(写实 / 动漫)、时空一致性、物理世界模拟等核心能力。其 “中国元素理解” 功能可精准生成熊猫、敦煌壁画等文化符号,在文旅、教育等领域具有独特价值。而生数科技与清华大学联合研发的多模态控制技术,更可实现对视频中人物动作、场景布局的精细化调整,满足影视级创作需求。
在行业应用层面,双方将重点聚焦六大领域:
- 政企服务:打造智能政务视频生成系统,实现政策解读、会议纪要的可视化转换
- 广告营销:基于商品图片自动生成多版本广告视频,支持主体一致性与动态展示
- 影视动漫:提供虚拟角色动画、分镜头脚本生成等工具,降低创作门槛
- 文化旅游:构建景区虚拟导览、历史场景复原等沉浸式体验方案
- 广电媒体:开发智能新闻视频生成系统,实现实时资讯的动态可视化
- 教育科研:生成教学动画、实验模拟等内容,助力知识传播创新
值得关注的是,智谱 AI 的 MaaS 平台已在上海张江模力社区落地 “模型池”,为垂类企业提供低成本模型调用服务。此次合作后,该平台将新增视频生成能力,进一步完善 “大模型 + 行业” 生态。生数科技则通过接入智谱的 GLM 模型,可在视频生成中融入更精准的语义理解,例如根据新闻文本自动生成匹配的视频内容。
业内人士指出,此次合作标志着国产大模型从通用能力向垂直场景的深度渗透。随着智谱 AI 与百度智能云、华为云等生态伙伴的合作深化,以及生数科技 Vidu API 在影视、广告领域的快速落地,双方的技术协同有望加速 AIGC 产业的规模化发展,为中国人工智能产业的全球竞争力提升注入新动能。
© 版权声明
本站内容文章版权归作者所有,未经允许请勿转载,如转载必须注明出处。
THE END
暂无评论内容