智谱AI 与清华系生数科技达成战略协同-牛仔AI

4 月 27 日，在清华大学建校 114 周年之际，国内大模型领域领军企业智谱 AI（Z.ai）与视频生成技术先锋生数科技（shengshu.com）正式签署战略合作协议。作为清华系人工智能企业的深度协同案例，双方将依托各自在大语言模型与多模态生成领域的技术积累，在联合研发、产品联动、行业解决方案整合等层面展开全方位合作，共同推动国产 AI 技术在垂直场景的规模化落地。

根据协议内容，智谱 AI 旗下 MaaS（模型即服务）平台将全面接入生数科技自主研发的视频大模型 Vidu API。这一融合将为开发者和企业客户提供 “文本 – 视频” 全链路生成能力：通过智谱 GLM 大模型的自然语言理解与逻辑推理优势，结合 Vidu 在视频生成领域的行业领先技术，用户可实现从创意构思到视频产出的端到端智能化生产。例如，输入 “中式园林四季变换” 的文本描述，系统将自动生成包含多镜头切换、光影变化和自然元素动态的 1080P 高清视频，整个过程仅需数分钟。

生数科技 CEO 骆怡航在签约仪式上表示：”Vidu 作为国内首个纯自研视频大模型，已在影视、广告、动漫等领域实现规模化应用。此次与智谱 AI 的合作，将打通大语言模型与视频生成的技术壁垒，为企业提供 ‘ 一键式 ‘ 视频内容生产解决方案。” 他透露，Vidu 的核心技术突破在于首创的 “主体参照” 功能，能够在视频生成过程中保持人物、物体的一致性，这一技术已成功应用于电影《熊猫计划》的角色动画制作。

智谱 AI CEO 张鹏指出，此次合作是其 “大模型生态战略” 的重要落地。作为国内首个实现千亿参数模型商用的企业，智谱 AI 的 MaaS 平台已服务超过百万开发者，覆盖政务、金融、医疗等 20 余个行业。”接入 Vidu API 后，平台将形成 ‘ 文本 – 图像 – 视频 ‘ 多模态能力矩阵，帮助企业构建更具沉浸感的智能应用。” 张鹏举例称，某文旅企业通过智谱 MaaS 平台调用 Vidu 技术，已实现景区虚拟导览视频的自动化生成，成本降低 70%。

技术层面，Vidu 的 U-ViT 架构采用扩散模型与 Transformer 融合技术，支持 4 秒视频片段 30 秒极速生成，同时具备多风格化（写实 / 动漫）、时空一致性、物理世界模拟等核心能力。其 “中国元素理解” 功能可精准生成熊猫、敦煌壁画等文化符号，在文旅、教育等领域具有独特价值。而生数科技与清华大学联合研发的多模态控制技术，更可实现对视频中人物动作、场景布局的精细化调整，满足影视级创作需求。

在行业应用层面，双方将重点聚焦六大领域：

政企服务：打造智能政务视频生成系统，实现政策解读、会议纪要的可视化转换
广告营销：基于商品图片自动生成多版本广告视频，支持主体一致性与动态展示
影视动漫：提供虚拟角色动画、分镜头脚本生成等工具，降低创作门槛
文化旅游：构建景区虚拟导览、历史场景复原等沉浸式体验方案
广电媒体：开发智能新闻视频生成系统，实现实时资讯的动态可视化
教育科研：生成教学动画、实验模拟等内容，助力知识传播创新

值得关注的是，智谱 AI 的 MaaS 平台已在上海张江模力社区落地 “模型池”，为垂类企业提供低成本模型调用服务。此次合作后，该平台将新增视频生成能力，进一步完善 “大模型 + 行业” 生态。生数科技则通过接入智谱的 GLM 模型，可在视频生成中融入更精准的语义理解，例如根据新闻文本自动生成匹配的视频内容。

业内人士指出，此次合作标志着国产大模型从通用能力向垂直场景的深度渗透。随着智谱 AI 与百度智能云、华为云等生态伙伴的合作深化，以及生数科技 Vidu API 在影视、广告领域的快速落地，双方的技术协同有望加速 AIGC 产业的规模化发展，为中国人工智能产业的全球竞争力提升注入新动能。

本站内容文章版权归作者所有，未经允许请勿转载，如转载必须注明出处。

THE END