排序
可灵AI 2.0视频生成模型全球发布
快手今日正式发布可灵 AI 2.0 视频生成模型及可图 2.0 图像生成模型,标志着其在 AIGC 领域的技术突破进入新阶段。作为全球首个支持多模态交互的视频生成大模型,可灵 2.0 通过 **Multi-modal V...
蚂蚁集团发布开源MoE模型Ling系列
蚂蚁集团 Ling 团队发布了技术成果论文,并开源了两款百灵系列 MoE 模型。具体信息如下:模型名称及参数:Ling-Plus:参数规模为 2900 亿,激活参数 288 亿。Ling-Lite:参数规模为 168 亿,激...
谷歌发布大模型Med-PaLM 3–AI辅助诊断进入临床
一、技术突破:从 “专科助手” 到 “全科医生”谷歌今日正式发布新一代医疗大模型 Med-PaLM 3,该模型在 2025 年美国医师执业考试(USMLE)中取得 91% 的准确率,较前作 Med-PaLM 2 的 86.5% ...
OpenAI宣布开源新一代语言模型
2025 年 4 月 1 日,OpenAI 首席执行官 Sam Altman 正式宣布,将在未来几个月内发布自 2019 年 GPT-2 以来的首款开源语言模型。这一决策标志着 OpenAI 从闭源战略向开源生态的重大转向,旨在通...
大模型架构革命:Meta Llama4开启混合专家时代
在人工智能技术迭代的快车道上,Meta 正以架构革新重新定义开源大模型的未来。4 月 23 日,这家社交巨头正式宣布下一代模型 Llama 4 将全面采用混合专家(MoE)架构,通过「分而治之」的策略突...
阿里发布多模态大模型QvQ-max与Qwen2.5-Omni
2025 年 3 月 27 日,阿里巴巴集团宣布推出两大重磅多模态 AI 模型 ——Qwen2.5-Omni与QVQ-Max,分别聚焦全模态交互与视觉推理领域,标志着其在 AI 技术布局上的 “全场景覆盖” 战略进入新阶段...
爱诗科技 PixVerse 多行业 AI 视频解决方案
一、核心技术与产品优势爱诗科技(AISI Technology)是一家专注于 AI 视频生成技术的创新企业,其旗舰产品PixVerse基于自研视频大模型,提供多模态输入(文本、图像、角色)到高质量视频的生成...
百度发布文心大模型4.5 Turbo及X1 Turbo
4 月 25 日,百度在武汉举办的 Create2025 AI 开发者大会上,正式发布文心大模型 4.5 Turbo 及深度思考模型 X1 Turbo,以 '多模态、强推理、低成本' 三大特性重新定义大模型行业标准。这两款模...
亚马逊推出 Nova Sonic 语音模型,低成本优势进军语音交互领域
4 月 9 日,亚马逊正式推出新一代生成式 AI 语音模型 Nova Sonic,在人工智能语音领域取得重大突破。这款创新模型能够原生处理语音输入并生成自然流畅的语音输出,在速度、语音识别准确率和对...
智谱华章发布全球首个支持汉字生成的开源文生图模型 CogView4
(2025 年 4 月 18 日,北京)北京智谱华章科技有限公司今日宣布,其自主研发的开源文生图模型 CogView4 在权威基准测试 DPG-Bench 中以综合评分 87.6 分登顶全球第一,成为首个支持生成汉字的...