排序
阿里发布多模态大模型QvQ-max与Qwen2.5-Omni
2025 年 3 月 27 日,阿里巴巴集团宣布推出两大重磅多模态 AI 模型 ——Qwen2.5-Omni与QVQ-Max,分别聚焦全模态交互与视觉推理领域,标志着其在 AI 技术布局上的 “全场景覆盖” 战略进入新阶段...
爱诗科技 PixVerse 多行业 AI 视频解决方案
一、核心技术与产品优势爱诗科技(AISI Technology)是一家专注于 AI 视频生成技术的创新企业,其旗舰产品PixVerse基于自研视频大模型,提供多模态输入(文本、图像、角色)到高质量视频的生成...
亚马逊推出 Nova Sonic 语音模型,低成本优势进军语音交互领域
4 月 9 日,亚马逊正式推出新一代生成式 AI 语音模型 Nova Sonic,在人工智能语音领域取得重大突破。这款创新模型能够原生处理语音输入并生成自然流畅的语音输出,在速度、语音识别准确率和对...
谷歌发布最强模型 Gemini 2.5 Pro
2025 年 3 月 26 日,谷歌正式推出人工智能领域的最新里程碑 ——Gemini 2.5 Pro。这款被称为 '史上最智能模型' 的产品,凭借突破性的推理能力与多模态交互技术,在多个权威基准测试中刷新纪录...
阿里云发布Qwen3大模型,中文能力超越GPT-4o
据报道,阿里云计划于 2025 年 4 月第二周发布 Qwen3 大模型。该模型重点优化了推理效能,在中文 QA 和数学推理任务表现上超越 GPT-4o。 Qwen3 模型将兼容国产算力芯片,并重点用于推动政务、...
英伟达与MIT联合发布HART混合模型
2025 年 3 月,英伟达(NVIDIA)与麻省理工学院(MIT)联合发布了HART(Hybrid Autoregressive Transformer,混合自回归转换器),这一创新模型通过融合自回归模型与扩散模型的优势,实现了图像...
OpenAI推迟GPT-5发布,推出过渡模型o3/o4-mini
2025 年 4 月 5 日,OpenAI 首席执行官山姆・奥特曼(Sam Altman)在社交媒体 X 上宣布,GPT - 5 将在几个月内发布,而此前的 o3 和 o4 - mini 模型将在几周内推出。此次调整的原因主要有以下几...
通义千问 QwQ-32B 推理模型开源:32B 尺寸实现性能突破,消费级显卡可本地部署
3 月 6 日,阿里云正式发布并开源全新的推理模型通义千问 QwQ-32B。该模型通过大规模强化学习,在数学、代码及通用能力上实现了质的飞跃,整体性能比肩全球最强开源推理模型 DeepSeek-R1。同时...
Anthropic 发布 Claude 3 Haiku 模型
2024 年 3 月,人工智能公司 Anthropic 正式发布 Claude 3 系列模型,其中 Claude 3 Haiku 作为 “中杯” 型号,以其卓越的性价比和性能表现引发行业关注。该模型在保持低成本和高速度的同时,...
iOS 18.4 即将发布:苹果 AI 支持中文
3 月 25 日,苹果向用户推送了 iOS 18.4 RC 更新。RC 版本即候选版本,通常若无重大问题,将于近期推送成正式版,预计 4 月初 iOS 18.4 正式版将与所有用户见面。 本次 iOS 18.4 更新亮点颇多。...