AI前沿周刊 | 25年第49周模型升级与应用创新引领行业动态 - AI新闻详情

本周AI行业迎来多项重要更新，模型层方面，DeepSeek、字节跳动、阶跃星辰等公司发布或升级了多项AI模型，涵盖推理能力、视频理解、Agent能力等多个领域。应用层方面，LiblibAI、Runway、英伟达等公司推出或优化了视频生成、语音识别、数字人等产品，进一步提升用户体验。行业动态方面，Mistral AI开源新模型，Anthropic收购Bun公司，亚马逊云科技发布多项AI更新，商汤科技发布新架构，小红书收购点点，Pollo AI获融资，Google推出Workspace Studio，展现了行业持续的创新与整合。

模型层

DeepSeek V3.2 正式版：强化 Agent 能力，融入思考推理。 2025年12月01日，DeepSeek正式发布DeepSeek-V3.2版本，包含标准版和Speciale长思考增强版。标准版平衡推理能力与输出效率，达到GPT-5水平；Speciale版在IMO、ICPC等国际竞赛中斩获金牌，推理能力媲美Gemini-3.0-Pro。升级首次实现思考与工具调用融合，在Agent评测中达到开源模型最高水平。

字节视频模型Vidi2超越Gemini 3 Pro！理解能力爆表。 2025年12月01日，字节跳动发布新一代视频理解模型Vidi2，在时空定位等核心任务上的表现超越GPT-5与Gemini 3 Pro。模型能精准理解数小时的长视频内容，直接生成包含剪辑时间点、字幕、配乐等细节的完整JSON剪辑方案，实现从原始素材到成片的AI自动化剪辑。

阶跃开源4B Agent模型GELab-Zero，跑通所有安卓设备。 2025年12月01日，阶跃星辰开源GELab-Zero，推出4B参数GUI Agent模型GELab-Zero-4B-preview。模型在多项基准测试中取得同尺寸SOTA成绩，能流畅执行复杂与模糊指令。项目同步开源了完整的推理工程基建，支持一键部署、多设备任务分发，解决移动端Agent规模化落地的工程难题。

Mistral AI发布Mistral 3系列模型，全线回归Apache 2.0。 2025年12月03日，Mistral AI发布新一代Mistral 3系列模型，全线回归Apache 2.0开源协议。系列包括675B参数的Mistral Large 3混合专家模型，以及14B/8B/3B的Ministral 3边缘端模型。Large 3在3000台H200 GPU上训练，具备图像理解能力，在LMArena开源模型中排名第二。

商汤发布 NEO 架构，重新定义多模态模型效能边界。 2025年12月03日，商汤科技联合南洋理工大学发布全球首个原生多模态架构NEO，突破传统”视觉编码器+投影器+语言模型”的拼凑范式。架构通过原生图块嵌入、三维旋转位置编码和原生多头注意力三大创新，实现视觉与语言的深层融合。

英伟达拿出推理版VLA：Alpamayo-R1让自动驾驶AI更会动脑子。 2025年12月02日，英伟达发布推理版视觉-语言-行动模型Alpamayo-R1，为自动驾驶系统赋予因果推理能力。模型突破传统端到端系统在长尾场景中的局限，通过”因果链”数据集让车辆理解”为何这样驾驶”而非简单执行指令。三大创新包括结构化因果标注体系、扩散式轨迹解码器和多阶段训练策略。

Google推出Workspace Studio，赋能企业全员构建AI智能体。 2025年12月05日，Google正式发布Workspace Studio，是基于Gemini 3多模态能力的新一代自动化工具。用户无需编码即可快速设计、管理并共享AI智能体，实现从简单任务到复杂流程的自动化。

应用层

LiblibAI 上线「可灵O1」全能视频模型，速来体验。 2025年12月02日，LiblibAI全球首发「可灵O1」统一多模态视频模型，是首个将视频内容增删、风格重绘、镜头延展等多项任务融于一体的大一统模型。模型支持最多7张参考图像保持内容一致性，可通过自然语言指令智能编辑视频，具备视频参考生成能力。

Runway发布的最新视频生成AI模型Gen-4.5，代号”David”。 2025年12月02日，Runway正式发布Gen-4.5视频生成模型，该模型以”Whisper Thunder (aka) David”的匿名身份登上Artificial Analysis榜单首位。Gen-4.5在运动质量、提示词遵循度和视觉逼真度方面树立新标准，ELO评分达1247分，超越Veo 3/3.1、Kling 2.5和Sora 2 Pro等主流模型。具备精确的物理模拟能力、复杂的场景构建和电影级画面质感，支持多种控制模式。

PixVerse V5.5 来了！「导演级」音画同步一键生成。 2025年12月02日，PixVerse发布PixVerse V5.5视频生成模型，实现国内首个分镜与音频同步生成技术。模型具备”导演级”智能，可一键生成5秒、8秒或10秒的多镜头叙事单元，自动完成远景、中景、近景的自然切换。创新之处在于同步生成人声、环境声和情绪配音，使角色口型、动作与音频完美契合。

LiblibAI 上线 Seedream 4.5，一致性保持/多图参考能力全面升级！ 2025年12月04日，国产SOTA图像模型Seedream 4.5在LiblibAI平台正式上线。相比4.0版本，新模型在一致性保持、精准文本/版式渲染、多图参考生成和真实质感模拟方面能力显著升级，尤其擅长处理中文海报、营销物料等本土化内容，支持最多10+参考图融合。

可灵 2.6 全量上线！听见画面，看见声音。 2025年12月04日，可灵2.6全量上线，是其首个“音画同出”模型，能单次生成同时产出画面、自然语音、匹配音效及环境氛围。模型支持文生音画与图生音画两种创作路径，适配单人独白、旁白解说、多人对白、音乐表演及创意场景等多种应用。

豆包图像创作模型Seedream 4.5发布：聚焦商业生产力场景。 2025年12月04日，火山引擎发布豆包图像创作模型Seedream 4.5并开启公测。模型在主体一致性、指令遵循、空间逻辑及美学表现上显著提升，重点强化多图组合生成、海报排版与Logo设计能力，可精准满足广告营销、电商运营、影视制作等商业场景需求。

听得清，看得懂！豆包语音识别模型2.0来了。 2025年12月05日，火山引擎发布豆包语音识别模型2.0。模型基于Seed混合专家架构，通过PPO强化学习实现深度上下文推理，关键词召回率提升20%。新增多模态视觉识别能力，可结合图像内容精准分辨易混淆词（如“滑鸡”与“滑稽”），支持日语、韩语、德语等13种语言的精准识别。

可灵数字人 2.0 功能正式上线！不止会说，更会演！ 2025年12月05日，可灵全量上线数字人2.0版本，实现三大核心升级：表演力全面进化，支持精准的体态、手势与表情控制；口型与手部细节显著优化，增强真实感；单次生成视频时长延长至5分钟，覆盖科普、广告等长内容场景。

行业动态

Anthropic收购热门JavaScript工具链公司Bun。 2025年12月03日，Anthropic宣布收购热门JavaScript工具链公司Bun，交易金额未公开。Bun创始人Jarred Sumner因其工具被Claude Code等AI编程产品广泛使用，并看好Anthropic在AI编程领域的前景而选择加入。此次收购将Bun的高性能运行时和打包技术深度整合进Claude Code及未来AI工具，以提升性能与分发效率。Bun将保持开源并继续独立发展。

亚马逊云科技发布 Nova 2 系列 AI 模型等十大AI更新。 2025年12月03日，在AWS re:Invent大会上，亚马逊云科技发布十大AI更新：推出自研AI芯片Trainium4（性能提升6倍）及Trainium3服务器；第二代大模型Amazon Nova 2系列（Lite、Pro、Sonic、Omni）性能超越多款主流模型；Bedrock平台新增18款开源模型，包括阿里、Kimi等中国模型；推出AgentCore开发工具和四大智能体（如自主编程、安全运维），强化企业级AI应用。

小红书收购“点点”。 2025年12月04日，小红书全资收购上海生动诗章科技有限公司，正式将旗下AI搜索产品“点点”纳入集团体系。此次收购强化AI搜索能力，提升内容电商竞争力。收购后，小红书将加速AI战略落地，应对字节跳动、阿里等巨头竞争，优化用户行为路径，巩固内容生态。

AI视频生成产品 Pollo AI 获 1400 万美元融资。 2025年12月05日，AI视频生成平台Pollo AI近日完成1400万美元首轮融资，由高成资本领投，真格基金跟投。其创始人朱陈彪（阿彪）无大厂背景，凭借SEO经验推动产品早期增长，7个月月活超400万。目前平台注册用户超2000万，已实现盈亏平衡。

AI模型视频生成语音识别行业动态开源协议

AI前沿周刊 | 25年第49周模型升级与应用创新引领行业动态

模型层

应用层

行业动态

相关新闻推荐

AI前沿周刊 | 26年第4周百度发布2.4万亿参数文心大模型5.0

AI前沿周刊 | 26年第3周 OpenAI签下近700亿AI芯片巨单

AI前沿周刊 | 26年第2周 MiniMax港股上市创纪录

AI前沿周刊 | 26年第1周 Meta收购AI应用Manus

模型层

应用层

行业动态

相关新闻推荐

AI前沿周刊 | 26年第4周 百度发布2.4万亿参数文心大模型5.0

AI前沿周刊 | 26年第3周 OpenAI签下近700亿AI芯片巨单

AI前沿周刊 | 26年第2周 MiniMax港股上市创纪录

AI前沿周刊 | 26年第1周 Meta收购AI应用Manus

AI前沿周刊 | 26年第4周百度发布2.4万亿参数文心大模型5.0