AI前沿周刊 | 25年第47周 千问APP上线与Grok 4.1发布引领AI新潮流
本周AI行业迎来多项重大进展,千问APP正式上线,成为全球首款开源AI助手,挑战ChatGPT;马斯克旗下xAI公司发布Grok 4.1,通用能力碾压其他模型;陈天桥团队推出开源记忆系统EverMemOS,解决AI记忆断裂问题。此外,字节跳动发布通用AI智能体Lumine,谷歌推出最强AI模型Gemini 3,OpenAI发布最强编程模型GPT-5.1-Codex-Max。行业动态方面,Anthropic获微软英伟达千亿投资,估值飙至2.5万亿;AI音乐平台Suno完成2.5亿美元C轮融资;AI视频创企Luma AI获9亿美元C轮融资。
模型层
陈天桥盛大团队,推出最强开源记忆系统EverMemOS。 2025年11月17日,陈天桥领导的盛大团队推出的开源长期记忆操作系统EverMemOS,专为AI智能体设计,解决大语言模型因固定上下文窗口导致的记忆断裂问题。该系统基于人类大脑记忆机制,采用四层架构(代理层、记忆层、索引层、接口层),在LoCoMo和LongMemEval-S评测中以92.3%和82%的高分超越行业标杆。
马斯克Grok 4.1低调发布!通用能力碾压其他一切模型。 2025年11月18日,马斯克旗下xAI公司发布的最新AI对话模型Grok 4.1,主打情感智能与实用性能的突破。模型在LMArena排行榜以1483分登顶,比第二名高出31分,并首创”思考模式”与”即时模式”双轨设计——即使不启动深度推理,基础版本仍能超越其他模型的完整配置。
谷歌正式发布新一代多模态大模型Gemini 3。 2025年11月19日,谷歌正式发布新一代多模态大模型Gemini 3,在多项基准测试中表现卓越,以1501 Elo得分位列LMArena竞技场第一。模型具备原生多模态理解、高级推理及Agent编程能力,支持100万token上下文窗口,在学术推理、数学、代码开发等任务上显著领先前代及竞品。
OpenAI 发布最强编程模型 GPT-5.1-Codex-Max。 2025年11月20日,OpenAI发布GPT-5.1-Codex-Max编程模型,取代GPT-5.1-Codex,成为Codex集成界面上默认模型。模型在多个编程基准测试中超越谷歌Gemini 3 Pro,如SWE-Bench Verified测试中准确率77.9%,领先对方1.7个百分点。其引入“压缩”机制,可连续工作超24小时,token效率提升约30%。
腾讯混元发布全新视频生成模型:HunyuanVideo 1.5。 2025年11月21日,腾讯混元开源视频生成模型HunyuanVideo 1.5,参数仅8.3B却可生成5-10秒高清视频。模型基于DiT架构,支持中英文文生视频与图生视频,具备强指令理解能力,可精准控制运镜、人物表情及物理运动。原生支持480p/720p输出,经超分可提升至1080p,并在14G显存消费级显卡即可流畅运行,大幅降低使用门槛。
小米具身大模型 MiMo-Embodied 发布并全面开源。 2025年11月21日,小米发布业界首个打通自动驾驶与具身智能的跨域大模型MiMo-Embodied并全面开源。模型统一了具身智能三大核心任务与自动驾驶三大关键任务,实现室内交互与道路决策能力的双向知识迁移。在29项核心基准测试中表现卓越,全面超越现有开源及专用模型。
应用层
千问APP正式上线:全球首款开源AI助手挑战ChatGPT。 2025年11月17日,阿里巴巴正式推出千问APP,基于Qwen最强模型打造,全面对标ChatGPT。APP依托Qwen开源生态,全球下载量超6亿次,支持119种语言,具备智能调度多应用、多模态交互等能力,成为全球用户的AI生产力工具。
字节发布首个实时完成复杂任务的3D开放世界通用AI智能体Lumine。 2025年11月17日,字节跳动Seed团队发布Lumine,是首个能在3D开放世界中实时完成小时级复杂任务的通用AI智能体。基于视觉语言模型,通过端到端架构统一感知、推理与行动,仅靠屏幕图像和键盘鼠标操作,无需游戏内部API。
蚂蚁集团推出全模态通用AI助手“灵光”APP。 2025年11月18日,蚂蚁集团正式上线全模态通用AI助手灵光APP,以结构化思维生成逻辑清晰、可视化的内容,如动态3D模型、可交互地图等,让知识呈现更生动;用户通过自然语言描述,30秒内即可生成个性化AI应用,搭载AGI相机技术,通过实时视频流解析物理世界,支持文生图/视频、图生图/视频创作,能对物体、场景进行识别与知识讲解。
AiPPT Agent版上线,AI「深度研究」功能开启内测。 2025年11月19日,AiPPT正式推出Agent版的「深度研究」功能并邀请用户内测。功能模拟真人分析师工作流程,通过“理解-反思-追问”循环,自动完成从全网深度搜索、逻辑梳理到生成图文并茂研究报告和PPT的全过程。
Meta推出基于SAM系列的3D重建模型SAM 3D。 2025年11月20日,Meta发布SAM 3D与SAM 3模型,实现从2D图像到3D重建的重大突破。SAM 3D包含物体场景重建和人体姿态估计双模型,通过创新数据引擎生成近百万张图像的3D标注数据,在多项基准测试中超越现有方法。
行业动态
DPAI Arena:首个开源AI编程基准测试平台发布。 2025年11月17日,JetBrains联合Linux基金会推出DPAI Arena,是全球首个开源、多语言、多框架的AI编程智能体基准测试平台。客观衡量AI工具在真实软件开发任务中的效率提升,填补行业空白,支持补丁修复、代码审查等多样化工作流的可复现评估。
谷歌推出 AI 天气预报模型 WeatherNext 2。 2025年11月18日,谷歌DeepMind发布的最新AI天气预报模型WeatherNext 2,运算速度比前代快8倍,能生成1小时分辨率的精准预测。模型通过功能生成网络(FGN)技术,在1分钟内即可完成传统超算需数小时的全球15天天气模拟,可输出数百种可能的天气情景。
Anthropic获微软英伟达千亿投资!估值飙到2.5万亿。 2025年11月19日,Anthropic获微软、英伟达千亿投资,微软投资50亿美元,英伟达投资100亿美元,合计150亿美元。Anthropic承诺购买价值300亿美元的Azure算力,并与英伟达深度合作优化模型性能。Claude模型将登陆微软Azure,成为全球三大云平台均可用的前沿模型。
AI音乐创作平台Suno完成2.5亿美元C轮融资。 2025年11月20日,AI音乐平台Suno完成2.5亿美元C轮融资,估值达24.5亿美元,较去年增长近五倍。本轮由Menlo Ventures领投,英伟达旗下NVentures等机构跟投。Suno核心产品可通过文字生成完整歌曲,最新v5版本显著提升人声自然度与指令执行准确率。
64亿!AI视频黑马Luma AI获新融资,要建2GW智算集群。 2025年11月20日,AI视频创企Luma AI完成9亿美元C轮融资,估值达40亿美元。本轮由沙特公共投资基金旗下Humain领投,资金将用于开发多模态AI系统及建设2GW智算集群”Project Halo”。
星动纪元获近10亿元A+轮融资!吉利资本领投,总订单额破5亿。 2025年11月20日,人形机器人公司星动纪元完成近10亿元A+轮融资,由吉利资本领投。公司总订单额突破5亿元,物流领域最大单笔订单近5000万元,海外业务占比达50%。本轮融资将加速技术迭代与商业化落地。
蚂蚁集团领投,RockFlow完成数千万美元新一轮融资。 2025年11月21日,新加坡AI金融科技公司RockFlow完成数千万美元融资,由蚂蚁集团领投。公司推出全球首款金融交易AI Agent“Bobby”,能通过自然语言理解用户投资意图,自主完成从数据分析到实时交易的全流程。本轮融资将加速AI技术在金融服务领域的创新应用,推动复杂金融服务向普惠化、个性化发展。
谷歌发布专业级图像生成模型Nano Banana Pro。 2025年11月21日,谷歌发布专业级图像生成模型Nano Banana Pro,深度集成Gemini 3多模态能力。模型支持2K/4K高分辨率输出,可融合多达14张参考图像并保持5个人物一致性,具备精准局部编辑、多语言文字渲染及电影级调光控色功能。结合Gemini 3的知识推理与搜索引擎,能生成高准确性信息图表。