AI前沿周刊 | 25年第46周 OpenAI发布GPT-5.1系列双版本
本周AI行业迎来多项重要进展,OpenAI发布GPT-5.1系列双版本,重点优化对话体验;百度文心大模型5.0正式发布,参数规模超2.4万亿;Meta推出覆盖1600+语言的语音识别系统Omnilingual ASR。此外,AI应用领域也有多项创新,包括堆友AI创作全能画布、OiiOii动画创作Agent系统等。行业动态方面,AI编程神器Cursor完成23亿美元D轮融资,估值达293亿美元。
模型层
堆友「全能画布」来了!是天花板级的AI设计智能体。 2025年11月10日,堆友AI反应堆正式上线AI创作全能画布,堆友用户可免费体验。堆友AI集成文生图、图生图、智能滤镜、矢量编辑、字体设计、高清放大、智能抠图、局部重绘等功能,提供一站式AI设计解决方案,实现从灵感到交付的全流程自动化。
OpenAI 推出 GPT-5-Codex-Mini:“经济高效型”AI 编程模型。 2025年11月10日,OpenAI推出GPT-5-Codex-Mini,是GPT-5-Codex的“经济高效型”版本。开发者可获得约4倍的使用额度。在SWE-bench Verified测试中,GPT-5-Codex-Mini得分71.3%。版本适用于轻量级工程任务或接近速率上限的情况。
字节发布Doubao-Seed-Code编程模型。 2025年11月11日,字节跳动正式推出Doubao-Seed-Code,专为复杂编程任务优化。模型支持256k长上下文,兼容Anthropic API与主流IDE,性能仅次于Claude Sonnet 4.5,综合使用成本降低62.7%,并登顶SWE-Bench Verified榜单。
月之暗面开源Kosong框架 降低AI AAgent开发门槛。 2025年11月11日,月之暗面(Moonshot AI)开源全新AI代理开发框架Kosong,以“简化复杂性、释放创造力”为核心理念,为下一代智能体应用提供轻量且高可扩展的底层支持。框架通过统一LLM抽象层,封装标准化组件并搭载异步工具编排引擎,有效解决工具碎片化、接口不兼容等开发痛点。
商汤日日新开源模型实现空间智能性能突破,多项评测领先 GPT-5。 2025年11月11日,商汤日日新在空间智能领域实现重要突破,正式发布并开源SenseNova-SI系列模型。在多项权威评测的空间理解和推理任务上,SenseNova-SI 不仅大幅度领先同量级开源多模态大模型,还超越了 GPT-5 和 Gemini 2.5 Pro 等国际顶尖闭源模型的表现。
Meta发布Omnilingual ASR:覆盖1600+语言的语音识别系统。 2025年11月11日,Meta AI团队推出Omnilingual ASR,是全球首个支持超1600种语言的自动语音识别系统,其中500种语言首次获得AI语音识别支持。系统通过大规模预训练模型和上下文学习技术,仅需少量音频-文本样本即可扩展新语言,字符错误率低于10%的语言占比达78%。
腾讯开源百亿参数模型KaLM-Embedding,登顶MTEB多语言榜单全球第一。 2025年11月12日,腾讯微信团队推出的KaLM-Embedding-Gemma3-12B-2511模型,在MTEB多语言通用Embedding模型权威评测中综合成绩位列全球第一。模型参数量达120亿,支持3840至64等多种向量维度,具备卓越的跨语言语义理解与检索能力,在多语言语义对齐、数据质量优化及训练策略创新方面表现突出,为多语言应用场景提供了强大的语义基础支持。
OpenAI 正式发布 GPT-5.1系列双版本,ChatGPT 情商大涨。 2025年11月13日,OpenAI发布的AI升级版本GPT-5.1,重点优化了对话体验而非单纯性能指标。新版本包含Instant和Thinking两大模型,前者更注重人性化交流(如自适应思考、八种风格预设),后者强化专业推理能力(简化术语表达)。相比前代,GPT-5.1在情感互动、指令理解上显著改善。
百度发布文心大模型 5.0:参数规模超 2.4 万亿,原生全模态。 2025年11月13日,百度在世界大会上正式发布文心大模型5.0。模型参数量达2.4万亿,采用原生全模态统一建模技术,支持文本、图像、音频、视频等多模态输入输出,在多模态理解、创意写作、指令遵循等方面表现突出,综合能力达全球领先水平。
李飞飞宣布正式开放首款商用世界模型产品 Marble。 2025年11月13日,“AI教母”李飞飞创立的World Labs公司正式推出首款商用多模态世界模型产品Marble,用户可通过文本、图像、视频或3D布局生成高保真、可编辑的3D虚拟世界,支持导出为高斯溅射、网格或视频格式。
应用层
百度AI眼镜开售!2199元,今天定明天到手。 2025年11月11日,百度旗下小度AI眼镜Pro正式开售,售价2299元,是继阿里巴巴夸克AI眼镜S1后,国内第二家正式开售AI眼镜的互联网大厂,小度AI眼镜Pro是一款AI拍摄眼镜,与小米AI眼镜类型相同,并非当下更为“完全体”版本的AI+AR眼镜,融合多模态AI大模型,产品功能包括拍照、听歌识曲、智能匹配歌单、AI翻译、AI识物、AI备忘、AI录音等。
全新升级、全面开放的 TRAE SOLO 正式版,限时免费。 2025年11月13日,字节旗下TRAE团队正式发布TRAE SOLO正式版。版本定位为“响应式编程智能体”,支持复杂项目开发,新增内置智能体SOLO CODER与SOLO BUILDER,具备上下文压缩、多任务并行、可视化工具调用等功能,可高效应对从0到1的项目搭建及从1到100的迭代优化,现面向全球用户开放,限时免费体验。
AI PPT神器 Gamma 完成6800万美元B轮融资。 2025年11月14日,美国生成式AI创企Gamma完成6800万美元B轮融资,估值达21亿美元。Gamma创立于2020年,是一个生成式AI设计平台,可快速创建演示文稿、文档和社交媒体帖子,支持22种AI图像模型和60多种语言。
AI编程神器Cursor(母公司Anysphere)完成23亿美元D轮融资。 2025年11月14日,AI编程神器Cursor(母公司Anysphere)完成23亿美元D轮融资,投后估值达293亿美元,成为全球首家估值超2000亿元人民币的AI编程创企。此轮融资由Accel和Coatue领投,英伟达、谷歌等跟投。过去一年,Anysphere估值增长超10倍,年化收入突破10亿美元。
Dexmal原力灵机融资近10亿元,阿里巴巴、蔚来资本分别领投。 2025年11月14日,具身智能公司Dexmal原力灵机宣布完成数亿元A+轮融资,阿里巴巴为独家投资方。此前其A轮融资由蔚来资本领投,两轮融资金额近10亿元。资金将用于智能机器人软硬件技术研发与落地。Dexmal专注于具身智能技术研发,自主研发的多模态具身智能大模型MMLA可实现跨场景智能泛化。
ChatGPT 群聊功能上线部分地区:人机共同决策讨论。 2025年11月14日,OpenAI宣布在韩国、新西兰等部分地区试点ChatGPT群聊功能。功能基于GPT-5.1模型,支持用户与ChatGPT共同协作,可邀请亲友或同事进入共享空间,用于策划方案、决策讨论或头脑风暴。
行业动态
华为投资物理AI:“极佳视界”完成新一轮亿元级 A1 轮融资。 2025年11月12日,极佳视界完成亿元级A1轮融资,由华为哈勃和华控基金联合投资,这是其在两个月内完成的第三轮融资。极佳视界的技术解决了物理AI领域数据稀缺和仿真误差等问题,其CEO预测“物理世界ChatGPT时刻”将在2-3年内到来。
ZOER.AI:主打“Database-First”的全栈AI应用构建平台。 2025年11月12日,Chat2DB 团队创始人姬朋飞及其团队正式发布主打“Database-First”(数据库优先)的全栈应用构建平台ZOER.AI,专注于解决传统 AI 编程工具在后端能力上的短板,通过智能设计数据库结构、自动生成安全的后端逻辑和前端界面,实现从数据层到底层服务的全流程自动化。
Lovart推出“元素拆分”功能 革新AI设计编辑体验。 2025年11月13日,AI设计平台Lovart正式上线“Edit Elements 元素拆分”功能,用户上传成品海报后,AI可自动拆解为文字、主体、背景等独立可编辑图层,支持修改文本、替换元素及实时预览。
登顶!GLM-4.6获LMArena代码榜全球并列第一。 2025年11月14日,全球权威 AI 评测平台 LMArena 更新 Code Arena (编程与代码生成) 专项榜单,智谱GLM-4.6与 Anthropic Claude、OpenAI GPT-5 等顶尖模型一同位列全球榜首。