AI前沿周刊 | 25年第45周 全模态模型与企业级AI解决方案

AI周报
2025年11月09日
119 阅读

本周AI行业迎来多项重要进展,全模态模型、企业级AI解决方案及AI医疗融资成为焦点。美团LongCat团队发布并开源LongCat-Flash-Omni模型,阿里通义千问Qwen3-Max上线深度思考模式,OpenAI与亚马逊达成380亿美元算力合作,软银与OpenAI成立合资公司,推出企业级AI解决方案。此外,AI视频创作平台SkyReels焕新上线,零一万物与开源中国联合推出OAK平台,360推出FG-CLIP2登顶全球最强图文跨模态模型,银河通用发布NavFoM大模型,AI医疗独角兽Hippocratic AI完成8亿融资。

模型层

LongCat-Flash-Omni 正式发布并开源:开启全模态实时交互时代。 2025年11月03日,美团 LongCat 团队正式发布并开源LongCat-Flash-Omni模型。模型基于 LongCat-Flash 系列架构,集成多模态感知与语音重建模块,总参数达 5600 亿,激活参数 270 亿,实现低延迟实时音视频交互。

阿里通义千问Qwen3-Max上线深度思考模式。 2025年11月03日,阿里 Qwen 团队宣布Qwen3-Max Thinking在 Qwen Chat 上线。模型是万亿参数的 MoE 模型,曾在 AIME25、HMMT25 数学测试中获满分。用户可在 Qwen Chat 中选择该模型并开启 Thinking 模式,免费体验。

360发布:FG-CLIP2登顶全球最强图文跨模态模型。 2025年11月05日,360 推出的FG-CLIP2模型在图文跨模态领域取得重大突破。模型在八大类任务、29 项测试中全面超越 Google 与 Meta,成为目前最强的图文跨模态 VLM 模型。FG-CLIP2 能实现像素级的图像理解,精准识别细节,如毛发、斑点、色彩等,具备强大的中英文细粒度理解能力。

银河通用发布环视导航基座大模型 NavFoM。 2025年11月05日,银河通用联合多所高校推出全球首个跨本体全域环视导航基座大模型NavFoM。支持全场景、多任务、跨本体,可适配多种机器人形态,如机器狗、轮式人形等。NavFoM 通过创新的 TVI Tokens 和 BATS 策略,实现时空理解与高效算力利用,基于庞大训练数据体系,其在多个国际基准上达 SOTA 水平,可直接部署于真实机器人,无需任务微调。

科大讯飞星火 X1.5 深度推理大模型发布。 2025年11月06日,科大讯飞在2025全球1024开发者节上发布讯飞星火X1.5深度推理大模型。模型基于全国产算力,攻克MoE模型全链路训练效率,端到端性能达国际竞品93%以上。其语言理解、文本生成等能力对标国际主流大模型,数学能力国际领先,多语言能力支持130多种语言,性能达GPT-5的95%以上。

阶跃星辰开源首个 LLM 级音频编辑大模型Step-Audio-EditX。 2025年11月07日,阶跃星辰团队开发的首个开源大语言模型驱动的音频编辑工具Step-Audio-EditX,专注于通过迭代方式控制音频的情感、说话风格和副语言特征。核心技术采用大规模合成数据训练,无需依赖嵌入式先验或辅助模块,能实现零样本文本转语音功能。

应用层

AI视频创作平台SkyReels正式焕新上线。 2025年11月04日,昆仑万维旗下AI视频创作平台SkyReels焕新上线。其Web端与移动端APP全面登陆,聚合全球顶尖AI多模态模型,提供图片生成、视频生成、数字人、音乐生成等多种创作方式。SkyReels V3模型更新,新增无限画布、数字人、模板功能、专家Agent、视频延长和风格化等能力,让专业创作更简单。

即梦无限画布上线,创作更自由。 2025年11月06日,即梦AI上线无限画布,提供更自由的创作空间。新功能包括无限空间、Agent共创、多会话并行和多模态创作。用户可自由延展画布,轻松处理复杂项目;通过对话即创作,一句话生成灵感;一个项目可开启多个会话并行创作;支持图片和视频等多类型素材混合创作,实现一体化完成。

美团推出出AI IDE编程工具:CatPaw。 2025年11月07日,美团发布AI编程工具CatPaw,支持Python、Java等主流语言,具备实时代码补全、问答生码、预览调试及项目级分析功能,目前兼容macOS,Windows版将上线。新用户注册获500次免费对话额度,旨在提升开发效率。

行业动态

OpenAI与亚马逊达成380亿美元算力合作。 2025年11月04日,OpenAI与亚马逊宣布达成合作,OpenAI将在未来7年向亚马逊采购价值380亿美元(约合人民币2704.6亿元)的云计算服务。亚马逊云科技将为OpenAI提供亚马逊弹性计算云超级服务器,预计明年年底前部署完毕。

零一万物联合开源中国推出OAK平台“Open AgentKit”。 2025年11月04日,零一万物与开源中国联合发布“Open AgentKit平台”(OAK),打造Agent世界的“生态适配器”。OAK平台支持多种开源大模型,提供一站式解决方案,助力开发者实现“Agent开发自由”。平台四大核心模块,包括OAK Framework、Builder、Runtime和Studio,将逐步推出并邀请社区共建。

软银与 OpenAI 宣布成立合资公司,明年推出企业级 AI 解决方案。 2025年11月06日,软银集团与OpenAI宣布成立合资公司“SB OAI Japan”,计划于2026年推出企业级AI解决方案“Crystal Intelligence”。该方案将结合OpenAI技术与定制化服务,助力日本企业提升生产力和管理效率。软银将率先部署该技术,积累经验后向其他企业推广。

AI医疗独角兽Hippocratic AI完成8亿融资,估值250亿。 2025年11月05日,美国生成式AI医疗独角兽Hippocratic AI完成1.26亿美元C轮融资,估值达35亿美元,较年初翻超一倍。此轮融资由谷歌母公司Alphabet旗下CapitalG等参投,资金将用于并购、产品开发和拓展国际业务等。

AI大牛刘威视频创业公司Video Rebirth,完成5000万美元融资。 2025年11月07日,AI视频初创公司Video Rebirth宣布完成5000万美元种子轮融资,投资方包括启明创投、韩国游戏公司Actoz Soft等。公司由前腾讯杰出科学家刘威创立,致力于打造“视频原生的世界模型”,计划于12月发布1.0版本产品,目标是为专业创作者提供高保真、高可控性的视频生成平台,挑战现有市场格局。

全模态模型 企业级AI 生成式AI 开源平台 跨模态技术

相关新闻推荐

查看更多