10月16日：谷歌视频生成模型升级，多厂商发力AI工具创新

10月16日，AI行业迎来多项技术更新，谷歌推出视频生成模型Veo 3.1，提升音频与叙事控制能力；讯飞星火升级深度研究功能，增强内容生成与输出能力；通义千问上线Qwen Chat Memory，强化对话连贯性。同时，豆包发布多款大模型，提升语音与代码生成效率，Anthropic推出Claude Haiku 4.5，性能提升且价格下调。

谷歌推出新款视频生成模型 Veo 3.1

谷歌发布AI视频生成模型Veo 3.1，带来更丰富的音频、叙事控制及逼真的质感还原。Veo 3.1在Veo 3基础上，提升提示词遵循度，增强视听质量。其驱动的AI电影创作工具Flow更新，支持原生音频生成，用户可将静态图像转视频、整合多图像元素、延展视频时长等，实现更精细的视频编辑与颗粒化控制。

讯飞星火升级的「深度研究」全新上线

讯飞星火“深度研究”功能全新升级，实现底层思维链路、信息融合与内容呈现的全方面进化。功能通过多轮思考和搜索迭代，深度理解用户意图，提升内容质量；支持输出高质量图片，新增HTML网页导出与一键转PPT功能；结合外部搜索信源和本地文档，实现个性化思考。

通义千问正式推出 Qwen Chat Memory 功能

Qwen Chat Memory正式上线，赋予了Qwen“长记忆”能力。能理解上下文、保留重要信息并回忆过往对话，使交流更具延续性。让Qwen在对话中主动关联过往互动，更好地理解用户需求，为用户提供更个性化的服务。

豆包发布四款大模型：能理解情感、调节音调风格、准确读出公式

火山引擎全新发布和升级了四款豆包大模型，包括豆包大模型1.6升级版、豆包大模型1.6 lite、豆包语音合成模型2.0和豆包声音复刻模型2.0。豆包大模型1.6升级版原生支持四种思考长度，是国内首个原生支持“分档调节思考长度”的模型，可平衡效果、时延和成本。豆包大模型1.6 lite更轻量、推理速度更快、性价比更高。

Anthropic 发布了 Claude Haiku 4.5，速度翻倍价格大砍

Anthropic发布了Claude Haiku 4.5模型。模型在保持高性能的同时，速度翻倍且价格大幅降低。在SWE-bench Verified测试集中，Haiku 4.5取得了73%的成绩，与Claude Sonnet 4和OpenAI的GPT-5处于同一水平线，在某些任务上甚至超过Sonnet 4。

阿里Qoder产品家族再增一员，Qoder CLI 将智能拓展到终端

阿里推出全新AI编程工具Qoder CLI，专为命令行环境打造的AI Coding Agent。集成顶尖编程模型，设计轻量级Agent框架，具备强大代码生成与理解能力，同时降低内存消耗和命令响应时间，提升开发效率。Qoder CLI无需复杂初始化，安装即用，支持文件编辑、命令运行等功能，并可通过MCP扩展或自定义开发工具。

智元精灵 G2 新一代工业级交互式具身作业机器人发布

智元机器人发布新一代工业级交互式具身作业机器人——智元精灵G2。机器人以工业标准打造，搭载NVIDIA Jetson Thor芯片，配备高精度力控双臂和19自由度的灵巧手，具备3D触觉感知和5自由度腰腿搭配全向底盘。支持多人连续语音对话与知识库问答，采用双电池热插拔换电技术，配备360环视鱼眼和前后双激光雷达，可主动避障。

AI工具持续向更智能、更高效方向演进，多厂商在不同场景中深化技术应用。

AI视频生成大模型升级对话系统语音合成编程工具

谷歌推出新款视频生成模型 Veo 3.1

讯飞星火升级的「深度研究」全新上线

通义千问正式推出 Qwen Chat Memory 功能

豆包发布四款大模型：能理解情感、调节音调风格、准确读出公式

Anthropic 发布了 Claude Haiku 4.5，速度翻倍价格大砍

阿里Qoder产品家族再增一员，Qoder CLI 将智能拓展到终端

智元精灵 G2 新一代工业级交互式具身作业机器人发布

相关新闻推荐

12月8日：GLM-4.6V与混元2.0齐发，多模态与推理能力再升级

12月5日：可灵数字人升级，谷歌Gemini 3公测，Pollo AI获千万融资

12月4日：国产图像模型升级，AI搜索与音画生成同步发力

12月3日：Mistral 3回归开源，亚马逊云发布Nova 2系列