12月1日:DeepSeek V3.2与Vidi2发布,AI模型能力持续突破

AI日报
2025年12月01日
95 阅读

12月1日,AI领域迎来多款重要模型更新。DeepSeek发布V3.2版本,强化Agent能力并实现推理与工具调用融合。字节跳动推出视频理解模型Vidi2,超越GPT-5与Gemini 3 Pro。阶跃星辰开源GELab-Zero,支持安卓设备端高效运行。

DeepSeek V3.2 正式版:强化 Agent 能力,融入思考推理

DeepSeek正式发布DeepSeek-V3.2版本,包含标准版和Speciale长思考增强版。标准版平衡推理能力与输出效率,达到GPT-5水平;Speciale版在IMO、ICPC等国际竞赛中斩获金牌,推理能力媲美Gemini-3.0-Pro。升级首次实现思考与工具调用融合,在Agent评测中达到开源模型最高水平。

字节视频模型Vidi2超越Gemini 3 Pro!理解能力爆表

字节跳动发布新一代视频理解模型Vidi2,在时空定位等核心任务上的表现超越GPT-5与Gemini 3 Pro。模型能精准理解数小时的长视频内容,直接生成包含剪辑时间点、字幕、配乐等细节的完整JSON剪辑方案,实现从原始素材到成片的AI自动化剪辑。

阶跃开源4B Agent模型GELab-Zero,跑通所有安卓设备

阶跃星辰开源GELab-Zero,推出4B参数GUI Agent模型GELab-Zero-4B-preview。模型在多项基准测试中取得同尺寸SOTA成绩,能流畅执行复杂与模糊指令。项目同步开源了完整的推理工程基建,支持一键部署、多设备任务分发,解决移动端Agent规模化落地的工程难题。

多款模型在推理、视频理解和移动端部署上取得突破,推动AI应用向更广泛场景延伸。

AI模型 DeepSeek Vidi2 Agent技术 移动端AI

相关新闻推荐

查看更多