11月25日:Claude Opus 4.5突破编程测试,AMD训练大模型引关注

AI日报
2025年11月25日
50 阅读

11月25日,AI行业迎来多项技术进展。Anthropic发布Claude Opus 4.5,在编程测试中表现突出;腾讯混元开源OCR模型HunyuanOCR,性能领先;AMD联合IBM训练出首个纯AMD硬件大模型ZAYA1;OpenAI推出购物研究工具;微软发布开源小模型Fara-7B,支持Win11端侧运行。

Anthropic发布新一代大模型Claude Opus 4.5

Anthropic发布新一代大模型Claude Opus 4.5,在编程能力上实现重大突破,成为首个在SWE-Bench Verified真实软件工程测试中得分超过80%的模型,并在八种编程语言的七种中排名第一。核心升级包括对模糊需求的精准理解、复杂Bug自主定位能力,以及创新的”effort”参数控制系统,可在保证性能的同时大幅降低token消耗。

混元OCR模型宣布开源,参数仅1B,多项核心能力SOTA

腾讯混元开源轻量级OCR模型HunyuanOCR,参数仅1B却在多项核心能力上达到SOTA水平。模型基于混元原生多模态架构,采用端到端设计,在复杂文档解析基准OmniDocBench中获得94.1分,超越Gemini 3 Pro等主流模型。

挑战英伟达:首个纯 AMD 硬件训练的 AI 大模型 ZAYA1 登场

AMD携手IBM和AI初创公司Zyphra,历时1年多,成功使用AMD硬件训练出首个大型混合专家(MoE)基础模型ZAYA1。模型完全基于AMD硬件生态系统构建,训练过程在IBM云上进行,使用AMD Instinct MI300X GPU等技术。训练集群由128个节点组成,总计1024块GPU,性能超750 PFLOPs。

OpenAI 为ChatGPT推出免费AI购物研究工具

OpenAI为ChatGPT推出全新“购物研究”功能,替代传统电商平台与内容社区的消费决策流程。功能基于GPT-5 mini模型优化,通过交互式提问理解用户偏好,结合记忆功能生成个性化购买指南,并直接提供商品链接与可视化对比界面。

微软推出全新的开源小型语言模型 Fara-7B

微软发布首款专为电脑操作设计的开源智能体小模型Fara-7B,由70亿参数构成,支持Win11端侧运行,性能领先同级。模型通过视觉解析网页截图,执行点击、输入等操作,无需依赖额外可访问性树或多个大模型协作。微软构建全新合成数据生成流程模拟网页任务,Fara-7B基于Qwen2.5-VL-7B底座,支持128k上下文。

多领域技术突破表明,AI模型正向更高效、更轻量化和更垂直应用方向发展。

AI模型 大模型 OCR AMD 开源

相关新闻推荐

查看更多