12月8日:GLM-4.6V与混元2.0齐发,多模态与推理能力再升级

AI日报
2025年12月08日
248 阅读

12月8日,AI领域迎来多款重磅模型发布。智谱AI开源GLM-4.6V系列多模态大模型,支持视觉工具调用与128K长上下文处理;美团推出LongCat-Image图像生成模型,在中文文本生成与编辑可控性上达开源SOTA;腾讯混元2.0上线,406B参数规模搭配256K上下文,推理效率与复杂任务表现领先。与此同时,美国AI法律科技公司Harvey完成1.6亿美元F轮融资,估值达80亿美元,持续拓展AI在专业领域的落地深度。

智谱正式上线并开源 GLM-4.6V 系列多模态大模型

智谱AI正式上线并开源GLM-4.6V系列多模态大模型,包括106B和9B两个版本。模型原生支持基于视觉输入自主调用工具,可处理图文混排、识图购物等复杂任务。其128K长上下文窗口能理解长达150页的文档或1小时视频内容,在代码前端复刻等方面能力提升。

美团发布 LongCat-Image 图像生成模型,编辑能力登顶开源SOTA

美团发布并开源LongCat-Image图像生成模型,以6B参数在文生图和图像编辑能力上逼近更大模型。技术亮点包括:采用同源架构与渐进学习,在图像编辑可控性上达到开源SOTA;通过课程学习与字符级编码,显著提升中文文字生成的覆盖度与精准度;结合数据筛选与对抗训练,增强图像真实感。

混元2.0上线:推理能力与效率业界领先

腾讯发布混元大模型最新版混元2.0,包含Think与Instruct两个版本。模型采用混合专家架构,总参数406B,支持256K上下文窗口。其在数学、科学、代码等复杂推理任务上表现优异,综合能力位居国内第一梯队。通过优化训练策略,模型在保持高准确率的同时显著降低思维链长度,推理效率领先。

AI法律科技公司Harvey又获新融资(F轮),估值560亿!

美国AI法律科技公司Harvey宣布完成1.6亿美元F轮融资,估值达80亿美元。公司由前谷歌DeepMind研究员和顶级律所律师于2022年创立,专注于“AI+法律”领域,法律AI平台包含AI助理、文档库等功能,已与美国百强律所中的50家合作。Harvey已获7轮融资,总融资额超9.6亿美元,OpenAI创业基金、谷歌风投等多次参与投资。

多模态理解、长上下文处理与垂直领域应用成为当前AI发展的核心方向。

多模态大模型 推理能力 图像生成 开源模型 AI法律科技

相关新闻推荐

查看更多