12月5日:可灵数字人升级,谷歌Gemini 3公测,Pollo AI获千万融资

AI日报
2025年12月05日
156 阅读

12月5日,AI行业迎来多项进展。可灵数字人2.0上线,提升表演力与视频时长;谷歌推出Gemini 3 Deep Think模式,强化复杂推理能力;AI视频生成平台Pollo AI完成1400万美元融资,用户规模持续扩大。Google Workspace Studio也同步发布,推动企业AI应用普及。

听得清,看得懂!豆包语音识别模型2.0来了

火山引擎发布豆包语音识别模型2.0。模型基于Seed混合专家架构,通过PPO强化学习实现深度上下文推理,关键词召回率提升20%。新增多模态视觉识别能力,可结合图像内容精准分辨易混淆词(如“滑鸡”与“滑稽”),支持日语、韩语、德语等13种语言的精准识别。

可灵数字人 2.0 功能正式上线!不止会说,更会演!

可灵全量上线数字人2.0版本,实现三大核心升级:表演力全面进化,支持精准的体态、手势与表情控制;口型与手部细节显著优化,增强真实感;单次生成视频时长延长至5分钟,覆盖科普、广告等长内容场景。

谷歌公测“奥数金牌级”推理 AI 模型 Gemini 3 Deep Think

谷歌面向Gemini Ultra订阅用户(月费249.99美元)正式公测Gemini 3 Deep Think模式。模式采用并行推理技术,调用更多计算资源,在复杂数学、科学及逻辑问题中表现突破:在Humanity’s Last Exam测试中取得41%高分,GPQA Diamond测试达93.8%。

AI视频生成产品 Pollo AI 获 1400 万美元融资

AI视频生成平台Pollo AI近日完成1400万美元首轮融资,由高成资本领投,真格基金跟投。其创始人朱陈彪(阿彪)无大厂背景,凭借SEO经验推动产品早期增长,7个月月活超400万。目前平台注册用户超2000万,已实现盈亏平衡。

Google推出Workspace Studio,赋能企业全员构建AI智能体

Google正式发布Workspace Studio,是基于Gemini 3多模态能力的新一代自动化工具。用户无需编码即可快速设计、管理并共享AI智能体,实现从简单任务到复杂流程的自动化。

AI技术在内容生成、推理能力与企业应用方面持续深化,行业生态加速成熟。

数字人 谷歌Gemini AI视频生成 企业AI 融资

相关新闻推荐

查看更多