标签:[db:标签]
BabyVision – UniPat AI团队推出的多模态理解评测集
BabyVision是什么 BabyVision是 UniPat AI团队推出的多模态理解评测集,评估多模态语言模型(MLLMs)和图像生成模型在视觉推理任务上的表现。包含两个主要赛...
VidBee – 开源音视频下载工具,支持YouTube、Bilibili平台
VidBee是什么 VidBee 是开源的视频下载工具,基于强大的 yt-dlp 引擎开发。工具能帮助用户轻松下载全球 1000 多个网站的音视频内容,包含热门的 YouTube、Bil...
GLM-Image – 智谱联合华为开源的多模态图像生成模型
GLM-Image是什么 GLM-Image 是智谱联合华为开源的新一代多模态图像生成模型,基于昇腾 Atlas 800T A2 设备和昇思 MindSpore 框架训练,是首个全流程国产芯片...
Baichuan-M3 – 百川智能开源的新一代医疗增强大语言模型
Baichuan-M3是什么 Baichuan-M3是百川智能正式发布的新一代开源医疗增强大语言模型。模型在问诊能力、医疗幻觉控制以及Healthbench和Healthbench Hard评测中...
Engram – DeepSeek联合北大推出的条件记忆模块
Engram是什么 Engram 是DeepSeek团队联合北京大学推出的条件记忆模块,能提升大语言模型(LLM)的性能。Engram通过引入现代化的 -gram 嵌入表,将静态知识存...
Anthropic 用 AI“写”智能体,Claude 仅短短一周半时间做出编程助手 Cowork
1 月 14 日消息,Anthropic 推出的新型工作智能体 Cowork,几乎是由 Claude 亲自“写出来”的。据《商业内幕》报道,这一过程,正在成为 AI 编程工具大幅压缩产...
Vidu 上线 AI 一键生成 MV 功能:只需提供音乐 + 参考图 + 指令,其余交给“虚拟制片厂”
1 月 14 日消息,今天下午,生数科技通过官方公众号宣布,Vidu AI 开放平台上线“一键生成 MV”功能。该工具是一个深度协同的多智能体(Multi-Agent)系统。用...
谷歌 Veo 3.1 视频 AI 模型发布:强化场景一致性、支持 9:16 纵向比例适配移动端
1 月 14 日消息,谷歌现已推出了 Veo 3.1 视频模型,主要在场景一致性、移动端尺寸方面进行改进。据介绍,Veo 3.1 的“Image Ingredients(图像要素)”生成视...
消息称阿里千问明天将有“重磅产品迭代”,C 端月活用户已破亿
1 月 14 日消息,今天上午,《科创板日报》独家获悉,上线两个月,千问 C 端(消费者端)月活跃用户数已突破 1 亿,在学生和白领人群中增长迅猛。据多位行业...
微软研报称 DeepSeek 在中国 AI 市场份额达 89%,在白俄罗斯达 56%
1 月 13 日消息,《金融时报》今天(1 月 13 日)发布博文,报道称微软总裁布拉德 · 史密斯(Brad Smith)表示,称中国正凭借“低成本开源模型 + 政府高额补贴...