Whisk – 谷歌推出的 AI 图像生成工具

Whisk是什么 Whisk 是谷歌推出的 AI 图像生成工具,支持用户上传图像指定生成图像的主题、场景和风格,无需长文本提示。用户能为每个类别提供多张图像,或用...

Apollo – Meta 联合斯坦福大学推出的大型多模态模型

Apollo是什么 Apollo是Meta和斯坦福大学合作推出的大型多模态模型(LMMs),专注于视频理解。Apollo基于系统研究,揭示视频理解在LMMs中的关键驱动因素,推出...

RDT – 清华开源的双臂机器人扩散基础模型

RDT是什么 RDT(Robotics Diffusion Transformer)是清华大学AI研究院TSAIL团队推出的全球最大的双臂机器人操作任务扩散基础模型。RDT具备十亿参数量,能在无...

AI考研宝典 – 百度文库推出的智能学习助手

AI考研宝典是什么 AI考研宝典是百度文库推出的智能学习助手,专为考研学生打造。AI考研宝典集成AI拍图写作、智能问答、文档总结、时政速记、英语作文美化等功...

Veo 2 – 谷歌 DeepMind 推出的 AI 视频生成模型,支持高达 4K 分辨率

Veo 2是什么 Veo 2 是 Google DeepMind 推出的 AI 视频生成模型,能根据文本或图像提示生成高质量视频内容。Veo 2支持高达 4K 分辨率的视频制作,理解镜头控...

TwinMind – AI浏览器助手,实时分析浏览器内容、提供建议和自动撰写邮件等功能

TwinMind是什么 TwinMind 是智能AI侧边栏助手,基于理解用户的视觉和听觉输入提升工作效率。支持无缝集成至用户喜爱的平台,提供实时转录和内容理解功能。Twi...

Megrez-3B-Omni – 无问芯穹开源的端侧全模态理解模型

Megrez-3B-Omni是什么 Megrez-3B-Omni是无问芯穹推出的全球首个端侧全模态理解开源模型,能处理图像、音频和文本三种模态数据。Megrez-3B-Omni在多个主流测试...

ShowBiz AI – AI视频创作平台,从文案、分镜脚本、编辑的全流程AI赋能

ShowBiz AI是什么 ShowBiz AI 是当虹科技推出的专业级AI视频创作平台,基于BlackEye多模态视听大模型,专为视频创作而设计。ShowBiz AI具备文本转动画的能力...

YouMind – AI内容整理和创作平台,快速从网页、视频、播客等来源中提取信息

YouMind是什么 YouMind是AI驱动的内容整理和创作平台,支持用户从网页、视频、播客等多种来源中提取和保存信息,将信息转化为创意作品。YouMind基于Anthropic...

CosyVoice 2.0 – 阿里开源的语音生成大模型

CosyVoice 2.0是什么 CosyVoice 2.0 是阿里巴巴通义实验室推出的CosyVoice语音生成大模型升级版,模型用有限标量量化技术提高码本利用率,简化文本-语音语言...
1 326 327 328 329 330 520