琴乐大模型 – 腾讯推出的AI音乐创作大模型

琴乐大模型是什么 琴乐大模型是由腾讯AI Lab与腾讯TME天琴实验室共同研发的人工智能音乐创作大模型,该模型通过输入中英文关键词、描述性语句或音频,能够直...

Unique3D – 清华大学团队开源的图像到3D生成模型

Unique3D是什么 Unique3D是清华大学团队开源的一个单张图像到3D模型转换的框架,通过结合多视图扩散模型和法线扩散模型,以及一种高效的多级上采样策略,能够...

谷歌DeepMind推出V2A技术,可为无声视频添加逼真音效

在人工智能领域,谷歌旗下的DeepMind公司再次取得突破性进展,推出了一款名为V2A(Video-to-Audio,视频到音频)的AI模型。该项技术能够将视频像素与文本提示...

Gen-3 Alpha – Runway公司最新推出的AI视频生成模型

Gen-3 Alpha是什么 Gen-3 Alpha是AI视频初创公司Runway最新发布的新一代AI视频生成模型,通过大规模多模态训练基础设施,显著提升了视频的保真度、一致性和动...

Hallo – 复旦百度等开源的AI对口型肖像视频生成框架

Hallo是什么 Hallo是由复旦大学、百度公司、苏黎世联邦理工学院和南京大学的研究人员共同提出的一个AI对口型肖像图像动画技术,可基于语音音频输入来驱动生成...

阶跃星辰推出移动端AI智能问答助手跃问APP

AI工具集 6月14日消息,由微软前全球副总裁姜大昕所创办的人工智能初创公司阶跃星辰日前宣布上线其AI智能问答助手跃问的移动端APP,用户可在苹果App Store和...

MimicBrush – 阿里等开源的AI图像编辑融合框架

MimicBrush是什么 MimicBrush是由阿里巴巴、香港大学和蚂蚁集团的研究人员推出的AI图像编辑融合框架,允许用户通过简单的操作,在源图像上指定需要编辑的区域...

Stability AI开源Stable Diffusion 3 Medium文生图模型

6月12日晚间消息,人工智能初创公司Stability AI宣布正式开源发布其最新的文本到图像生成模型——Stable Diffusion 3 Medium(SD3 Medium)。Stable Diffusion ...

国家网信办发布第六批深度合成服务算法备案信息,腾讯混元等492个算法在列

6月12日消息,国家网信办今日发布公告,根据《互联网信息服务深度合成管理规定》,现公开发布第六批境内深度合成服务算法备案信息。 《互联网信息服务深度合...

ToonCrafter – 腾讯等开源的卡通动画视频插帧工具

ToonCrafter是什么 ToonCrafter是由腾讯AI实验室、香港中文大学和香港城市大学的研究人员开源的卡通动画视频中间帧生成工具,突破了传统卡通动画制作中线性运...
1 537 538 539 540 541 555