AI工具 | 第 539 页

Toucan TTS – 免费开源的文本转语音工具，支持超7000种语言

Toucan TTS是什么 Toucan TTS是由德国斯图加特大学自然语言处理研究所（IMS）开发的文本到语音合成工具箱，支持超过7000种语言，包括多种方言和变体。Toucan ...

AI工具

1年前 (2025)

ExVideo – 阿里和华东师大推出的AI视频长度扩展调优技术

ExVideo是什么 ExVideo是由阿里巴巴和华东师大的研究人员推出的一种视频合成模型的后调优技术，能够扩展现有视频合成模型的时间尺度，以生成更长和帧数更多的...

AI工具

1年前 (2025)

Diffutoon – 阿里推出的AI将视频转卡通风格的框架

Diffutoon是什么 Diffutoon是由阿里巴巴和华东师大的研究人员推出的一个将视频转换为卡通动漫风格的AI框架，基于扩散模型的可编辑卡通着色技术，能够将真实感...

AI工具

1年前 (2025)

国内外12个AI生成图片的软件和网站，智能创作图像和绘画

人工智能让生成式AI模型有了快速发展，可以创建真实和精美的图像。AI图片生成、AI绘画工具使用深度学习算法分析和复制图像的模式和风格，生成令人惊叹、逼真...

AI工具

1年前 (2025)

琴乐大模型 – 腾讯推出的AI音乐创作大模型

琴乐大模型是什么琴乐大模型是由腾讯AI Lab与腾讯TME天琴实验室共同研发的人工智能音乐创作大模型，该模型通过输入中英文关键词、描述性语句或音频，能够直...

AI工具

1年前 (2025)

Unique3D – 清华大学团队开源的图像到3D生成模型

Unique3D是什么 Unique3D是清华大学团队开源的一个单张图像到3D模型转换的框架，通过结合多视图扩散模型和法线扩散模型，以及一种高效的多级上采样策略，能够...

AI工具

1年前 (2025)

谷歌DeepMind推出V2A技术，可为无声视频添加逼真音效

在人工智能领域，谷歌旗下的DeepMind公司再次取得突破性进展，推出了一款名为V2A（Video-to-Audio，视频到音频）的AI模型。该项技术能够将视频像素与文本提示...

AI工具

1年前 (2025)

Gen-3 Alpha – Runway公司最新推出的AI视频生成模型

Gen-3 Alpha是什么 Gen-3 Alpha是AI视频初创公司Runway最新发布的新一代AI视频生成模型，通过大规模多模态训练基础设施，显著提升了视频的保真度、一致性和动...

AI工具

1年前 (2025)

Hallo – 复旦百度等开源的AI对口型肖像视频生成框架

Hallo是什么 Hallo是由复旦大学、百度公司、苏黎世联邦理工学院和南京大学的研究人员共同提出的一个AI对口型肖像图像动画技术，可基于语音音频输入来驱动生成...

AI工具

1年前 (2025)

阶跃星辰推出移动端AI智能问答助手跃问APP

AI工具集 6月14日消息，由微软前全球副总裁姜大昕所创办的人工智能初创公司阶跃星辰日前宣布上线其AI智能问答助手跃问的移动端APP，用户可在苹果App Store和...

AI工具

1年前 (2025)

Toucan TTS – 免费开源的文本转语音工具，支持超7000种语言

ExVideo – 阿里和华东师大推出的AI视频长度扩展调优技术

Diffutoon – 阿里推出的AI将视频转卡通风格的框架

国内外12个AI生成图片的软件和网站，智能创作图像和绘画

琴乐大模型 – 腾讯推出的AI音乐创作大模型

Unique3D – 清华大学团队开源的图像到3D生成模型

谷歌DeepMind推出V2A技术，可为无声视频添加逼真音效

Gen-3 Alpha – Runway公司最新推出的AI视频生成模型

Hallo – 复旦百度等开源的AI对口型肖像视频生成框架

阶跃星辰推出移动端AI智能问答助手跃问APP

搜索

热门文章

热门网址