PoseTalk – 文本和音频驱动的生成会说话的头部动画开源项目
PoseTalk是什么 PoseTalk 是基于文本和音频的姿势控制和运动细化方法的开源项目,用于一次性生成会说话的头部视频。从图像、驱动音频和驱动姿势合成说话人脸...
Nemotron-Mini-4B-Instruct – 英伟达推出的开源小型语言模型
Nemotron-Mini-4B-Instruct是什么 Nemotron-Mini-4B-Instruct是英伟达推出的一款开源小型语言模型,专为角色扮演、检索增强生成(RAG)和函数调用任务优化。...
Speechnotes – AI在线语音转文字工具,支持音视频转录,智能自动大写
Speechnotes是什么 Speechnotes是在线AI语音转文字工具,支持音频和视频转录、翻译及语音输入笔记。具备语音命令、自动大写、易于导入导出等特点,提供便捷的...
M2UGen – 腾讯联合国立大学推出多模态音乐理解和生成框架
M2UGen是什么 M2UGen是先进的多模态音乐理解和生成框架,由腾讯PCG ARC实验室与新加坡国立大学联合推出。结合了大型语言模型(LLM)的能力,能处理包括文本、...
Sunoify – AI音乐创作平台,支持文字、图片、表情符号等生成个性化的音乐
Sunoify是什么 Sunoify是AI驱动的音乐创作平台,使用先进的人工智能技术将文字、表情符号、图片或产品网址转化为个性化的音乐作品。用户可以通过简单的界面选...
Chillin – AI在线视频编辑工具,无缝结合AE和Pr的核心功能
Chillin是什么 Chillin是AI驱动的在线视频编辑器,融合了After Effects和Premiere Pro的功能,提供无缝的非线性视频编辑和矢量动画制作。支持Lottie和Svg格式...
AI解说大师 – AI影视剪辑工具,自动生成原创解说视频
AI解说大师是什么 AI解说大师是专注于短剧赛道的AI内容创意生产平台,基于先进的AI技术,为创作者提供高效、便捷的影视解说视频制作服务。让用户能轻松生成原...
Seed-Music – 字节跳动推出的AI音乐生成大模型
Seed-Music是什么 Seed-Music是字节跳动推出的AI音乐生成大模型,将用户录制的 10 秒音频转化为完整的音乐作品。通过自回归语言模型和扩散方法,根据用户的多...
FaceSwap – 开源的在线AI换脸工具,深度伪造视频和图像
FaceSwap是什么 FaceSwap 是一个开源的AI换脸软件,用于创建深度伪造(Deepfakes)视频和图像。基于深度学习技术,在视频或图片中将一个人的脸替换成另一个人...
Claude Dev – AI编程助手,基于Claude 3.5 Sonnet模型
Claude Dev是什么 Claude Dev是一个集成在Visual Studio Code中的AI编程助手,基于Anthropic公司的Claude 3.5 Sonnet模型,为开发者提供自动化的编程支持。Cl...