Sonic – 腾讯联合浙大推出的音频驱动肖像动画框架

Sonic是什么 Sonic是腾讯和浙江大学推出的音频驱动肖像动画框架,基于全局音频感知生成逼真的面部表情和动作。Sonic基于上下文增强音频学习和运动解耦控制器...

Codev – AI应用开发平台,自然语言描述需求生成全栈代码

Codev是什么 Codev是 AI 驱动的全栈应用开发平台,帮助用户快速将想法转化为实际的 Web 应用。用户只需通过自然语言描述需求,平台可自动生成基于 Next.js 和...

StochSync – AI图像生成技术,为360°全景图和3D网格纹理生成高质量图像

StochSync是什么 StochSync(Stochastic Diffusion Synchronization)是创新的图像生成技术,专门用于在复杂空间(如360°全景图或3D表面纹理)中生成`。结合...

DeepRant 鲸喷 – 专为游戏玩家设计的多语言快捷翻译开源工具

DeepRant 鲸喷是什么 DeepRant 鲸喷是专为游戏玩家设计的多语言快捷翻译工具。DeepRant能帮助玩家在国际服务器中快速进行文字交流,消除语言障碍。玩家在游戏...

splash – AI音乐创作平台,输入文字自动生成对应旋律和演唱效果

splash是什么 splash 是专注于AI音乐创作与互动体验的创新平台。splash基于自主研发的AI技术,为用户提供丰富的音乐创作工具,包括文本转歌声、旋律创作等功...

HMA – MIT联合Meta等推出的机器人动作视频动态建模方法

HMA是什么 HMA(Heterogeneous Masked Autoregression)是麻省理工学院、Meta和伊利诺伊大学香槟分校开源的,用在建模机器人动作视频动态的方法。HMA基于异构...

Hibiki – Kyutai Labs 推出的实时语音翻译模型

Hibiki是什么 Hibiki是Kyutai Labs开源的用在同时语音翻译的解码器模型,能实时将一种语言的语音翻译成另一种语言的语音或文本。Hibiki基于多流语言模型架构...

EliGen – 浙大联合阿里推出的新型实体级可控图像生成框架

EliGen是什么 EliGen是浙江大学和阿里巴巴集团联合开发的新型的实体级可控图像生成框架,通过引入区域注意力机制,无需额外参数即可将实体提示和任意形状的空...

啵啵动漫 – AI视频转绘软件,普通视频一键转为动漫风格

啵啵动漫是什么 啵啵动漫是创新的AI视频转绘软件,专为动漫爱好者设计。能将普通视频一键转换为动漫风格,提供多种动漫模板和风格供用户选择,轻松实现从现实...

AlphaGeometry2 – 谷歌 DeepMind 推出解决复杂几何问题的AI系统

AlphaGeometry2是什么 AlphaGeometry2 是谷歌 DeepMind 推出的先进的人工智能系统,专门用于解决国际数学奥林匹克竞赛(IMO)中的几何问题。结合了神经符号方...
1 209 210 211 212 213 473