AI工具 | 第 133 页

InternVideo2.5 – 上海 AI Lab 联合南大、中科院开源的视频多模态大模型

InternVideo2.5是什么 InternVideo2.5是上海人工智能实验室联合南京大学、中科院深圳先进技术研究院共同开源的视频多模态大模型。在视频理解领域取得了显著进...

AI工具

10个月前

PDF to Podcast是什么 PDF to Podcast是NVIDIA推出的PDF转音频的AI工具，基于NVIDIA NIM微服务架构的，能将PDF文档转换为生动的音频内容，如播客。基于大型语...

AI工具

10个月前

TPO是什么 TPO（Test-Time Preference Optimization）是新型的AI优化框架，在推理阶段对语言模型输出进行动态优化，更符合人类偏好。TPO通过将奖励信号转化为...

AI工具

10个月前

HUGWBC是什么 HUGWBC（Humanoid Unified and General Whole-Body Controller）是上海交通大学、上海AI Lab联合推出的人形机器人全身控制器，能实现精细的运动...

AI工具

10个月前

Webdone是什么 Webdone 是基于人工智能的在线平台，帮助用户快速创建和定制高质量的落地页和网站。通过强大的 AI 技术，让用户只需简单描述产品或需求，可在...

AI工具

10个月前

YAYI-Ultra是什么 YAYI-Ultra （雅意）是中科闻歌研发的企业级大语言模型的旗舰版本，具备强大的多领域专业能力和多模态内容生成能力。支持数学、代码、金融...

AI工具

10个月前

TurboTTS是什么 TurboTTS 是免费的在线文本转语音工具，支持70多种语言和300多种真实语音选择，能生成自然、逼真的语音效果，适用于短视频创作、在线教育、广...

AI工具

10个月前

InspireMusic是什么 InspireMusic 是阿里巴巴通义实验室开源的音乐生成技术，通过人工智能为用户生成高质量的音乐作品。基于多模态大模型技术，支持通过简单...

AI工具

10个月前

Zonos是什么 Zonos是Zyphra推出的高保真文本到语音（TTS）模型。Zonos包含两个模型：16亿参数的Transformer模型和SSM混合模型，均在Apache 2.0许可下开源。Zo...

AI工具

10个月前

VideoCaptioner是什么 VideoCaptioner（中文名：卡卡字幕助手）是基于大语言模型（LLM）的智能字幕处理工具，能简化视频字幕的生成与优化流程。VideoCaptione...

AI工具

10个月前