Ola – 清华联合腾讯等推出的全模态语言模型
Ola是什么 Ola是清华大学、腾讯 Hunyuan 研究团队和新加坡国立大学 S-Lab 合作开发的全模态语言模型。通过渐进式模态对齐策略,逐步扩展语言模型支持的模态,...
MUSIC.AI – AI音乐创作和音频处理平台,支持音频分离、混音、歌词处理等功能
MUSIC.AI是什么 MUSIC.AI 是专注于AI音乐创作和音频处理的平台,基于先进的 AI 技术为音乐人、制作人和企业提供高效、高质量的音频解决方案。MUSIC.AI支持音...
BlipCut – 在线AI视频翻译工具,支持130多种语言
BlipCut是什么 BlipCut是基于 AI 技术的在线视频翻译工具,能将视频内容快速翻译成130多种语言,同时支持字幕生成、配音和唇形同步等功能。用户只需上传视频...
Project Padawan – GitHub推出的自主软件工程智能体
Project Padawan是什么 Project Padawan 是 GitHub 推出的自主软件工程智能体项目,能基于 AI 技术实现软件开发流程的高度自动化。Project Padawan能自动处理...
Copilot Edits – GitHub Copilot推出的智能代码编辑功能
Copilot Edits是什么 Copilot Edits是GitHub Copilot推出的新功能,基于AI技术提升代码编辑效率。Copilot Edits支持开发者在Visual Studio Code中用自然语言...
Agno – 用于构建多模态智能体的轻量级框架
Agno是什么 Agno是构建智能代理(Agents)的轻量级框架。Agno 支持多模态(文本、图像、音频、视频)和多代理协作,能快速创建代理,速度比 LangGraph 快 500...
Agentic Object Detection – 吴恩达团队推出的Agent目标检测技术
Agentic Object Detection是什么 Agentic Object Detection 是吴恩达团队开发的新型目标检测技术,通过智能代理(Agent)系统实现无需标注数据的目标检测。用...
ImageToPromptAI – AI图像转文本提示词工具,快速生成与图像相关的细节描述
ImageToPromptAI是什么 ImageToPromptAI 是在线 AI 工具,能将图像转化为详细文本提示。用户上传图片后,ImageToPromptAI能快速生成与图像相关的文字描述,提...
PartEdit – KAUST推出的细粒度图像编辑方法
PartEdit是什么 PartEdit是KAUST推出基于预训练扩散模型的细粒度图像编辑方法。PartEdit基于优化特定的文本标记(称为“部分标记”),让扩散模型精准定位和编...
BEN2 – 自动从图像和视频中移除背景深度学习模型
BEN2是什么 BEN2(Background Erase Network 2)是Prama LLC开发的深度学习模型,专门用于从图像和视频中快速移除背景并提取前景。基于创新的置信度引导抠图...