AI工具

TrackGo – 先进的可控AI视频生成技术

TrackGo是什么 TrackGo是一种先进的可控AI视频生成技术,通过用自由形状的遮罩和箭头,为用户提供了一种灵活而精确的机制来控制视频中对象的运动。技术的核心...

Sapiens – Meta推出的AI视觉模型,能理解图片和视频中的人类动作

Sapiens是什么 Sapiens是Meta实验室推出的AI视觉模型,专为理解图片和视频中的人类动作设计。支持二维姿势预估、身体部位分割、深度估计和表面法线预测等任务...

eSearch – 开源的AI桌面应用,截屏、OCR、搜索、翻译、录屏

eSearch是什么 eSearch是一款开源的跨平台AI桌面应用,集成了截屏、OCR识别、搜索翻译、贴图、以图搜图和屏幕录制等功能。eSearch基于Electron框架开发,适用...

Bark – Suno AI 推出的开源文本到音频模型

Bark是什么 Bark是Suno AI 推出的开源文本到音频模型,能生成逼真的多语言语音和多种音频类型,包括音乐、背景噪音等,同时支持非语言交流如笑声和哭泣。Bark...

Imagine Yourself – Meta公司推出的个性化AI图像生成模型

Imagine Yourself是什么 Imagine Yourself 是Meta公司推出的个性化AI图像生成模型,突破了传统方法的局限,无需对每个用户进行单独调整,通过单一模式即可满...

StockBot – 基于Llama3的AI金融Agent,提升股票投资效率

StockBot 是什么 StockBot 是一个基于Llama3的AI金融Agent,提供实时股票信息、财务数据、新闻和互动图表。支持多资产市场,包括股票、外汇、债券和加密货币...

MooER – 摩尔线程推出的业界首个音频理解大模型

MooER是什么 MooER是摩尔线程推出的业界首个基于国产全功能GPU训练的开源音频理解大模型。不仅能进行中文和英文的语音识别,还具备中译英的语音翻译能力。Moo...

LMMs-Eval – 专为多模态AI模型设计的统一评估框架

LMMs-Eval是什么 LMMs-Eval 是一个专为多模态AI模型设计的统一评估框架,提供标准化、广泛覆盖且成本效益高的模型性能评估解决方案。包含超过50个任务和10多...

WatermarkRemover – 在线AI背景去除工具

WatermarkRemover是什么 WatermarkRemover是在线AI背景去除工具,支持PNG、JPEG等多种图片格式。WatermarkRemover通过智能识别技术,快速去除图片背景,同时...

HeadGAP – 字节跳动推出的3D头像生成模型

HeadGAP是什么 HeadGAP是字节跳动和上海科技大学共同推出的3D头像生成模型,仅用少量图片快速生成逼真的3D头像。采用先验学习和个性化创建阶段的框架,基于大...
1 485 486 487 488 489 517