JanusFlow – DeepSeek开源多模态理解与生成任务统一的框架

JanusFlow是什么 JanusFlow是DeepSeek推出的 Janus 系列,用在多模态理解和生成任务的模型,整合自回归语言模型与校正流技术,在单一模型中实现图像理解和生...

RMBG-2.0 – 开源的图像背景移除模型,支持各类图像高精度背景移除

RMBG-2.0是什么 RMBG-2.0是BRIA AI推出的最新开源图像背景移除模型,基于先进的AI技术实现高精度的前景与背景分离,达到SOTA(State of the Art,即当前最佳...

Excalidraw – 开源的在线白板工具,手绘风格实时协作

Excalidraw是什么 Excalidraw是开源的在线白板工具,拥有简洁的手绘风格和实时协作功能。Excalidraw完全在浏览器中运行,无需安装,支持多人同时编辑同一张图...

Kimi长文生成器 – Kimi推出的长文本AI写作助手

Kimi长文生成器是什么 Kimi 长文生成器是Kimi推出的长文本写作助手,入口在Kimi+中“长文本生成器”。支持生成长达20万字的文本内容。能理解用户的需求,快速生...

万能写作大师 – AI写作助手,提供多种写作服务和多端操作

万能写作大师是什么 万能写作大师是全能文章写作助手应用。应用支持苹果、安卓和电脑端,提供写作、短篇小说创作、新闻评论、营销活动策划等多种写作服务。用...

MSQA – 大规模多模态3D情境推理数据集

MSQA是什么 MSQA(Multi-modal Situated Question Answering)是大规模多模态情境推理数据集,提升具身AI代理在3D场景中的理解与推理能力。数据集包含251K个...

CountAnything – AI计数应用,拍照或上传图片、自动检测计数相同物品

CountAnything是什么 CountAnything是先进的计数应用,基于计算机视觉技术实现快速、准确的物品自动计数。用户只需拍照或上传图片,标记一个样本,应用自动检...

声动视界 – AI视频工具,面向带货短视频领域的视频翻译、配音等功能

声动视界是什么 声动视界(SoundView)是面向带货短视频的AI视频工具。提供视频翻译、文本转语音和视频配音等功能,支持100多种语言,助力用户将产品推广至全...

Effie – AI办公助手,写作、笔记、大纲、思维导图一体化功能

Effie是什么 Effie是集写作、笔记和思维导图于一体的软件,Effie沉浸式界面和强大的功能帮助用户整理思绪、记录灵感,提升写作效率。Effie支持多平台使用,具...

Chonkie – RAG文本分块库,基于Token、单词、句子和语义的多种分块方法

Chonkie是什么 Chonkie是轻量级、快速且功能丰富的RAG(Retrieval-Augmented Generation)分块库,为文本处理设计。Chonkie支持基于Token、单词、句子和语义...
1 330 331 332 333 334 471