Collaborative Gym – 支持人与AI代理实时交互协作的评估框架

Collaborative Gym是什么 Collaborative Gym(Co-Gym)是专注于人机协作(Human-Agent Collaboration)的框架,支持人类与AI代理之间的实时交互与协作。通过...

PIKE-RAG – 微软亚洲研究院推出的检索增强型生成框架

PIKE-RAG是什么 PIKE-RAG(sPecIalized KnowledgE and Rationale Augmented Generation)是微软亚洲研究院推出的检索增强型生成框架,能解决传统RAG系统在复...

NobodyWho – AI游戏引擎插件,本地运行 LLM 实现互动小说创作

NobodyWho是什么 NobodyWho是为 Godot 游戏引擎设计的插件,通过本地运行的大型语言模型(LLM)实现互动小说创作。支持 Windows、Linux 和 macOS 平台,用户...

AnyCharV – 港中文联合清华等机构推出的角色可控视频生成框架

AnyCharV是什么 AnyCharV是香港中文大学、清华大学深圳国际研究生院、香港大学联合推出的角色可控视频生成框架,能将任意参考角色图像与目标驱动视频相结合,...

ENEL – 上海 AI Lab 推出的无编码器3D大型多模态模型

ENEL是什么 ENEL(Exploring the Potential of Encoder-free Architectures in 3D LMMs)是创新的无编码器3D大型多模态模型(3D LMM),解决传统编码器架构在...

《Manus没有秘密》70页PPT解读AI Agent(PDF免费下载)

《Manus没有秘密》简介 《Manus没有秘密》由明浩老师撰写的解读 AI Agent 的70页PPT,主要介绍了 AI Agent(智能体)技术从L1到L3的过程,探讨了 AI Agent 的...

通古大模型 – 华南理工大学推出的古籍大语言模型

通古大模型是什么 通古大模型是华南理工大学深度学习与视觉计算实验室(SCUT-DLVCLab)推出的专注于古籍文言文处理的人工智能语言模型。基于百川2-7B-Base进...

涌墨 – AI文档编写平台,智能解析关键信息生成文档内容

涌墨是什么 涌墨是智能文档编写平台,为用户提供全流程、智能化、高质量的文档生成解决方案。通过一站式文档工作流,以项目为单位管理文档,覆盖全业务流程,...

BAG – 港中文联合腾讯推出的3D可穿戴资产生成技术

BAG是什么 BAG(Body-Aligned 3D Wearable Asset Generation)是香港中文大学和腾讯联合提出创新的3D可穿戴资产生成技术,通过结合多视图图像扩散模型和控制...

WebLI-100B – 谷歌 DeepMind 推出的1000亿视觉语言数据集

WebLI-100B是什么 WebLI-100B是Google DeepMind推出的包含1000亿图像-文本对的超大规模数据集,用在预训练视觉语言模型(VLMs)。WebLI-100B是WebLI数据集的...
1 247 248 249 250 251 520