ACTalker – 港科大联合腾讯、清华推出的端到端视频扩散框架
ACTalker是什么 ACTalker 是用于生成逼真说话人头部视频的端到端视频扩散框架。支持单信号或多信号控制,如音频、表情等。核心架构包括并行 Mamba 结构,通过...
Copilot Search – 微软 Bing 推出的智能搜索模式
Copilot Search是什么 Copilot Search 是微软 Bing 推出的智能搜索模式,融合传统搜索和生成式 AI 的优势。基于智能信息整合,根据用户的查询提供简洁的总结...
Awesome MCP Servers – 开源的MCP资源聚合平台,覆盖多个垂直领域
Awesome MCP Servers是什么 Awesome MCP Servers 是开源项目,汇集各种基于 Model Context Protocol (MCP) 的服务器。Awesome MCP Servers 整理超过 3000 个 ...
AnimeGamer – 腾讯联合香港城市大学推出的动漫生活模拟系统
AnimeGamer是什么 AnimeGamer 是腾讯 PCG 和香港城市大学共同推出的无限动漫生活模拟系统。基于多模态大语言模型(MLLM),支持玩家基于开放式的语言指令,用...
Midlibrary – Midjourney AI图像创作提示词资源库
Midlibrary是什么 Midlibrary是国外艺术家Andrei Kovalev建立的Midjourney提示词资源网站,收录了5505种风格流派、艺术运动、技法及艺术家关键词,为AI图像创...
OmniCam – 浙大联合上海交大等高校推出的多模态视频生成框架
OmniCam是什么 OmniCam 是先进的多模态视频生成框架,通过摄像机控制实现高质量的视频生成。支持多种输入模态组合,用户可以提供文本描述、视频中的轨迹或图...
Quasar Alpha – 支持百万 token 上下文的免费 AI 模型
Quasar Alpha是什么 Quasar Alpha 是支持 100 万 token 的超大上下文窗口的预发布版 AI 模型,可处理超长文本和复杂文档。代码生成能力出色,生成速度快,延...
Seedream 3.0 – 字节推出的 AI 图片生成模型,精准生成复杂中文内容
Seedream 3.0是什么 Seedream 3.0(即梦3.0)是字节跳动推出的AI图片生成模型,模型支持原生 2K 分辨率图像输出,快速生成高品质图像,仅需 3 秒。模型在小字...
Zapier MCP – Zapier 推出的 MCP 服务,一键链接 Cursor
Zapier MCP是什么 Zapier MCP(Model Context Protocol)是 Zapier 推出的创新 MCP 服务,让 AI 助手能快速、安全地连接到超过 7000 个应用程序,无需复杂的 ...
OmniTalker – 阿里推出的实时文本驱动说话头像生成框架
OmniTalker是什么 OmniTalker 是阿里巴巴发布的实时文本驱动的说话头像生成技术,能同时处理文本、图像、音频和视频等多种模态输入,以流式方式生成自然语音...