Chai – AI伴侣应用,可主导剧情走向
Chai是什么 Chai是AI伴侣应用,具备强大的内容生成能力和独特的交互体验。能生成细腻的情感描写和连贯的剧情发展,让用户仿佛置身于真实恋爱场景中。用户可主...
MiMo-VL – 小米开源的多模态大模型
MiMo-VL是什么 MiMo-VL 是小米开源的多模态大模型,由视觉编码器、跨模态投影层和语言模型构成,视觉编码器基于Qwen2.5-ViT,语言模型是小米自研的MiMo-7B。...
FLUX.1 Kontext – Black Forest Labs 推出的图像生成与编辑模型
FLUX.1 Kontext是什么 FLUX.1 Kontext 是由 Black Forest Labs 推出的图像生成与编辑模型,支持上下文感知的图像处理。模型基于文本和图像提示进行生成与编辑...
OmniSync – 人民大学联合快手、清华推出的通用对口型框架
OmniSync是什么 OmniSync是中国人民大学、快手科技和清华大学联合推出的通用对口型框架,基于扩散变换器(Diffusion Transformers)实现视频中人物口型与语音...
Mobvoi MCP Server – 出门问问推出的多模态MCP服务工具
Mobvoi MCP Server是什么 Mobvoi MCP Server 是出门问问推出的一站式集成各项 AI 能力的工具,Mobvoi MCP Server集成语音生成、声音克隆、图片驱动数字人、视...
EVI 3 – Hume AI推出的语音语言模型
EVI 3是什么 EVI 3是Hume AI推出的全新语音语言模型,模型能同时处理文本和语音标记,实现自然、富有表现力的语音交互。模型支持高度个性化,根据用户提示生...
灵码 IDE – 通义灵码推出的AI原生IDE
灵码 IDE是什么 灵码 IDE是通义推出的AI原生IDE,用户可以在通义灵码官网免费下载使用。IDE深度适配了最新的千问3大模型,全面集成了通义灵码插件能力,具备...
WebAgent – 阿里开源的自主搜索AI Agent
WebAgent是什么 WebAgent是阿里巴巴开源的自主搜索AI Agent,具备端到端的自主信息检索与多步推理能力。WebAgent能像人类一样在网络环境中主动感知、决策和行...
Airtop – AI浏览器自动化工具,自然语言指令完成浏览器任务
Airtop是什么 Airtop是AI浏览器自动化工具。基于低成本可扩展的云浏览器,让用户能轻松抓取和控制任何网站。Airtop的AI Agent能像人类一样登录浏览网页,支持...
Lemon AI – 开源全栈通用AI Agent,需求到交付全流程自动化
Lemon AI是什么 Lemon AI 是创新的全栈通用 AI Agent,支持实现从任务需求到成果交付的全流程自动化。Lemon AI 具备独立思考和系统规划的能力,能在虚拟环境...
