AI工具

SAM Audio – Meta开源的音频分割模型

SAM Audio是什么 SAM Audio是Meta开源的音频分割模型,能通过文本、视觉和时间片段等多模态提示,从复杂的音频混合中分离出特定的声音。核心技术是Perception...

Step-GUI – 阶跃星辰推出的AI Agent系列模型

Step-GUI是什么 Step-GUI 是阶跃星辰推出的AI Agent系列模型,包含云侧模型 Step-GUI 和端侧模型 Step-GUI Edge(原名:Gelab-Zero)。云侧模型擅长复杂任务...

混元世界模型1.5 – 腾讯混元开源的实时交互式世界生成模型

混元世界模型1.5是什么 腾讯混元世界模型1.5(HY WorldPlay 1.5)是腾讯混元团队开源的实时交互式世界生成模型。用户只需输入文字或图片,模型能快速创建专属...

A2UI – 谷歌开源Agent生成用户界面的声明式协议

A2UI是什么 A2UI(Agent-to-User Interface)是谷歌开源的基于Agent的接口协议,用于AI与用户界面之间的交互。A2UI通过AI生成的JSON描述,让客户端原生渲染交...

Xiaomi MiMo Studio – 小米推出的在线AI聊天服务平台

Xiaomi MiMo Studio是什么 Xiaomi MiMo Studio 是小米推出的在线 AI 聊天服务平台,用户可以在其中体验 Xiaomi MiMo-V2-Flash 模型。平台支持深度搜索和联网...

Molmo 2 – Ai2开源的AI视频分析模型

Molmo 2是什么 Molmo 2 是艾伦人工智能研究所(Ai2)推出的开源视频分析模型,专注于视频理解、指向和追踪。模型基于 Qwen 3 和 Olmo 架构,具备强大的视频分...

MiMo-V2-Flash – 小米开源的高性能语言模型

MiMo-V2-Flash是什么 MiMo-V2-Flash 是小米开源的高性能语言模型,具有3090亿总参数和150亿激活参数。专为智能体AI设计,采用混合注意力架构,结合滑动窗口注...

LongCat-Video-Avatar – 美团开源的数字人视频生成模型

LongCat-Video-Avatar是什么 LongCat-Video-Avatar 是美团 LongCat 团队推出的音频驱动角色动画模型。模型能生成超逼真、口型同步的长视频,保持人物身份一致...

GPT Image 1.5 – OpenAI最新推出的图像生成模型

GPT Image 1.5是什么 GPT Image 1.5 是 OpenAI 最新推出的图像生成模型,具有更强的指令遵循能力和精准编辑功能,根据用户要求只修改指定部分,同时保持画面...

88查 – 阿里巴巴推出的免费AI企业信息查询平台

88查是什么 88查是阿里巴巴推出的免费企业信息查询平台,为企业和个人提供全面、便捷的企业数据查询服务。用户可以通过官网、支付宝或微信小程序,以及1688 A...
1 2 3 4 516