标签:AI工具
WonderPlay – 斯坦福联合犹他大学推出的动态3D场景生成框架
WonderPlay 是什么 WonderPlay 是斯坦福大学联合犹他大学推出的新型框架,支持从单张图片和用户定义的动作生成动态3D场景。基于结合物理模拟和视频生成技术,...
CAR – 字节联合复旦推出的自适应推理框架
CAR是什么 CAR(Certainty-based Adaptive Reasoning)是字节跳动联合复旦大学推出的自适应推理框架,能提升大型语言模型(LLM)和多模态大型语言模型(MLLM...
PC Agent-E – 上海交大联合SII推出的智能体训练框架
PC Agent-E是什么 PC Agent-E是上海交通大学和SII联合推出的高效智能体训练框架。框架用312条人类标注的计算机使用轨迹,基于Claude 3.7 Sonnet模型合成多样...
OpusClip Thumbnail – OpusClip推出的免费AI缩略图生成工具
OpusClip Thumbnail是什么 OpusClip Thumbnail 是 OpusClip 团队推出的免费的 AI 缩略图生成工具,专为 YouTube 创作者设计,用于快速生成视频缩略图。用户只...
MemenomeLM – AI视频创作工具,可将PDF、笔记等资料转换为短视频
MemenomeLM是什么 MemenomeLM 是 Brainrot AI 推出的AI工具,专为Z世代研究人员设计,可将PDF文档、笔记等资料转化为有趣且互动性强的视频内容。具有多模态理...
Unmute – Kyutai推出的低延迟语音交互系统
Unmute是什么 Unmute 是 Kyutai 推出的低延迟语音交互系统,专注于低延迟语音转文字(Speech-to-Text)和文字转语音(Text-to-Speech)。Unmute 基于先进的 A...
剪小映 – 抖音推出的AI视频剪辑应用
剪小映是什么 剪小映是抖音推出的AI视频剪辑应用,专为零基础用户设计,操作简单便捷。具备AI智能解析功能,可精准识别素材中的场景、人物等元素,为用户提供...
LLaDA-V – 人大高瓴AI联合蚂蚁推出的多模态大模型
LLaDA-V是什么 LLaDA-V是中国人民大学高瓴人工智能学院、蚂蚁集团推出的多模态大语言模型(MLLM),基于纯扩散模型架构,专注于视觉指令微调。模型在LLaDA的...
LMEval – 谷歌开源的统一评估多模态AI模型框架
LMEval是什么 LMEval 是谷歌推出的开源框架,用在简化大型模型(LLMs)的跨提供商评估。框架支持多模态(文本、图像、代码)和多指标评估,兼容 Google、Open...
YouWare – 月之暗面前产品负责人明超平推出的AI编程社区
YouWare是什么 YouWare 是明超平(Leon Ming)创立的AI编程社区平台。帮助用户通过AI Coding将创意转化为作品,降低编程门槛。用户只需用自然语言描述需求,A...