Marble – 李飞飞World Labs推出的3D世界生成平台
Marble是什么 Marble是李飞飞的创业公司World Labs推出的3D世界生成平台,基于先进的世界模型技术,用户只需提供一张图片或文本提示,能生成可无限探索的3D世...
数说Social Research – AI社媒营销Agent,全场景研究助手
数说Social Research是什么 数说Social Research 是数说故事旗下的全能营销 Agent 工具,依托领先大模型技术,接入海量社交媒体数据,能快速解答营销、市场、...
Nano Bananary – 开源AI图像编辑工具,基于Gemini模型
Nano Bananary是什么 Nano Bananary(香蕉超市) 是开源的图像编辑工具,基于 Google Gemini 图像模型开发,支持中文界面和明暗主题切换,提供 50 多种图像转...
Evoker – 一站式AI创作平台,支持文本、图像和视频生成
Evoker是什么 Evoker 是一站式 AI 创作平台,激发创意灵感并加速创作过程。支持文本、图像和视频生成,提供多模态创作体验。用户可以在一个聊天框中轻松创作...
混元3D 3.0 – 腾讯混元最新推出的3D生成模型
混元3D 3.0是什么 混元3D 3.0是腾讯最新发布的先进的3D生成模型。采用了首创的3D-DiT分级雕刻技术,能生成超高清的3D几何结构,建模精度提升3倍,几何分辨率...
LLaSO – 逻辑智能开源的语音模型
LLaSO是什么 LLaSO(Large Language and Speech Model)是北京深度逻辑智能科技有限公司推出的全球首个完全开源的语音模型,能解决大型语音语言模型(LSLM)...
InfiniteTalk – 美团开源的数字人视频生成框架
InfiniteTalk是什么 InfiniteTalk是美团视觉智能部推出的新型数字人驱动技术,通过稀疏帧video dubbing范式,仅需少量关键帧能驱动数字人人生成自然流畅的视...
UnifoLM-WMA-0 – 宇树科技开源的世界模型行动框架
UnifoLM-WMA-0是什么 UnifoLM-WMA-0 是宇树科技开源的跨多类机器人本体的世界模型 – 动作架构,专为通用机器人学习设计。核心是世界模型,能理解机器人与环境...
Lumina-DiMOO – 上海AI Lab推出的多模态生成与理解模型
Lumina-DiMOO是什么 Lumina-DiMOO是上海人工智能实验室等机构开源的新一代多模态生成与理解模型。模型采用全离散扩散架构,统一处理文本、图像等多模态数据,...
Mini-o3 – 字节联合港大推出的视觉推理模型
Mini-o3是什么 Mini-o3 是字节跳动和香港大学联合推出的开源模型,专为解决复杂的视觉搜索问题而设计。模型通过强化学习和基于图像的工具,能执行深度多轮推...
