Video-T1 – 清华联合腾讯推出的视频生成技术
Video-T1是什么 Video-T1 是清华大学和腾讯的研究人员共同推出的视频生成技术,基于测试时扩展(Test-Time Scaling,TTS)提升视频生成的质量和一致性。传统...
Mureka V6 – 昆仑万维推出的AI音乐创作基座模型
Mureka V6是什么 Mureka V6是昆仑万维推出的AI音乐创作平台的基座模型,支持纯音乐生成以及10种语言的AI音乐创作。引入自研的ICL(in-context learning)技术...
Mureka O1 – 昆仑万维推出的音乐推理大模型
Mureka O1是什么 Mureka O1是昆仑万维发布的全球首款音乐推理大模型,全球首个引入“思维链”(Chain of Thought,CoT)技术的音乐模型,Mureka O1在推理过程中...
TaoAvatar – 阿里推出的实时高清3D全身对话数字人技术
TaoAvatar是什么 TaoAvatar是阿里巴巴集团研究团队推出的高保真、轻量级的3D全身对话虚拟人技术。基于3D高斯溅射技术,能生成照片级逼真的3D全身虚拟形象,支...
pdf-craft – 开源 PDF 转 Markdown 工具
pdf-craft是什么 pdf-craft 是用在将 PDF 文件转换为其他格式(如 Markdown、EPUB)的工具,专注于处理扫描书籍的 PDF 文件。pdf-craft 支持提取正文内容,过...
Browseragent – 浏览器AI自动化工具,零代码创建和执行工作流
Browseragent是什么 Browseragent是基于浏览器的AI自动化工具,直接在浏览器中创建和运行AI工作流,无需API调用费用,实现零成本的无限次执行。Browseragent...
Gemini 2.5 Pro – 谷歌推出的最新 AI 思考模型
Gemini 2.5 Pro是什么 Gemini 2.5 Pro 是谷歌推出的最新 AI 模型,是一个“思考模型”,能在回应前进行推理,提升性能和准确性。模型在多个基准测试中表现卓越...
15个AI数字人制作工具,快速生成口播和直播视频
AI数字人通过模拟人类的外貌和行为,基于AI技术提供媲美真人的交互体验,AI虚拟数字人可以实现自然对话、执行任务,甚至在某些情况下展示合理的情感反应。本...
MCP.so – MCP资源托管平台,支持实时在线调试接口
MCP.so是什么 MCP.so是国内开发者idoubi创建的MCP(模型上下文协议)服务器导航与托管平台。MCP.so收录了超过3000个MCP服务器。MCP.so核心竞争力在于MCP Serv...
ReasonGraph – 开源可视化与分析LLMs推理过程的AI工具
ReasonGraph是什么 ReasonGraph 是用在可视化和分析大语言模型(LLMs)推理过程的开源网络平台。ReasonGraph支持超过 50 种主流模型(如 Anthropic、OpenAI、...