标签:AI工具
SVDQuant – MIT 推出的扩散模型后训练量化技术
SVDQuant是什么 SVDQuant是MIT研究团队推出的后训练量化技术,针对扩散模型,将模型的权重和激活值量化至4位,减少内存占用加速推理过程。SVDQuant引入高精度...
Insight-V – 提升长链视觉推理能力的多模态模型
Insight-V是什么 Insight-V是南洋理工大学、腾讯公司和清华大学的研究者们共同推出的多模态模型,能提升多模态大型语言模型在长链视觉推理方面的能力。基于可...
SONIX – AI驱动的自动转录、翻译和字幕平台
SONIX是什么 SONIX是先进的AI驱动的自动转录、翻译和字幕平台,能将音频和视频文件快速准确地转换,支持49种语言的转录和50种语言的翻译,提供浏览器内编辑器...
slidebean – AI PPT生成工具,快速生成商业计划书、项目汇报等专业PPT
slidebean是什么 slidebean是专为创业者和商业用户设计的AI PPT生成工具,帮助创业者和初创公司制作专业的推介演示文稿和融资方案。平台根据用户提供的文本内...
Phi-4 – 微软开源的14B参数小语言模型,擅长数学等领域的复杂推理
Phi-4是什么 Phi-4是微软推出的14B参数小型语言模型,在数学等领域的复杂推理以及传统语言处理方面表现出色。Phi-4用数据质量为核心训练重点,大量融入合成数...
童语故事 – AI绘本生成工具,输入核心思想自动生成连续性的故事绘本
童语故事是什么 童语故事(ImageStory)是AI驱动的儿童绘本生成工具,支持用户输入核心思想系统自动生成精美的插画儿童故事绘本。简化绘本创作流程,适用于家...
Change Clothes AI – AI虚拟试穿平台,30-60秒内完成换衣
Change Clothes AI是什么 Change Clothes AI是在线AI虚拟试穿平台,基于深度学习算法分析用户上传的照片和服装图像,快速生成用户穿着新服装的逼真图像。平台...
CodeArena – 用于测试不同LLM编程能力的在线平台
CodeArena是什么 CodeArena是在线平台,基于让多个大型语言模型(LLM)同时构建相同的应用程序,实时显示排名结果,比较LLM生成代码的能力。CodeArena平台主...
Multimodal Live API – 谷歌推出支持多模态交互、低延迟实时互动的AI接口
Multimodal Live API是什么 Multimodal Live API 是谷歌推出的低延迟、双向交互的AI接口,支持文本、音频和视频输入,用音频和文本形式输出,能帮助开发者构...
ChatMCP – AI 聊天客户端,基于 MCP 支持多语言和自动化安装
ChatMCP是什么 ChatMCP 是基于模型上下文协议(MCP)的 AI 聊天客户端,支持与各种大型语言模型(LLM)如 OpenAI、Claude 和 OLLama 等进行交互。ChatMCP具备...