DeepSeek-VL2 – DeepSeek最新开源的MoE视觉语言模型系列
DeepSeek-VL2是什么 DeepSeek-VL2是DeepSeek最新开源的一系列大型混合专家(Mixture-of-Experts,简称MoE)视觉语言模型,在前代 DeepSeek-VL 的基础上进行了...
Pika 2.0 – Pika Labs推出的新版AI视频生成工具
Pika 2.0是什么 Pika 2.0是Pika Labs推出的AI视频生成工具,在前代产品的基础上进行了重大更新,提供了更多的用户控制和定制化功能。Pika 2.0的核心特性包括...
Step-1o Audio – 阶跃星辰推出的国内首个千亿参数端到端语音大模型
Step-1o Audio是什么 Step-1o Audio是阶跃星辰推出的国内首个千亿参数端到端语音大模型。具备强大的情绪感知能力,能精准识别用户语气中的情感,结合语境做出...
Slides Orator – AI PPT解说定制平台 ,AI虚拟形象实时解说幻灯片内容
Slides Orator是什么 Slides Orator是创新的AI平台,基于创建虚拟形象实时展示幻灯片进行解说。工具基于技术生成语音旁白,让演示内容动态地与观众互动,增强...
VirtualFit – AI虚拟试衣工具,提供AI换衣、图像恢复与扩展等多功能
VirtualFit是什么 VirtualFit是创新的AI虚拟试衣工具,基于人工智能技术让用户能轻松更换服装、恢复图像细节和扩展图像大小。用户只需上传照片,可选择不同的...
Meta Motivo – Meta 推出控制数字智能体动作的人工智能模型
Meta Motivo是什么 Meta Motivo 是 Meta 公司推出的AI模型,能提升元宇宙体验的真实性。Meta Motivo基于控制虚拟人形智能体的全身动作,模拟人类行为,增强用...
SVDQuant – MIT 推出的扩散模型后训练量化技术
SVDQuant是什么 SVDQuant是MIT研究团队推出的后训练量化技术,针对扩散模型,将模型的权重和激活值量化至4位,减少内存占用加速推理过程。SVDQuant引入高精度...
Insight-V – 提升长链视觉推理能力的多模态模型
Insight-V是什么 Insight-V是南洋理工大学、腾讯公司和清华大学的研究者们共同推出的多模态模型,能提升多模态大型语言模型在长链视觉推理方面的能力。基于可...
SONIX – AI驱动的自动转录、翻译和字幕平台
SONIX是什么 SONIX是先进的AI驱动的自动转录、翻译和字幕平台,能将音频和视频文件快速准确地转换,支持49种语言的转录和50种语言的翻译,提供浏览器内编辑器...
slidebean – AI PPT生成工具,快速生成商业计划书、项目汇报等专业PPT
slidebean是什么 slidebean是专为创业者和商业用户设计的AI PPT生成工具,帮助创业者和初创公司制作专业的推介演示文稿和融资方案。平台根据用户提供的文本内...