Math24o – SuperCLUE 开源的高中奥林匹克数学竞赛推理测评基准
Math24o是什么 Math24o 是中文大模型测评基准 SuperCLUE 开源的高中奥林匹克数学竞赛级别的数学推理测评基准。主要用于评估大型语言模型在数学推理方面的能力...
ChatAnyone – 阿里通义推出的实时风格化肖像视频生成框架
ChatAnyone是什么 ChatAnyone是阿里巴巴通义实验室推出的实时风格化肖像视频生成框架。通过音频输入,生成具有丰富表情和上半身动作的肖像视频。采用高效分层...
PaddleSpeech – 百度飞桨团队开源的语音处理工具
PaddleSpeech是什么 PaddleSpeech 是百度飞桨团队开源的语音处理工具,提供全面的语音处理功能,包括语音识别、语音合成、声纹识别、语音翻译等。PaddleSpeec...
MeshifAI – AI 3D模型生成平台,支持生成简单模型和纹理模型
MeshifAI是什么 MeshifAI 是AI文本转 3D 模型生成平台,能根据用户输入的文本提示快速生成 3D 模型,支持生成简单模型和纹理模型(PBR)两种类型,生成的模型...
DistilQwen2.5-R1 – 阿里推出的小型系列深度推理模型
DistilQwen2.5-R1是什么 DistilQwen2.5-R1 是阿里巴巴推出的基于知识蒸馏技术的小型化系列深度推理模型,包含3B、7B、14B和32B四个参数量级的模型。DistilQwe...
TripoSF – VAST AI 开源的新一代 3D 基础模型
TripoSF是什么 TripoSF是VAST推出的新一代3D基础模型,突破传统3D建模在细节、复杂结构和扩展性上的瓶颈。采用SparseFlex表示方法,结合稀疏体素结构,仅在物...
TripoSG – VAST AI 开源的高保真 3D 形状合成技术
TripoSG是什么 TripoSG 是 VAST-AI-Research 团队推出的基于大规模修正流(Rectified Flow, RF)模型的高保真 3D 形状合成技术, 通过大规模修正流变换器架构...
TxGemma – 谷歌推出的通用医学治疗大模型
TxGemma是什么 TxGemma 是谷歌推出的用于药物发现的通用人工智能模型,通过 AI 技术加速药物研发进程。基于 Google 的 Gemma 框架开发,能理解常规文本以及化...
QVQ-Max – 阿里通义推出的视觉推理模型
QVQ-Max是什么 QVQ-Max 是阿里通义推出的视觉推理模型,是QVQ-72B-Preview的正式升级版。QVQ-Max能“看懂”图片和视频内容,结合信息进行分析、推理和解决问题...
Ideogram 3.0 – Ideogram推出的 AI 图像生成模型
Ideogram 3.0是什么 Ideogram 3.0 是Ideogram推出的 AI 图像生成模型。Ideogram 3.0在图像生成质量上实现飞跃,具备高度的真实感、出色的文本渲染和强大的语...
