AI工具
OpenELM – 苹果开源的高效语言模型系列
OpenELM是什么 OpenELM是Apple苹果公司最新推出的系列高效开源的语言模型,包括OpenELM-270M、OpenELM-450M、OpenELM-1_1B和OpenELM-3B不同参数规模的版本(...
Arctic – Snowflake开源的企业级AI大模型
Arctic是什么 Arctic是由云计算巨头Snowflake的AI研究团队开发的一款高效、开源的企业级大型语言模型,该大模型是一个拥有480亿(480B)的参数规模,由128个...
Hyper-SD – 字节跳动推出的高效的图像合成框架
Hyper-SD是什么 Hyper-SD是由字节跳动的研究人员推出的一个高效的图像合成框架,旨在解决现有扩散模型在多步推理过程中计算成本高昂的问题。Hyper-SD通过轨迹...
商量拟人大模型 – 商汤推出的AI角色对话大模型
商量拟人大模型是什么 2该大模型具备角色定制、知识库构建、长对话记忆、多人群聊和角色亲密度设置等功能,能够精准记忆对话历史,识别人物关系,推动剧情发...
Phi-3 – 微软最新推出的新一代小模型系列
Phi-3是什么 Phi-3是微软研究院推出的新一代系列先进的小语言模型,包括phi-3-mini、phi-3-small和phi-3-medium三个不同规模的版本。这些模型在保持较小的参...
FunClip – 阿里达摩院开源的AI自动视频剪辑工具
FunClip是什么 FunClip是阿里达摩院通义实验室推出的一款完全开源、本地部署的自动化视频剪辑工具,通过调用阿里巴巴通义实验室的FunASR Paraformer系列模型...
Llama 3 – Meta开源推出的新一代大语言模型
Llama 3是什么 Llama 3是Meta公司最新开源推出的新一代大型语言模型(LLM),包含8B和70B两种参数规模的模型,标志着开源人工智能领域的又一重大进步。作为Ll...
VASA-1 – 微软推出的静态照片对口型视频生成框架
VASA-1是什么 VASA-1是由微软亚洲研究院提出的一个将静态照片转换为对口型动态视频的生成框架,能够根据单张静态人脸照片和一段语音音频,实时生成逼真的3D说...
Parler-TTS – Hugging Face开源的文本转语音模型
Parler-TTS是什么 Parler-TTS是由Hugging Face推出的一款开源的文本到语音(TTS)模型,能够通过输入提示描述模仿特定说话者的风格(性别、音调、说话风格等...
CodeGemma – 谷歌开源推出的代码生成大模型
CodeGemma是什么 CodeGemma是由Google发布的专注于代码生成和理解的大型语言模型,该系列包含三种不同规模的模型,分别是2B预训练模型、7B预训练模型和7B指令...