MMMLU – OpenAI推出的多语言大规模多任务语言理解数据集
MMMLU是什么 MMMLU(多语言大规模多任务语言理解)是OpenAI推出的一个开源数据集,为评估和提升人工智能模型在不同语言、认知和文化背景下的性能而设计。MMML...
PortraitGen – 中科大推出的AI人像视频编辑工具
PortraitGen是什么 PortraitGen是中国科学技术大学研究团队推出的一款AI人像视频编辑工具。基于3D高斯溅射技术和神经高斯纹理机制,将2D人像视频转换为4D高斯...
豆包Seaweed – 字节跳动推出的AI视频生成模型,基于Transformer结构
豆包Seaweed是什么 豆包Seaweed是字节跳动推出的AI视频生成模型,支持文生视频和图生视频两种模式。基于Transformer结构,利用时空压缩技术进行训练,原生支...
豆包PixelDance – 字节跳动推出的AI视频生成大模型,基于DiT结构
豆包PixelDance是什么 豆包PixelDance是字节跳动最新推出的AI视频生成模型,采用DiT结构,支持文生视频和图生视频。它能理解复杂指令,生成长达10秒的连贯视...
GOT-OCR2.0 – 开源的端到端OCR模型,多语言多模态识别,多样化输入输出
GOT-OCR2.0是什么 GOT-OCR 2.0是一种先进的光学字符识别(OCR)模型,推动OCR技术进入2.0时代。GOT-OCR 2.0端到端的模型由高压缩编码器和长上下文解码器组成...
onewebot2 – 微信AI机器人一键运行包,双击exe直接使用
onewebot2是什么 oneWebot2是一款微信AI机器人一键运行软件包,用户下载exe文件后,双击即可启动,无需复杂的Python环境配置。有图形化界面,简化配置流程,...
SFR-RAG – 专注于上下文理解和检索增强生成的语言模型
SFR-RAG是什么 SFR-RAG是由Salesforce AI Research推出的一款大型语言模型,专注于提升机器在理解和生成文本方面的应用能力。模型特别强调对上下文的忠实理解...
OpenMusic – 基于 QA-MDT 的开源高质量文生音乐模型
OpenMusic是什么 OpenMusic 是一款基于 QA-MDT(Quality-aware Masked Diffusion Transformer)技术的高质量文生音乐模型。基于先进的AI算法,根据文本描述生...
ANTO – 开源的Windows桌面字幕翻译工具
ANTO是什么 ANTO是一款开源的Windows桌面字幕翻译工具,用于翻译SRT格式的视频字幕文件。集成多种翻译引擎,如谷歌翻译、DeepL、微软翻译、百度翻译和有道翻...
AiNiee – AI翻译工具,游戏爱好者和小说迷的翻译神器
AiNiee是什么 AiNiee 是一款AI翻译工具,能一键自动翻译RPG、SLG游戏、Epub、TXT格式的小说、Srt、Lrc字幕文件等。工具支持多格式文件,接入多个主流AI接口平...