Whisper Input – 开源AI语音输入工具,支持多语言实时转录和翻译

Whisper Input是什么 Whisper Input 是开源的语音输入工具,基于 Python 和 OpenAI 的 Whisper 模型开发。通过简单的快捷键操作(如按下 Option 键开始录音,...

FilmAgent – 哈工大联合清华推出的AI电影自动化制作工具

FilmAgent是什么 FilmAgent是哈尔滨工业大学(深圳)的研究团队开发的基于多智能体协作框架的虚拟电影制作工具,通过自动化流程实现虚拟3D空间中的端到端电影...

Harvey – 专为法律行业设计的生成式 AI 平台

Harvey是什么 Harvey是专为法律行业设计的生成式人工智能平台,基于 OpenAI 的 GPT-4 模型开发,为法律专业人士提供高效、精准的工具。核心功能包括法律研究...

ELSA Speak – AI英语学习应用,提供即时发音反馈纠正发音错误

ELSA Speak是什么 ELSA Speak是个性化AI英语学习应用,助力用户提升英语发音、语法、词汇等技能,能针对雅思、托福等考试提供专项训练。ELSA Speak特色功能包...

llmware – 专为企业级应用设计的开源统一框架

llmware是什么 llmware是为企业级应用设计的统一框架,适用于构建基于小型、专门化模型的RAG(Retrieval-Augmented Generation)流程。llmware支持私有部署,...

CogView4 – 智谱开源的AI文生图模型,支持生成汉字

CogView4是什么 CogView4 是智谱推出的开源文生图模型,具有60亿参数,支持原生中文输入和中文文字生成。模型在 DPG-Bench 基准测试中综合评分排名第一,达到...

BoldVoice – AI英语口音训练应用,AI实时评分提升发音水平

BoldVoice是什么 BoldVoice 是专注于英语口音训练的应用程序,帮助非英语母语者提升发音水平,增强口语自信。通过好莱坞专业口音教练的视频课程,结合先进的...

AIVLOG – AI视频剪辑工具,自动识别视频中的精彩片段

AIVLOG是什么 AIVLOG是专为视频创作者设计的AI智能视频编辑工具,通过自动化技术帮助用户快速制作高质量的Vlog。能自动识别视频中的精彩片段,精准剪辑并生成...

CogVideoX-2 – 智谱 AI 推出的文本到视频生成模型

CogVideoX-2是什么 CogVideoX-2是智谱 AI 推出的文本到视频生成模型,基于先进的 3D 变分自编码器(VAE),将视频数据压缩到原本的 2%,减少资源使用,同时确...

Baichuan-M1-14B – 百川智能推出的行业首个开源医疗增强大模型

Baichuan-M1-14B是什么 Baichuan-M1-14B是百川智能推出的行业首个开源医疗增强大模型,医疗能力超越了更大参数量的Qwen2.5-72B,与o1-mini相差无几。专为医疗...
1 221 222 223 224 225 473