标签:AI工具
ParGo – 字节与中山大学联合推出的多模态大模型连接器
ParGo是什么 ParGo是字节团队与中山大学合作提出的创新的多模态大语言模型连接器,提升视觉和语言模态在多模态大语言模型(MLLMs)中的对齐效果。通过结合局...
Weebo – AI语音聊天机器人,实时响应用户语音指令和问题
Weebo是什么 Weebo是实时语音聊天机器人,基于Whisper Small、Llama 3.2和Kokoro-82M技术驱动。能通过语音识别和生成技术,与用户进行自然流畅的对话,提供实...
Mini-InternVL – 上海AI Lab联合清华等机构推出的轻量级多模态大模型
Mini-InternVL是什么 Mini-InternVL是“迷你版”书生·万象大模型,是上海AI实验室与清华大学、南京大学等机构联合推出的轻量级多模态大型语言模型系列,包含1B...
CogVideoX-Flash – 智谱推出的首个免费AI视频生成模型
CogVideoX-Flash是什么 CogVideoX-Flash 是智谱推出的首个免费AI视频生成模型,继承CogVideoX自研的端到端视频理解模型,具备强大的视频生成能力。CogVideoX-...
AutoMouser – AI Chrome扩展程序,实时交互跟踪自动生成测试代码
AutoMouser是什么 AutoMouser是Chrome扩展程序,能智能地跟踪用户交互,基于OpenAI的GPT模型自动生成Selenium测试代码。通过记录用户的浏览器操作,如点击、...
MangaNinja – 基于参考图像的线稿着色技术
MangaNinja是什么 MangaNinja是基于参考图像的线稿上色方法,具备精准匹配和细致控制的能力。通过创新的补丁重排模块和点驱动控制方案,提升了上色的准确性与...
CogView-3-Flash – 智谱推出的首个免费AI图像生成模型
CogView-3-Flash 是什么 CogView-3-Flash 是智谱推出的首个免费AI图像生成模型,能根据文本描述生成高审美分数的图像,支持多种分辨率,满足专业领域需求。模...
Aibiye – AI论文写作辅助平台,一键生成原创论文
Aibiye是什么 Aibiye是AI论文写作辅助平台,基于Multimodal+Global Thought Chain语言模型,为用户提供从开题报告到完整论文的生成服务。用户只需输入关键词...
GLM-Realtime – 智谱推出的端到端多模态模型
GLM-Realtime是什么 GLM-Realtime是智谱推出的全新端到端多模态模型,具备低延迟的视频理解与语音交互能力,特别融入清唱功能,让大模型在对话中能展现歌唱才...
豆包AI编程 – 豆包推出的AI编程新功能,解决编程难题
豆包AI编程是什么 豆包AI编程是豆包推出的AI编程新功能。基于AI技术,提供更便捷的代码导入流程,支持一键上传多个本地代码文件和实时引入GitHub开源仓库,快...