标签:AI工具

Qwen2.5-VL – 阿里通义千问开源的视觉语言模型

Qwen2.5-VL是什么 Qwen2.5-VL是阿里通义千问团队开源的旗舰视觉语言模型,具有3B、7B和72B三种不同规模。模型在视觉理解方面表现出色,能识别常见物体,分析...

Minduck Discovery – AI思维导图搜索工具,输入关键词生成可视化导图

Minduck Discovery是什么 Minduck Discovery是创新的AI思维导图搜索工具。通过交互式思维导图,将复杂的知识结构化呈现,帮助用户高效探索和理解信息。用户只...

Janus-Pro – DeepSeek 开源的统一多模态模型

Janus-Pro是什么 Janus-Pro是 DeepSeek 推出的开源AI模型,支持图像理解和图像生成,提供 1B 和 7B 两种规模,适配多元应用场景。通过改进的训练策略、扩展的...

DiffuEraser – 阿里通义实验室推出的视频修复模型

DiffuEraser是什么 DiffuEraser是基于稳定扩散模型的视频修复模型,以更丰富的细节和更连贯的结构填充视频中的遮罩区域。模型通过结合先验信息来提供初始化和...

魔力设 – AI设计工具,一键智能抠图和生成PPT

魔力设是什么 魔力设是高效便捷的在线设计平台,专注于为用户提供一站式的设计解决方案。集成了丰富的版权素材库和强大的在线编辑功能,涵盖海报、展板、邀请...

Recap – AI内容管理工具,支持对网页、PDF、视频内容进行总结与分析

Recap是什么 Recap是基于先进大型语言模型(LLMs)开发的智能工具,旨在帮助用户快速理解和总结各类内容。基于强大的AI技术,能处理文本、网页、PDF、视频,...

Qwen2.5-1M – 阿里通义千问开源的语言模型,支持100万Tokens上下文

Qwen2.5-1M是什么 Qwen2.5-1M是阿里通义千问团队推出的开源模型,支持100万Tokens的上下文长度。模型包括Qwen2.5-7B-Instruct-1M和Qwen2.5-14B-Instruct-1M两...

TeleAI-t1-preview – 中国电信推出的复杂推理大模型

TeleAI-t1-preview是什么 TeleAI-t1-preview是中国电信人工智能研究院发布的“复杂推理大模型”,具备强大的逻辑推理与数学推导能力。通过强化学习训练方法,引...

Baichuan-Omni-1.5 – 百川智能开源的全模态理解模型

Baichuan-Omni-1.5是什么 Baichuan-Omni-1.5是百川智能开源的全模态模型。支持文本、图像、音频和视频的全模态理解,具备文本和音频的双模态生成能力。模型在...

VideoLLaMA3 – 阿里达摩院推出的多模态基础模型

VideoLLaMA3是什么 VideoLLaMA3 是阿里巴巴开源的前沿多模态基础模型,专注于图像和视频理解。基于 Qwen 2.5 架构,结合了先进的视觉编码器(如 SigLip)和强...
1 146 147 148 149 150 400