Gemma 3n – 谷歌推出的端侧多模态AI模型

Gemma 3n是什么 Gemma 3n 是谷歌 I/O 开发者大会推出的端侧多模态 AI 模型。基于 Gemini Nano 架构,采用逐层嵌入技术,将内存占用压缩至 2-4B 参数模型水平...

Science Navigator – AI科研平台,覆盖“读文献-做计算-做实验-多学科协同”

Science Navigator是什么 Science Navigator(科学导航)是北京科学智能研究院与深势科技联合打造的新一代AI4S科研知识库与AI学术搜索平台。是全球首个覆盖“...

AutoBE – AI驱动的后端服务器代码生成工具

AutoBE是什么 AutoBE 是 AI 驱动的后端服务器代码生成工具,通过用户描述需求自动生成高质量的后端代码。基于 TypeScript、NestJS、Prisma 和 Postgres 等技...

Pixel3DMM – 慕尼黑联合伦敦大学等推出的3D人脸重建框架

Pixel3DMM是什么 Pixel3DMM是慕尼黑工业大学、伦敦大学学院和Synthesia联合推出的单图像3D人脸重建框架。框架基于DINO基础模型,引入专门的预测头,从单张RGB...

Imagen 4 – 谷歌推出的最新图像生成AI模型

Imagen 4是什么 Imagen 4是谷歌发布的最新图像生成AI模型。支持高达2K分辨率的图像生成,细节呈现逼真,可清晰呈现复杂织物纹理、水滴折射及动物毛发质感等。...

News Agents – 开源的终端新闻聚合与摘要系统

News Agents是什么 News Agents基于终端的新闻聚合与摘要系统。基于Amazon Q CLI作为 Agent 框架,用Model Context Protocol (MCP)解析RSS新闻源,借助tmux...

Flow – 谷歌推出的AI电影制作工具

Flow是什么 Flow是谷歌推出的AI电影制作工具,整合了Veo 3、Imagen 4和Gemini 2.5等多个AI模型,能根据文本提示生成完整的电影场景或短片,保持连贯性。用户...

II-Agent – Intelligent Internet开源的通用AI Agent框架

II-Agent是什么 II-Agent 是开源的Agent框架,通过与大型语言模型(LLM)的交互,简化和提升跨多个领域的工作流程。具备多种核心功能,包括研究与事实核查、...

Veo 3 – 谷歌推出的新一代视频生成模型

Veo 3是什么 Veo 3是谷歌I/O开发者大会上发布的新一代视频生成模型。Veo 3是谷歌首个可生成视频背景音效的模型,能合成画面,能为鸟鸣、街头交通等场景配上相...

豆包·语音播客模型 – 火山引擎推出的语音播客模型

豆包·语音播客模型是什么 豆包·语音播客模型是字节跳动旗下火山引擎推出的语音播客模型。模型基于流式模型构建,可将文本秒级转化为双人对话式播客,具有低成...
1 135 136 137 138 139 520