Talo – AI实时语音翻译工具,无缝集成多主流会议平台

Talo是什么 Talo 是先进的AI实时语音翻译工具,专为打破语言障碍设计,广泛应用于视频会议场景。支持超过60种语言的即时翻译,能无缝集成到Google Meet、Micr...

Ito – 开源的AI语音听写工具,口语意图可转为文本

Ito是什么 Ito是开源的智能语音听写工具,通过其独特的“VibeTyping”技术,将用户的口语意图转换为精美文本。支持在邮件客户端、文档、聊天平台、浏览器和代码...

Alpamayo-R1 – 英伟达推出的推理版视觉-语言-动作模型

Alpamayo-R1是什么 Alpamayo-R1(AR1)是英伟达推出的视觉-语言-动作(VLA)模型,通过因果推理提升自动驾驶的决策能力和泛化性。模型的核心创新包括:构建因...

PixVerse V5.5 – 爱诗科技推出的视频生成大模型

PixVerse V5.5是什么 PixVerse V5.5 是爱诗科技推出的视频生成大模型。模型通过自研的多模态理解和生成技术,支持音画同步生成,简化从构思到成片的复杂工作...

Gen-4.5 – RunWay推出的视频生成模型

Gen-4.5是什么 Gen-4.5 是RunWay推出的视频生成模型,模型在视频生成的运动质量、视觉逼真度和提示词遵循度等方面树立新的行业标准。Gen-4.5 能生成电影级、...

可灵O1 – 可灵AI推出的首个统一多模态视频生成模型

可灵O1是什么 可灵O1(可灵视频 O1 模型)是可灵AI推出的全球首个统一多模态视频生成模型。模型通过创新的多模态视觉语言(MVL)架构,实现视频生成、编辑与...

传声港 – 龙投文化推出的AI综合媒体服务平台

传声港是什么 传声港是杭州龙投文化传媒有限公司旗下的AI驱动综合媒体服务平台,为企业提供一站式品牌传播与推广服务。平台整合了网络媒体、自媒体博主、网红...

Vidi2 – 字节跳动推出的多模态视频理解与生成模型

Vidi2是什么 Vidi2是字节跳动推出的专注于视频理解和创作的多模态大语言模型。在多模态时间检索(TR)方面达到了行业领先水平,在时空定位(STG)和视频问答...

Temvideo.ai – AI视频制作Agent,专为跨境电商营销设计

Temvideo.ai是什么 Temvideo.ai 是面向商业用户的 AI 视频制作工具,通过智能算法帮助用户快速生成高质量的营销视频。用户只需提供想法和素材,AI 代理即可自...

TalkCody – 开源AI编程助手,即时体验最新模型

TalkCody是什么 TalkCody 是开源的 AI 编程助手,帮助开发者更高效地构建软件。采用 Rust 和 Tauri 构建,具备原生性能和低资源占用的特点。TalkCody 支持多...
1 7 8 9 10 11 516