标签:AI工具
ScriptViz – 斯坦福大学推出的剧本可视化AI辅助工具
ScriptViz是什么 ScriptViz是由斯坦福大学研究人员推出的一款剧本可视化辅助工具,基于大型电影数据库MovieNet,根据剧本文本和对话检索出相匹配的电影画面,...
Loong – 港大和字节联合推出的长视频生成模型
Loong是什么 Loong是由香港大学和字节跳动联合推出的一种新型长视频生成模型,能生成外观一致、动态丰富、场景过渡自然的分钟级长视频。模型基于自回归大型语...
Illuminate – 谷歌推出将学术论文转化为音频讨论的AI项目
Illuminate是什么 Illuminate 是一个由谷歌开发的项目,能将学术论文转化为人工智能生成的音频讨论。项目基于谷歌强大的语言模型 Gemini,将论文内容转换成引...
Surya – 开源的OCR工具包,支持90+语言、布局分析等识别
Surya是什么 Surya是一款功能强大的开源OCR(光学字符识别)工具包,专门设计用在文档识别,支持超过90种语言的识别。Surya能准确识别出文档中的文本,分析文...
揽睿星舟 – 翼方健数自主研发的云端AI训推一体算力平台
揽睿星舟是什么 揽睿星舟是一个云端AI训推一体算力平台,由翼方健数自主研发。提供高性价比的GPU计算资源、开箱即用的训推环境及AI工具链,旨在解决AI协作过...
MM1.5 – 苹果推出的升级版多模态大模型
MM1.5是什么 MM1.5是苹果公司推出的多模态大型语言模型,旨在增强文本丰富图像理解、视觉指代和定位以及多图像推理能力。模型基于数据为中心的训练方法,在大...
Cooraft – AI照片转换风格化应用,基于快手开源LivePortrait项目
Cooraft是什么 Cooraft是一款基于AI技术,将普通照片转化为具有创意和艺术性的动画和渲染图的应用程序。Cooraft提供多种艺术风格,如3D卡通、经典绘画等,一...
CursorCore – 程序员的AI编程辅助框架,对话形式交互理解上下文
CursorCore是什么 CursorCore是一个基于大型语言模型(LLMs)的编程辅助框架,用对话式交互帮助程序员更高效地编写和修改代码。框架整合编程过程中的各种信息...
F5-TTS – 上海交大推出开源的文本到语音(TTS)合成系统
F5-TTS是什么 F5-TTS是由上海交通大学开源的一款高性能文本到语音(TTS)系统,基于流匹配的非自回归生成方法,结合扩散变换器(DiT)技术。系统在没有额外监...
bardeen – 零编程构建自动化工作流的AI智能助手平台
bardeen是什么 bardeen是一款AI技术简化日常任务的助手,帮助用户简化和自动化日常工作中的重复性任务。支持用户用自然语言描述创建和执行自动化流程,无需编...