OpenAI 发布升级版 ChatGPT 智能体:多功能集成助力网站浏览、代码编写与 PPT 制作

AI资讯1个月前发布
28 0

7月18日讯,OpenAI今日宣布在ChatGPT中推出一款全新通用型人工智能体。该智能体能够协助用户完成多种基于计算机的任务。

OpenAI 发布升级版 ChatGPT 智能体:多功能集成助力网站浏览、代码编写与 PPT 制作

据OpenAI介绍,该智能体具备多种实用功能,包括自动生成可编辑的演示文稿和幻灯片、查看用户日历以提供即将到来的客户会议摘要、规划并购买制作家庭早餐的食材,以及运行代码等。

这一工具名为ChatGPT智能体,整合了OpenAI之前多种智能体工具的功能,包括Operator的网页交互能力,以及Deep Research从多个网站综合信息生成简洁研究报告的能力。用户只需通过自然语言与ChatGPT进行对话即可激活该功能。

为了开发这一新功能,OpenAI将Operator和Deep Research团队合并为一个统一的研发部门。据外媒The Verge报道,该团队由产品和研究部门共20~35名成员组成。

OpenAI 发布升级版 ChatGPT 智能体:多功能集成助力网站浏览、代码编写与 PPT 制作

ChatGPT智能体能够访问ChatGPT连接器,支持用户连接如Gmail和GitHub等第三方应用。通过用户的自然语言提示,智能体会主动查找并整合相关信息。此外,该智能体还支持终端操作,并可通过API接口与某些应用程序进行交互。

OpenAI 发布升级版 ChatGPT 智能体:多功能集成助力网站浏览、代码编写与 PPT 制作

在技术能力方面,ChatGPT智能体的底层模型在多个基准测试中展现了卓越性能。例如,在 Humanity’s Last Exam 测试中,其通过率为41.6%,约为 OpenAI o3 和 o4-mini 模型得分的两倍。

OpenAI 发布升级版 ChatGPT 智能体:多功能集成助力网站浏览、代码编写与 PPT 制作

在 FrontierMath 等高难度数学基准测试中,当ChatGPT智能体可以访问工具(如用于代码执行的终端)时,其得分为27.4%,远超之前的最佳成绩。

DSBench 测试结果显示,该模型在数据分析和建模等现实数据科学任务中表现优异,尤其在数据分析方面显著超越了现有先进模型。

OpenAI 发布升级版 ChatGPT 智能体:多功能集成助力网站浏览、代码编写与 PPT 制作

具体应用场景包括:

  • 工作场景:自动处理重复性任务,如将截图或面板转换为可编辑矢量元素组成的演示文稿、重新安排会议、规划并预订外出活动,以及在保持原有格式的同时更新电子表格中的财务数据。

  • 生活场景:规划并预订旅行行程、设计并预订晚宴活动,或寻找专业人士并安排预约。

安全方面,用户始终掌握控制权。ChatGPT在执行重要操作前会先征得用户的明确许可,用户可随时中断操作、接管浏览器或停止任务。

用户可通过编辑器中的工具下拉菜单直接激活智能体功能,只需在任何对话的任意阶段选择“智能体模式”即可。描述需要完成的任务——无论是进行深入研究、制作幻灯片,还是提交费用报销。操作过程中,屏幕上的语音播报会实时展示ChatGPT的具体操作流程。用户可随时中断并接管浏览器操作,确保任务与目标保持一致。

此外,用户还可设置已完成的任务自动重复执行,例如每周一早上自动生成周度指标报告。

ChatGPT智能体即日起向Pro、Plus和Team版用户开放,Enterprise和Education版本的用户将于7月获得使用权限。Pro版用户每月可执行近乎无限的任务,其他付费用户每月可执行50次任务,额外使用量可通过灵活的积分额度选项获取。

OpenAI强调,ChatGPT智能体仍处于早期测试阶段——尽管能够处理多种复杂任务,但仍然可能存在错误。目前生成的内容在格式和细节处理上可能显得较为粗糙,尤其是在没有现有文档的情况下开始创建时。此外,虽然用户可以上传现有电子表格供ChatGPT编辑或作为模板使用,但此功能尚未适用于幻灯片。

OpenAI正在积极训练下一代版本的幻灯片创建功能,以实现更精致、复杂的输出,并具备更广泛的功能和改进的格式化能力。

未来,OpenAI计划以定期节奏逐步添加重大改进,使ChatGPT智能体随着时间推移为更多人提供越来越强大的支持。

© 版权声明

相关文章