OpenAI推出Operator,一个能够自主执行任务的AI代理

OpenAI首席执行官萨姆·阿尔特曼在一篇博文中表示,2025年将是AI代理的重要一年,这些工具可以自动化任务并代表用户采取行动。

现在,我们看到了OpenAI的第一个真正的尝试。

OpenAI周四宣布推出Operator的研究预览,这是一款通用的AI代理,可以控制Web浏览器并独立执行某些操作。Operator首先将在ChatGPT的价值200美元的专业订阅计划中提供给美国用户使用。OpenAI表示,他们计划最终将此功能推广到其更多用户,包括Plus、Team和Enterprise层次的用户。

OpenAI首席执行官萨姆·阿尔特曼在周四的直播中表示:“[Operator]很快将会推广到其他国家,但欧洲还需要一段时间。”

目前,可以通过operator.chatgpt.com获得这一初始的研究预览版本,但OpenAI表示他们希望将Operator整合到所有ChatGPT客户端中。

Operator的主屏幕。图片来源:OpenAI

根据OpenAI的说法,Operator承诺自动化任务,例如预订旅行住宿、订餐厅和在线购物。用户可以在Operator界面中选择几种任务类别,包括购物、快递、餐饮和旅行,所有这些都支持不同类型的自动化。

当ChatGPT用户激活Operator时,会弹出一个小窗口,显示一个专用的Web浏览器,代理使用它来完成任务,并解释代理正在执行的具体操作。用户在Operator工作时仍然可以控制自己的屏幕,因为Operator使用自己的专用浏览器。

OpenAI表示,Operator由计算机使用代理模型(CUA)提供支持,该模型结合了公司GPT-4o模型的视觉能力和OpenAI更高级模型的推理能力。CUA经过训练,可以与网站的前端进行交互,这意味着它不需要使用面向开发者的API来接入不同的服务。

换句话说,CUA可以像人类一样在网页上使用按钮、浏览菜单和填写表单。

OpenAI表示,他们正在与DoorDash、eBay、Instacart、Priceline、StubHub和Uber等公司合作,以确保Operator尊重这些企业的服务条款协议。

图片来源:OpenAI

“CUA模型经过训练,在完成具有外部副作用的任务之前要求用户确认,例如在提交订单、发送电子邮件等之前,以便用户可以在模型的工作变得永久之前进行双重检查”,OpenAI在提供给TechCrunch的材料中写道。“CUA已经在各种情况下证明了其有用性,我们的目标是在更广泛的任务范围内扩展其可靠性。”

但OpenAI警告称,CUA并不是完美的。公司表示,他们“目前不希望CUA在所有场景中都能可靠执行任务。”

“目前,Operator无法可靠处理许多复杂或专业化的任务”,OpenAI在支持文件中补充说,“比如创建详细的幻灯片展示、管理复杂的日历系统或与高度定制或非标准网络界面进行交互。

出于谨慎起见,OpenAI还要求某些任务进行监督,例如银行交易,尽管CUA和Operator在大多数情况下能够独立执行。用户需要接管输入信用卡信息,例如。OpenAI表示,Operator不会收集或截取任何数据。

“在特别敏感的网站上,比如电子邮件,Operator需要用户积极监督,确保用户可以直接发现和解决模型可能犯的任何潜在错误,”OpenAI在其支持文件中写道。

这限制了Operator的实用性,但也确保了代理不会出现幻觉,比如在装修家里时用你的按摩款支付房屋贷款。Google在其Project Mariner AI代理中采取了类似的方法,也不会填写信用卡号等信息。

限制

Operator有一些值得注意的限制。

有速率限制——每日限额和任务相关。OpenAI表示,Operator可以同时执行多个任务,但有关此的“动态限制”。还有一个每日重置的整体使用限制。

在此发布阶段,基于安全原因,Operator将拒绝执行某些任务,例如发送电子邮件(尽管CUA是有能力的),以及删除日历活动。OpenAI表示这种情况将来会有所改变,但没有提供具体日期。

此外,如果Operator遇到特别复杂的界面、密码字段或CAPTCHA检查,可能会“卡住”。OpenAI表示,发生这种情况时,它会要求用户接管。

代理的未来

相比竞争对手(如Rabbit、Google和Anthropic等公司),OpenAI在开发AI代理方面进展较慢,这可能与技术周围的安全风险有关。

当AI系统可以在Web上采取行动时,就会为恶意行为者带来更多危险的应用场景。你可以自动化AI代理来策划网络钓鱼诈骗或DDoS攻击,或者让它在任何其他人之前抢购音乐会门票。特别是对于像ChatGPT这样广泛使用的工具,OpenAI采取措施来防止这些利用至关重要。

OpenAI似乎认为Operator在目前的形式下已经足够安全,至少作为一个研究预览。

“Operator采用的工具旨在限制模型对恶意提示、隐藏指令和网络钓鱼尝试的易感性,”OpenAI在其网站上解释道。“监控系统会在检测到可疑活动时暂停执行,而自动化和人工审核的流程不断更新安全措施。”

Operator是OpenAI迄今为止创建AI代理的最大胆尝试。上周,OpenAI发布了Tasks,为ChatGPT提供了简单的自动化功能,例如设置提醒和安排提示在每天固定时间运行。但是,Operator展示了前一代虚拟助手无法实现的功能。

AI代理被宣传为ChatGPT之后AI领域的下一个大事:一种新技术,将改变人们如何使用互联网和个人计算机。代理不仅可以传递和处理信息,而且理论上可以采取行动并实际做事。

通过OpenAI首款具体的代理系统的发布,很快就会清楚这一愿景有多现实。