OpenAI推出Operator，一个能够自主执行任务的AI代理

蓝色新闻

Wednesday, April 16 2025

OpenAI首席执行官萨姆·阿尔特曼在一篇博文中表示，2025年将是AI代理的重要一年，这些工具可以自动化任务并代表用户采取行动。

现在，我们看到了OpenAI的第一个真正的尝试。

OpenAI周四宣布推出Operator的研究预览，这是一款通用的AI代理，可以控制Web浏览器并独立执行某些操作。Operator首先将在ChatGPT的价值200美元的专业订阅计划中提供给美国用户使用。OpenAI表示，他们计划最终将此功能推广到其更多用户，包括Plus、Team和Enterprise层次的用户。

OpenAI首席执行官萨姆·阿尔特曼在周四的直播中表示：“[Operator]很快将会推广到其他国家，但欧洲还需要一段时间。”

目前，可以通过operator.chatgpt.com获得这一初始的研究预览版本，但OpenAI表示他们希望将Operator整合到所有ChatGPT客户端中。

根据OpenAI的说法，Operator承诺自动化任务，例如预订旅行住宿、订餐厅和在线购物。用户可以在Operator界面中选择几种任务类别，包括购物、快递、餐饮和旅行，所有这些都支持不同类型的自动化。

当ChatGPT用户激活Operator时，会弹出一个小窗口，显示一个专用的Web浏览器，代理使用它来完成任务，并解释代理正在执行的具体操作。用户在Operator工作时仍然可以控制自己的屏幕，因为Operator使用自己的专用浏览器。

OpenAI表示，Operator由计算机使用代理模型（CUA）提供支持，该模型结合了公司GPT-4o模型的视觉能力和OpenAI更高级模型的推理能力。CUA经过训练，可以与网站的前端进行交互，这意味着它不需要使用面向开发者的API来接入不同的服务。

换句话说，CUA可以像人类一样在网页上使用按钮、浏览菜单和填写表单。

OpenAI表示，他们正在与DoorDash、eBay、Instacart、Priceline、StubHub和Uber等公司合作，以确保Operator尊重这些企业的服务条款协议。

“CUA模型经过训练，在完成具有外部副作用的任务之前要求用户确认，例如在提交订单、发送电子邮件等之前，以便用户可以在模型的工作变得永久之前进行双重检查”，OpenAI在提供给TechCrunch的材料中写道。“CUA已经在各种情况下证明了其有用性，我们的目标是在更广泛的任务范围内扩展其可靠性。”

但OpenAI警告称，CUA并不是完美的。公司表示，他们“目前不希望CUA在所有场景中都能可靠执行任务。”

“目前，Operator无法可靠处理许多复杂或专业化的任务”，OpenAI在支持文件中补充说，“比如创建详细的幻灯片展示、管理复杂的日历系统或与高度定制或非标准网络界面进行交互。

出于谨慎起见，OpenAI还要求某些任务进行监督，例如银行交易，尽管CUA和Operator在大多数情况下能够独立执行。用户需要接管输入信用卡信息，例如。OpenAI表示，Operator不会收集或截取任何数据。

“在特别敏感的网站上，比如电子邮件，Operator需要用户积极监督，确保用户可以直接发现和解决模型可能犯的任何潜在错误，”OpenAI在其支持文件中写道。

这限制了Operator的实用性，但也确保了代理不会出现幻觉，比如在装修家里时用你的按摩款支付房屋贷款。Google在其Project Mariner AI代理中采取了类似的方法，也不会填写信用卡号等信息。

限制

Operator有一些值得注意的限制。

有速率限制——每日限额和任务相关。OpenAI表示，Operator可以同时执行多个任务，但有关此的“动态限制”。还有一个每日重置的整体使用限制。

在此发布阶段，基于安全原因，Operator将拒绝执行某些任务，例如发送电子邮件（尽管CUA是有能力的），以及删除日历活动。OpenAI表示这种情况将来会有所改变，但没有提供具体日期。

此外，如果Operator遇到特别复杂的界面、密码字段或CAPTCHA检查，可能会“卡住”。OpenAI表示，发生这种情况时，它会要求用户接管。

代理的未来

相比竞争对手（如Rabbit、Google和Anthropic等公司），OpenAI在开发AI代理方面进展较慢，这可能与技术周围的安全风险有关。

当AI系统可以在Web上采取行动时，就会为恶意行为者带来更多危险的应用场景。你可以自动化AI代理来策划网络钓鱼诈骗或DDoS攻击，或者让它在任何其他人之前抢购音乐会门票。特别是对于像ChatGPT这样广泛使用的工具，OpenAI采取措施来防止这些利用至关重要。

OpenAI似乎认为Operator在目前的形式下已经足够安全，至少作为一个研究预览。

“Operator采用的工具旨在限制模型对恶意提示、隐藏指令和网络钓鱼尝试的易感性，”OpenAI在其网站上解释道。“监控系统会在检测到可疑活动时暂停执行，而自动化和人工审核的流程不断更新安全措施。”

Operator是OpenAI迄今为止创建AI代理的最大胆尝试。上周，OpenAI发布了Tasks，为ChatGPT提供了简单的自动化功能，例如设置提醒和安排提示在每天固定时间运行。但是，Operator展示了前一代虚拟助手无法实现的功能。

AI代理被宣传为ChatGPT之后AI领域的下一个大事：一种新技术，将改变人们如何使用互联网和个人计算机。代理不仅可以传递和处理信息，而且理论上可以采取行动并实际做事。

通过OpenAI首款具体的代理系统的发布，很快就会清楚这一愿景有多现实。

蓝色新闻

OpenAI推出Operator，一个能够自主执行任务的AI代理

限制

代理的未来

Recent Posts

阿特金斯26分，帮助神秘队以89-84击败狂热队，克莱林·克拉克狂砍29分

英国乐队The 1975在马来西亚音乐节上接吻事件的诉讼部分遭到法官驳回

英格兰和威尔士的与足球相关逮捕案件数量上升，西汉姆再次成为案例最多的球队

关于TikTok在美国不确定未来以及想要收购的人们需要了解的事情

AI音乐初创公司Suno声称在受版权保护的音乐上进行训练是'公平使用'