Browser Operator:Opera 浏览器推出的一款集成在浏览器里的助手
什么是 Browser Operator
Browser Operator 是 Opera 浏览器推出的一款集成在浏览器里的助手,用户能用自然语言指令让它帮忙完成各种网页浏览任务。
Browser Operator 的特点
注重隐私:不依靠屏幕截图或视频捕获理解浏览会话,也不把用户凭据存到云端,完全在本地设备运行,靠 DOM 树和浏览器布局数据获取信息。
速度快:不用像人那样逐像素“看”屏幕或用鼠标导航,多数时候能一次访问整个页面,不用滚动,节省完成任务的时间。
本地操作:在浏览器里就能运行,不用虚拟机或云端服务器,用户的浏览历史、登录信息和 cookie 设置等都留在本地设备,体验流畅又私密。
智能交互:能和网页里不可见元素互动,比如自动处理弹出对话框(像 cookie 接受和验证对话框),方便访问页面内容。
Browser Operator 的使用场景
信息收集:从网站收集信息,然后填充到电子表格或者文档中。
票务预订:在线预订各类票务和活动。
任务管理:用户随时能看到 Browser Operator 的操作过程,必要时能接手任务。
在线购物:支持在线买东西、订机票、酒店、活动门票等。用户用自然语言描述任务,像“买 10 双 Nike 白色网球袜,尺码 12”,它就能自动完成购买流程。
Browser Operator 的工作原理
Browser Operator 利用浏览器客户端的本地资源理解用户自然语言指令,再通过 Opera 的 ai Composer Engine 处理信息来完成任务。它靠 DOM 树和浏览器布局数据获取上下文,不依赖屏幕截图或视频捕获,所以操作又快又高效。
如何使用 Browser Operator
安装最新版 Opera 浏览器:去 Opera 官方网站下载并安装最新版本。
找到 Browser Operator:可以通过 Opera 侧边栏,打开浏览器后点击侧边栏中的 Browser Operator 图标;也能在浏览器地址栏输入特定命令或快捷方式。
输入指令:在 Browser Operator 的输入框里输入想执行的任务,比如“买 10 双 Nike 白色网球袜,尺码 12”“订明天从北京飞三亚的经济舱机票”“从 Walmart 买 3 包 A4 纸”。
执行与监控任务:Browser Operator 开始执行任务,用户能实时看进度。要是任务需要输入敏感信息(像支付信息、登录信息),它会暂停,让用户手动输入。用户在任务执行时能随时接手操作或者取消任务。
任务完成后续操作:任务完成后,用户能查看详细步骤。要是有进一步需求,比如取消错误订单,可以直接给 Browser Operator 发新指令。
Browser Operator 现在是即将推出功能的预览版,预计不久后会作为 Opera AI 功能更新计划的一部分正式上线。
Opera 的 AI 浏览器愿景
Opera 一直是浏览器创新的先行者,像推出标签页功能、地址栏搜索、内置 VPN 和侧边栏即时通讯等。2023 年,Opera 重新设计了旗舰浏览器,以 AI 为核心。从 2024 年 3 月起,通过 AI 功能更新计划测试实验性 AI 功能,如本地 LLM、图像生成和 AI 标签命令。现在,Opera 再次革新浏览器的角色,成为首个能为用户执行任务的“代理型”浏览器 。
相关: