Browser Operator:Opera 浏览器推出的一款集成在浏览器里的助手

什么是 Browser Operator

Browser Operator 是 Opera 浏览器推出的一款集成在浏览器里的助手,用户能用自然语言指令让它帮忙完成各种网页浏览任务。

Browser-Operator-Idle-screen.webp

Browser Operator 的特点

  • 注重隐私:不依靠屏幕截图视频捕获理解浏览会话,也不把用户凭据存到云端,完全在本地设备运行,靠 DOM 树和浏览器布局数据获取信息。

  • 速度快:不用像人那样逐像素“看”屏幕或用鼠标导航,多数时候能一次访问整个页面,不用滚动,节省完成任务的时间。

  • 本地操作:在浏览器里就能运行,不用虚拟机或云端服务器,用户的浏览历史、登录信息和 cookie 设置等都留在本地设备,体验流畅又私密。

  • 智能交互:能和网页里不可见元素互动,比如自动处理弹出对话框(像 cookie 接受和验证对话框),方便访问页面内容。

Browser Operator 的使用场景

  • 信息收集:从网站收集信息,然后填充到电子表格或者文档中。

  • 票务预订:在线预订各类票务和活动。

  • 任务管理:用户随时能看到 Browser Operator 的操作过程,必要时能接手任务。

  • 在线购物:支持在线买东西、订机票、酒店、活动门票等。用户用自然语言描述任务,像“买 10 双 Nike 白色网球袜,尺码 12”,它就能自动完成购买流程。

Browser Operator在线购物.webp

Browser Operator 的工作原理

Browser Operator 利用浏览器客户端的本地资源理解用户自然语言指令,再通过 Opera 的 ai Composer Engine 处理信息来完成任务。它靠 DOM 树和浏览器布局数据获取上下文,不依赖屏幕截图或视频捕获,所以操作又快又高效。

如何使用 Browser Operator

  1. 安装最新版 Opera 浏览器:去 Opera 官方网站下载并安装最新版本。

  2. 找到 Browser Operator:可以通过 Opera 侧边栏,打开浏览器后点击侧边栏中的 Browser Operator 图标;也能在浏览器地址栏输入特定命令或快捷方式。

  3. 输入指令:在 Browser Operator 的输入框里输入想执行的任务,比如“买 10 双 Nike 白色网球袜,尺码 12”“订明天从北京飞三亚的经济舱机票”“从 Walmart 买 3 包 A4 纸”。

  4. 执行与监控任务:Browser Operator 开始执行任务,用户能实时看进度。要是任务需要输入敏感信息(像支付信息、登录信息),它会暂停,让用户手动输入。用户在任务执行时能随时接手操作或者取消任务。

  5. 任务完成后续操作:任务完成后,用户能查看详细步骤。要是有进一步需求,比如取消错误订单,可以直接给 Browser Operator 发新指令。

Browser Operator 现在是即将推出功能的预览版,预计不久后会作为 Opera AI 功能更新计划的一部分正式上线。

Opera 的 AI 浏览器愿景

Opera 一直是浏览器创新的先行者,像推出标签页功能、地址栏搜索、内置 VPN 和侧边栏即时通讯等。2023 年,Opera 重新设计了旗舰浏览器,以 AI 为核心。从 2024 年 3 月起,通过 AI 功能更新计划测试实验性 AI 功能,如本地 LLM、图像生成和 AI 标签命令。现在,Opera 再次革新浏览器的角色,成为首个能为用户执行任务的“代理型”浏览器 。

相关:

Browser-use:让AI代理像真人用户一样在网页上浏览、操作、提取信息

收藏
最新工具
ChatPaper.ai
ChatPaper.ai

一个论文、视频、笔记的AI总结学习助手,轻松提炼论文精华、整理课...

选品酷BigTracker
选品酷BigTracker

一款由BQool比酷尔科技公司开发的专为寻找亚马逊爆款的卖家量身...

云知改写
云知改写

一个基于先进深度语义分析、智能 AI 及文本处理技术开发的论文查...

Remove.photos
Remove.photos

一款免费的图片背景去除工具,能 00% 自动在3秒内去除图片背景...

VideoIdeas Ai
VideoIdeas Ai

一个为 YouTube博主量身定制的视频内容生成工具。它能在短时...

OnePPT
OnePPT

一款创新型AIPPT智能生成工具,提供智能写作、PPT生成、模板...

Hugo
Hugo

一个使用 Go 语言开发的开源静态网站生成器,速度快,灵活性高。...

企鹅读伴
企鹅读伴

腾讯SSV数字支教实验室推出的AI阅读教育产品,由腾讯混元大模型...

Krillin AI
Krillin AI

一款本地的视频翻译、配音和语音克隆的工具,适用于哔哩哔哩、小红书...

Lovart AI
Lovart AI

一个全球首个适用于设计目的的自适应设计AI智能体平台,能将创意转...