Browser Operator:Opera 浏览器推出的一款集成在浏览器里的助手

什么是 Browser Operator

Browser Operator 是 Opera 浏览器推出的一款集成在浏览器里的助手,用户能用自然语言指令让它帮忙完成各种网页浏览任务。

Browser-Operator-Idle-screen.webp

Browser Operator 的特点

  • 注重隐私:不依靠屏幕截图视频捕获理解浏览会话,也不把用户凭据存到云端,完全在本地设备运行,靠 DOM 树和浏览器布局数据获取信息。

  • 速度快:不用像人那样逐像素“看”屏幕或用鼠标导航,多数时候能一次访问整个页面,不用滚动,节省完成任务的时间。

  • 本地操作:在浏览器里就能运行,不用虚拟机或云端服务器,用户的浏览历史、登录信息和 cookie 设置等都留在本地设备,体验流畅又私密。

  • 智能交互:能和网页里不可见元素互动,比如自动处理弹出对话框(像 cookie 接受和验证对话框),方便访问页面内容。

Browser Operator 的使用场景

  • 信息收集:从网站收集信息,然后填充到电子表格或者文档中。

  • 票务预订:在线预订各类票务和活动。

  • 任务管理:用户随时能看到 Browser Operator 的操作过程,必要时能接手任务。

  • 在线购物:支持在线买东西、订机票、酒店、活动门票等。用户用自然语言描述任务,像“买 10 双 Nike 白色网球袜,尺码 12”,它就能自动完成购买流程。

Browser Operator在线购物.webp

Browser Operator 的工作原理

Browser Operator 利用浏览器客户端的本地资源理解用户自然语言指令,再通过 Opera 的 ai Composer Engine 处理信息来完成任务。它靠 DOM 树和浏览器布局数据获取上下文,不依赖屏幕截图或视频捕获,所以操作又快又高效。

如何使用 Browser Operator

  1. 安装最新版 Opera 浏览器:去 Opera 官方网站下载并安装最新版本。

  2. 找到 Browser Operator:可以通过 Opera 侧边栏,打开浏览器后点击侧边栏中的 Browser Operator 图标;也能在浏览器地址栏输入特定命令或快捷方式。

  3. 输入指令:在 Browser Operator 的输入框里输入想执行的任务,比如“买 10 双 Nike 白色网球袜,尺码 12”“订明天从北京飞三亚的经济舱机票”“从 Walmart 买 3 包 A4 纸”。

  4. 执行与监控任务:Browser Operator 开始执行任务,用户能实时看进度。要是任务需要输入敏感信息(像支付信息、登录信息),它会暂停,让用户手动输入。用户在任务执行时能随时接手操作或者取消任务。

  5. 任务完成后续操作:任务完成后,用户能查看详细步骤。要是有进一步需求,比如取消错误订单,可以直接给 Browser Operator 发新指令。

Browser Operator 现在是即将推出功能的预览版,预计不久后会作为 Opera AI 功能更新计划的一部分正式上线。

Opera 的 AI 浏览器愿景

Opera 一直是浏览器创新的先行者,像推出标签页功能、地址栏搜索、内置 VPN 和侧边栏即时通讯等。2023 年,Opera 重新设计了旗舰浏览器,以 AI 为核心。从 2024 年 3 月起,通过 AI 功能更新计划测试实验性 AI 功能,如本地 LLM、图像生成和 AI 标签命令。现在,Opera 再次革新浏览器的角色,成为首个能为用户执行任务的“代理型”浏览器 。

相关:

Browser-use:让AI代理像真人用户一样在网页上浏览、操作、提取信息

收藏
最新工具
GenAI_Agents
GenAI_Agents

一个专注于生成式AI Agents技术的开源项目,GenAI_A...

GPTBots AI
GPTBots AI

GPTBots是一个无需编写代码就能构建AI Agent的平台。...

SwiftChat
SwiftChat

一款基于React Native开发的快速、安全、跨平台聊天应用...

Duck AI
Duck AI

DuckDuckGo推出的免费、匿名AI聊天机器人,用户可以放心...

Glean AI Agent
Glean AI Agent

Glean推出的企业级实用平台,能借助自然语言创建并部署AI代理...

Awesome LLM Apps
Awesome LLM Apps

一个精选的LLM(大型语言模型)应用集合,汇集了使用OpenAI...

Browser-use
Browser-use

一个开源的Python库,它把AI技术和浏览器自动化功能结合起来...

NotaGen
NotaGen

由中央音乐学院、北京航空航天大学和清华大学等机构联合开发的一款 ...

Stagetimer.io
Stagetimer.io

一款由Lukas Hermann开发的远程控制倒计时计时器工具,...

MetaGPT
MetaGPT

一个开源的多智能体框架,由DeepWisdom团队开发,在202...