Midscene.js

Midscene.js

一款基于AI的自动化浏览器助手,能够通过自然语言操作网页。你只需描述要执行的任务,Midscene.js会自动处理网页,如发推文、验证内容、搜索信息等功能。

#Ai工具箱 #Ai开源项目
收藏

Midscene.js简介

Midscene是一款基于ai技术的自动化浏览器助手,能够通过自然语言操作网页。你只需简单描述想要执行的操作,Midscene会自动处理网页,如发推文、验证内容、搜索信息等功能。

Midscene.js主要功能

  • 自然语言交互:用户可以用自然语言指令来控制浏览器,例如“点击登录按钮”或“搜索关键字”,Midscene能够理解并执行这些命令。

  • 数据提取:Midscene能够自动提取网页上的信息,并以结构化的格式(如JSON)输出,例如提取搜索结果或表格数据。

  • 网页操作:它支持在多个网站上执行各种操作,如发推特、填写表单、点击链接等,用户无需编写复杂的代码。

  • 可视化报告: 每次运行后都会生成详细的可视化报告,包含动画回放和步骤详情,方便调试和优化测试过程。

  • 集成性高: 支持与 Puppeteer、Playwright 等工具无缝集成,适合各种自动化测试场景。

  • 灵活性强: 允许用户选择不同的大规模语言模型(LLM),甚至支持开源模型 UI-TARS。

  • UI自动化测试:Midscene可用作UI自动化测试工具,帮助开发者快速编写和维护测试脚本,提高测试效率。

Midscene.js使用案例

  • 社交媒体管理:用户可以直接向Midscene指令,如“发布一条状态更新”或“回复某条评论”,Midscene会自动完成这些操作,节省时间和精力。

  • 数据采集:在进行市场研究或数据分析时,用户可以使用Midscene迅速抓取特定网站上的信息,比如“提取所有产品价格和描述”,Midscene则自动处理并提供所需的结构化数据。

  • 自动化测试:对于开发者而言,Midscene的自然语言指令使得编写UI测试变得更加简单。开发者只需描述要测试的行为,Midscene便可以自动执行测试步骤并生成报告。

Midscene.js使用方法:

示例代码 (使用 Puppeteer):

const puppeteer = require('puppeteer');
(async () => {
    const browser = await puppeteer.launch({ headless: false });
    const page = await browser.newPage();

    // 导航至目标网站
    await page.goto("http://example.com");

    // 执行 Midscene.js 动作
    await midscene.execute(page, '输入用户名 "testuser"');
    await midscene.execute(page, '点击登录按钮');

    // 数据提取
    let userData = await midscene.query(page, '提取用户信息为 JSON 格式');
    console.log(userData); 

    // 关闭浏览器
    await browser.close();
})();

Midscene.js使用方法超简单,只要安装Chrome插件就可以用,不需要编程基础,只需描述想要执行的任务,它就可以理解你的意图然后自动执行相应的浏览器操作,是不是很神奇。

GitHub:https://github.com/web-infra-dev/midscene

与Midscene.js相关工具