auto-chrome

1.2.7 • Public • Published

auto-chrome

使用Node.js自动化控制Chrome或Chromium,基于chrome devtools协议的高仿真用户行为模拟器。

借鉴于puppeteer,选择重写是因为在实际应用中puppeteer存在各种奇怪的bug,导致线程持续阻塞且难以被修复,一些实现细节也不符合预期。

chrome devtools协议api过于原始,对开发者而言并不友好。puppeteer api虽然功能丰富,但是操作依然过于繁琐,且存在一些难以规避的Bug。

auto-chrome以简洁和易用为设计原则,重点简化常见应用场景,通过扩展的方式满足定制化需求。

特性

  • 支持自动聚焦,根据当前活跃标签自动切换标签,通过chrome.page获取当前处于激活状态的标签。这在实际应用中避免了多标签切换带来的苦恼,同时减少手动切换标签导致的混乱

  • 支持主动导航监测,避免用户由于疏忽没有明确定义导航行为,导命操作错乱。

  • 支持消息队列等待超时自动解除,由于各种不可控因素,devtools并不保证100%对所有发送的消息做出回应,在没有超时机制的状态下消息将处于持续等待状态,导致任务无法继续执行

  • 解除鼠标、键盘、触控输入设备与页面的绑定,避免频繁在多个页面间切换设备

  • 支持高仿真输入,模拟鼠标移动轨迹和Touch手势

  • 简化的错误处理机制,即使任务出现异常依然能继续运行,尽可能保障线程不出现持久性阻塞

  • 支持GPS定位

Install

npm install auto-chrome

chromium安装

由于网络环境因素,auto-chrome并没有像puppeteer那样直接将chromium作为npm依赖进行安装。因此你需要手动下载chromium,并在launch.executablePath配置项中指定安装路径。

推荐源:https://npm.taobao.org/mirrors/chromium-browser-snapshots/

chrome devtools术语

  • Target 表示浏览器中的某个目标对象,可以是browser、page、iframe、other类型之一。当type为page类型时,targetId对应于主框架的frame id。

  • Session session机制用于创建多个会话,可以为每个Target绑定独立的session,也可以让多个Target共享同一个session。

  • Page 浏览器标签,Chrome中允许打开多个Page,但始终只有一个Page处于激活状态。

  • Runtime JavaScript运行时,用于向网页注入JS代码实现对DOM的操作。

  • Frame 网页中的框架,主Frame中允许包含多个子Frame。

  • Context JavaScript运行时所处的的上下文,由于页面内可能包含Frame,每个Frame拥有独立的运行时,因此需要生成唯一contextId来区分它们。

注意事项

由于301重定向到新的url,连续多次触发上下文切换,导致上下文错位。301难以被察觉,且很难做预判,在调试时应该格外注意。

页面导航

浏览器导航事件可分为可预测和不可预测两种,由于触发导航的方式非常多,通过鼠标、键盘、JS脚本方式均可能触发未知的导航事件。如果导航切换时序不正确,会产生上下文消息错乱的bug。

可预测导航

对于chrome.newPage()、page.goto()这类明确包含导航行为的显性操作,autoChrome进行内部封装,在使用时不需要做额外的处理。

不可预测导航

  • 导航可能刷新当前标签,也可能创建新标签

  • 通过JS触发跳转链接的不可预测导航行为

  • 点击链接后出现一次或多次301重定向

  • 由于浏览器301缓存导致重定向的不确定性

针对以上情况,无法准确预判一个操作是否会触发导航事件。autoChrome中通过循环探测的方式来实现自动导航,该方案的缺点是时效不高,应用场景有限。

// 等待导航键盘示例代码
await Promise.all([
    chrome.keyboard.press("Enter"),
    chrome.autoNav()
])
 
// 鼠标示例
await Promise.all([
    page.click("#input"),
    chrome.autoNav()
])

高分屏分辨率

如果你的chrome运行在高分屏设备中,可能会出现touch事件错位的严重bug,这种情况可以尝试使用“--force-device-scale-factor=”来调整缩放比例。

autoChrome(options)

  • options Object 全局实例配置选项,优先级低于page

    • args[ars, ...] Array Chrome启动参数数组

      • ars String Chrome启动参数
    • executablePath String Chrome程序执行路径

    • userDataDir String 用户配置文件路径,定义独立的Chrome实例,支持cluster模式下并行

    • emulate Object 设备仿真,该配置对于初始标签不太凑效,可能由于初始targetCreated事件并没有被捕获。

      • viewport Object

        • mobile Boolean 移动设备,默认false

        • width Number 屏幕宽度,默认自适应屏幕宽度

        • height Number 屏幕高度,默认自适应屏幕高度

      • geolocation Object 地理位置,使用Google地图坐标

        • longitude Number 经度

        • latitude Number 纬度

        • accuracy Number 精准度

    • headless Boolean 隐藏执行模式,默认false

    • devtools Boolean 为每个page自动打开devtools,默认false

    • timeOut Number 消息响应超时时间,默认150000

    • ignoreHTTPSErrors Boolean 忽略https错误,默认false

    • disableDownload Boolean 禁止下载文件,默认false

    • loadTimeout Number 自动导航等待页面加载的最大停留时间,单位ms

  • return Chrome Chrome类实例

class: Chrome

chrome.clicker

mouse、touch事件实例,引用自当前活动状态page.clicker

chrome.keyboard

键盘事件实例,引用自当前活动状态page.keyboard

chrome.pages

包含所有打开page的Map对象

chrome.page

当前激活状态的page

chrome.newPage(url)

  • url String 打开网页地址,缺省时打开空白网页

chrome.closePageById(pageId)

通过pageId关闭指定的标签

  • pageId String 要删除page的id

chrome.createBrowserContext()

创建独立的浏览器环境,只能在隐身模式下运行。

chrome.send(method, params)

发送原始的chrome devtools协议消息

  • method String 方法名

  • params Object 参数

chrome.autoNav(time)

  • time Number 等待超时时间

循环监测,自动导航

chrome.close()

关闭浏览器

class: Page

page.clicker

mouse、touch事件实例,当autoChrome(options)配置项emulate.viewport.mobile值为true时,使用touch实例,否则使用mouse实例

page.keyboard

键盘实例

page.emulate(options)

设备仿真,直接调用该方法可能导致混乱,正常应该由事件驱动在创建标签执行page.emulate(),手动调用会存在延时覆盖问题。

  • options Object 选项

    • mobile Boolean 移动设备

    • width Number 屏幕宽度

    • width Number 屏幕高度

    • geolocation Object 地理位置

      • longitude Number 经度

      • latitude Number 纬度

      • accuracy Number 精准度

page.goto(url)

在标签内打开新网页

page.run(pageFunction, ...arg)

向页面注入js函数,获取执行后的返回值

  • pageFunction Function 注入函数

  • arg * 可序列化参数,不支持函数

  • return Object 远程资源相关信息,RemoteObject

page.$(selector)

选择单个元素

  • selector String CSS选择器

  • return Object 单个Elment实例

page.$$(selector)

选择多个元素

  • selector String CSS选择器

  • return Array 多个Elment实例数组

page.click(selector)

通过CSS选择器点击元素

page.clickNav(selector)

通过CSS选择器点击元素,内置导航

  • selector String CSS选择器

page.type(selector, text, options)

通过CSS选择器聚焦input,输入文本

  • selector String CSS选择器

  • text String 输入文本

  • options Object 配置信息

    • delay Number 输入间隔时间,ms

page.send(method, params)

发送包含session的原始chrome devtools协议消息

  • method String 方法名

  • params Object 参数

page.scroll(selector)

滚动至指定元素可视区域,会尽量沿Y轴居中

  • selector String CSS选择器

page.focus(selector)

通过CSS选择器聚焦元素

  • selector String CSS选择器

page.getBoundingRect(selector)

通过CSS选择器获取元素坐标,值由getBoundingClientRect()函数获取

  • selector String CSS选择器

page.close()

关闭标签

page.prev()

导航到上一个历史标签页

page.next()

导航到下一个历史标签页

class: Element

用于实现可追溯的远程elment,避免代码重复提交和重复执行。

对于大的对象或DOM对象,直接返回它们并不现实,因此需要一种远程操作的增量机制。devtools通过保存注入函数的执行结果并返回引用id,实现状态追踪,这样就可以在已有远程结果基于上做增量操作。

elment.$(selector)

  • selector String

  • return Object Elment实例

选择单个元素,并生成远程引用对象

elment.$$(selector)

  • selector String

  • return Array 多个Elment实例数组

选择多个元素,并生成远程引用对象

elment.get(name)

  • name String

获取elment中指定的属性值

elment.set(name, value)

  • name String 属性名称

  • value * 属性值

设置elment中指定的属性值

elment.value(value)

  • value String 赋值

获取或设置值,仅适用于表单元素

elment.focus()

聚焦元素

elment.getBoundingRect()

通过getBoundingClientRect函数获取元素大小、坐标信息

elment.scrollIntoView()

于将指定元素快速切换至可视区域

class: Mouse

mouse.click(x, y, options)

新增模拟鼠标移动轨迹,原click可能出于效率考虑,只会触发一次mousemoved

click操作中已经包含了move,多数情况下不再需要单独模拟move操作,除非只移动鼠标而不需要点击

  • options Object

    • steps Number mousemoved事件的触发次数,默认20

mouse.move(x, y, options)

将steps默认值改为20,原值为1,即只触发一次。移动距离相同时,触发次数越少,对应的移动速度越快

  • options Object 选项

    • steps Number 触发mousemoved事件的次数,默认值20

mouse.scroll(x, y, step)

滚动至指定坐标,目前仅支持纵向滚动

  • x Number 横向坐标,0

  • y Number 纵向坐标

  • step Number 步长

class: Touch

touch.slide({start, end, steps})

模拟touch单点滑动手势

  • start Object 起始坐标

    • x Number touchstart x坐标

    • y Number touchstart y坐标

  • end Object 结束坐标

    • x Number touchend x坐标

    • y Number touchend y坐标

  • steps Number touchmove的触发次数

  • delay Number 触点释放前的停留时间,用于滑动惯性控制

touch.scroll(x, y, options)

通过touch滚动页面至指定的可视坐标

  • x Number 目标x坐标

  • y Number 目标y坐标

  • options Object

    • interval Number 连续滑动的时间间隔,默认2000,单位ms

Readme

Keywords

none

Package Sidebar

Install

npm i auto-chrome

Weekly Downloads

45

Version

1.2.7

License

ISC

Unpacked Size

87.1 kB

Total Files

17

Last publish

Collaborators

  • xiangle