auto-chrome

使用Node.js自动化控制Chrome或Chromium，基于chrome devtools协议的高仿真用户行为模拟器。

借鉴于puppeteer，选择重写是因为在实际应用中puppeteer存在各种奇怪的bug，导致线程持续阻塞且难以被修复，一些实现细节也不符合预期。

chrome devtools协议api过于原始，对开发者而言并不友好。puppeteer api虽然功能丰富，但是操作依然过于繁琐，且存在一些难以规避的Bug。

auto-chrome以简洁和易用为设计原则，重点简化常见应用场景，通过扩展的方式满足定制化需求。

特性

支持自动聚焦，根据当前活跃标签自动切换标签，通过chrome.page获取当前处于激活状态的标签。这在实际应用中避免了多标签切换带来的苦恼，同时减少手动切换标签导致的混乱
支持主动导航监测，避免用户由于疏忽没有明确定义导航行为，导命操作错乱。
支持消息队列等待超时自动解除，由于各种不可控因素，devtools并不保证100%对所有发送的消息做出回应，在没有超时机制的状态下消息将处于持续等待状态，导致任务无法继续执行
解除鼠标、键盘、触控输入设备与页面的绑定，避免频繁在多个页面间切换设备
支持高仿真输入，模拟鼠标移动轨迹和Touch手势
简化的错误处理机制，即使任务出现异常依然能继续运行，尽可能保障线程不出现持久性阻塞
支持GPS定位

Install

npm install auto-chrome

chromium安装

由于网络环境因素，auto-chrome并没有像puppeteer那样直接将chromium作为npm依赖进行安装。因此你需要手动下载chromium，并在launch.executablePath配置项中指定安装路径。

推荐源：https://npm.taobao.org/mirrors/chromium-browser-snapshots/

chrome devtools术语

Target 表示浏览器中的某个目标对象，可以是browser、page、iframe、other类型之一。当type为page类型时，targetId对应于主框架的frame id。
Session session机制用于创建多个会话，可以为每个Target绑定独立的session，也可以让多个Target共享同一个session。
Page 浏览器标签，Chrome中允许打开多个Page，但始终只有一个Page处于激活状态。
Runtime JavaScript运行时，用于向网页注入JS代码实现对DOM的操作。
Frame 网页中的框架，主Frame中允许包含多个子Frame。
Context JavaScript运行时所处的的上下文，由于页面内可能包含Frame，每个Frame拥有独立的运行时，因此需要生成唯一contextId来区分它们。

注意事项

由于301重定向到新的url，连续多次触发上下文切换，导致上下文错位。301难以被察觉，且很难做预判，在调试时应该格外注意。

页面导航

浏览器导航事件可分为可预测和不可预测两种，由于触发导航的方式非常多，通过鼠标、键盘、JS脚本方式均可能触发未知的导航事件。如果导航切换时序不正确，会产生上下文消息错乱的bug。

可预测导航

对于chrome.newPage()、page.goto()这类明确包含导航行为的显性操作，autoChrome进行内部封装，在使用时不需要做额外的处理。

不可预测导航

导航可能刷新当前标签，也可能创建新标签
通过JS触发跳转链接的不可预测导航行为
点击链接后出现一次或多次301重定向
由于浏览器301缓存导致重定向的不确定性

针对以上情况，无法准确预判一个操作是否会触发导航事件。autoChrome中通过循环探测的方式来实现自动导航，该方案的缺点是时效不高，应用场景有限。

// 等待导航键盘示例代码
await Promise.all([
    chrome.keyboard.press("Enter"),
    chrome.autoNav()
])
 
// 鼠标示例
await Promise.all([
    page.click("#input"),
    chrome.autoNav()
])

高分屏分辨率

如果你的chrome运行在高分屏设备中，可能会出现touch事件错位的严重bug，这种情况可以尝试使用“--force-device-scale-factor=”来调整缩放比例。

autoChrome(options)

options Object 全局实例配置选项，优先级低于page
- args[ars, ...] Array Chrome启动参数数组
  - ars String Chrome启动参数
- executablePath String Chrome程序执行路径
- userDataDir String 用户配置文件路径，定义独立的Chrome实例，支持cluster模式下并行
- emulate Object 设备仿真，该配置对于初始标签不太凑效，可能由于初始targetCreated事件并没有被捕获。
  - viewport Object
    - mobile Boolean 移动设备，默认false
    - width Number 屏幕宽度，默认自适应屏幕宽度
    - height Number 屏幕高度，默认自适应屏幕高度
  - geolocation Object 地理位置，使用Google地图坐标
    - longitude Number 经度
    - latitude Number 纬度
    - accuracy Number 精准度
- headless Boolean 隐藏执行模式，默认false
- devtools Boolean 为每个page自动打开devtools，默认false
- timeOut Number 消息响应超时时间，默认150000
- ignoreHTTPSErrors Boolean 忽略https错误，默认false
- disableDownload Boolean 禁止下载文件，默认false
- loadTimeout Number 自动导航等待页面加载的最大停留时间，单位ms
return Chrome Chrome类实例

class: Chrome

chrome.clicker

mouse、touch事件实例，引用自当前活动状态page.clicker

chrome.keyboard

键盘事件实例，引用自当前活动状态page.keyboard

chrome.pages

包含所有打开page的Map对象

chrome.page

当前激活状态的page

chrome.newPage(url)

url String 打开网页地址，缺省时打开空白网页

chrome.closePageById(pageId)

通过pageId关闭指定的标签

pageId String 要删除page的id

chrome.createBrowserContext()

创建独立的浏览器环境，只能在隐身模式下运行。

chrome.send(method, params)

发送原始的chrome devtools协议消息

method String 方法名
params Object 参数

chrome.autoNav(time)

time Number 等待超时时间

循环监测，自动导航

chrome.close()

关闭浏览器

class: Page

page.clicker

mouse、touch事件实例，当autoChrome(options)配置项emulate.viewport.mobile值为true时，使用touch实例，否则使用mouse实例

page.keyboard

键盘实例

page.emulate(options)

设备仿真，直接调用该方法可能导致混乱，正常应该由事件驱动在创建标签执行page.emulate()，手动调用会存在延时覆盖问题。

options Object 选项
- mobile Boolean 移动设备
- width Number 屏幕宽度
- width Number 屏幕高度
- geolocation Object 地理位置
  - longitude Number 经度
  - latitude Number 纬度
  - accuracy Number 精准度

page.goto(url)

在标签内打开新网页

page.run(pageFunction, ...arg)

向页面注入js函数，获取执行后的返回值

pageFunction Function 注入函数
arg * 可序列化参数，不支持函数
return Object 远程资源相关信息，RemoteObject

page.$(selector)

选择单个元素

selector String CSS选择器
return Object 单个Elment实例

page.$$(selector)

选择多个元素

selector String CSS选择器
return Array 多个Elment实例数组

page.click(selector)

通过CSS选择器点击元素

page.clickNav(selector)

通过CSS选择器点击元素，内置导航

selector String CSS选择器

page.type(selector, text, options)

通过CSS选择器聚焦input，输入文本

selector String CSS选择器
text String 输入文本
options Object 配置信息
- delay Number 输入间隔时间，ms

page.send(method, params)

发送包含session的原始chrome devtools协议消息

method String 方法名
params Object 参数

page.scroll(selector)

滚动至指定元素可视区域，会尽量沿Y轴居中

selector String CSS选择器

page.focus(selector)

通过CSS选择器聚焦元素

selector String CSS选择器

page.getBoundingRect(selector)

通过CSS选择器获取元素坐标，值由getBoundingClientRect()函数获取

selector String CSS选择器

page.close()

关闭标签

page.prev()

导航到上一个历史标签页

page.next()

导航到下一个历史标签页

class: Element

用于实现可追溯的远程elment，避免代码重复提交和重复执行。

对于大的对象或DOM对象，直接返回它们并不现实，因此需要一种远程操作的增量机制。devtools通过保存注入函数的执行结果并返回引用id，实现状态追踪，这样就可以在已有远程结果基于上做增量操作。

elment.$(selector)

selector String
return Object Elment实例

选择单个元素，并生成远程引用对象

elment.$$(selector)

selector String
return Array 多个Elment实例数组

选择多个元素，并生成远程引用对象

elment.get(name)

name String

获取elment中指定的属性值

elment.set(name, value)

name String 属性名称
value * 属性值

设置elment中指定的属性值

elment.value(value)

value String 赋值

获取或设置值，仅适用于表单元素

elment.focus()

聚焦元素

elment.getBoundingRect()

通过getBoundingClientRect函数获取元素大小、坐标信息

elment.scrollIntoView()

于将指定元素快速切换至可视区域

class: Mouse

mouse.click(x, y, options)

新增模拟鼠标移动轨迹，原click可能出于效率考虑，只会触发一次mousemoved

click操作中已经包含了move，多数情况下不再需要单独模拟move操作，除非只移动鼠标而不需要点击

options Object
- steps Number mousemoved事件的触发次数，默认20

mouse.move(x, y, options)

将steps默认值改为20，原值为1，即只触发一次。移动距离相同时，触发次数越少，对应的移动速度越快

options Object 选项
- steps Number 触发mousemoved事件的次数，默认值20

mouse.scroll(x, y, step)

滚动至指定坐标，目前仅支持纵向滚动

x Number 横向坐标，0
y Number 纵向坐标
step Number 步长

class: Touch

touch.slide({start, end, steps})

模拟touch单点滑动手势

start Object 起始坐标
- x Number touchstart x坐标
- y Number touchstart y坐标
end Object 结束坐标
- x Number touchend x坐标
- y Number touchend y坐标
steps Number touchmove的触发次数
delay Number 触点释放前的停留时间，用于滑动惯性控制

touch.scroll(x, y, options)

通过touch滚动页面至指定的可视坐标

x Number 目标x坐标
y Number 目标y坐标
options Object
- interval Number 连续滑动的时间间隔，默认2000，单位ms

auto-chrome

auto-chrome

特性

Install

chromium安装

chrome devtools术语

注意事项

页面导航

可预测导航

不可预测导航

高分屏分辨率

autoChrome(options)

class: Chrome

chrome.clicker

chrome.keyboard

chrome.pages

chrome.page

chrome.newPage(url)

chrome.closePageById(pageId)

chrome.createBrowserContext()

chrome.send(method, params)

chrome.autoNav(time)

chrome.close()

class: Page

page.clicker

page.keyboard

page.emulate(options)

page.goto(url)

page.run(pageFunction, ...arg)

page.$(selector)

page.$$(selector)

page.click(selector)

page.clickNav(selector)

page.type(selector, text, options)

page.send(method, params)

page.scroll(selector)

page.focus(selector)

page.getBoundingRect(selector)

page.close()

page.prev()

page.next()

class: Element

elment.$(selector)

elment.$$(selector)

elment.get(name)

elment.set(name, value)

elment.value(value)

elment.focus()

elment.getBoundingRect()

elment.scrollIntoView()

class: Mouse

mouse.click(x, y, options)

mouse.move(x, y, options)

mouse.scroll(x, y, step)

class: Touch

touch.slide({start, end, steps})

touch.scroll(x, y, options)

Readme

Keywords

Package Sidebar

Install

Repository

Homepage

DownloadsWeekly Downloads

Version

License

Unpacked Size

Total Files

Last publish

Collaborators

Weekly Downloads