node puppeteer(headless chrome)实现网站登录-eolink官网

node puppeteer(headless chrome)实现网站登录

puppeteer简介

puppeteer是Chrome团队开发的一个node库，可以通过api来控制浏览器的行为，比如点击，跳转，刷新，在控制台执行js脚本等等。有了这个神器，写个爬虫，自动签到，网页截图，生成pdf，自动化测试什么的，都不在话下。

puppeteer的简单例子

代码来自官网：

const puppeteer = require('puppeteer');

(async () => {

const browser = await puppeteer.launch();//打开浏览器

const page = await browser.newPage();//打开一个空白页

await page.goto('https://example.com');//在地址栏输入网址并等待加载

await page.screenshot({path: 'example.png'});//截个图

await browser.close();//关掉浏览器

})();

阅读上述代码，我们可以发现，1，代码中每一步都是异步操作，2，每一步操作都对应实际使用浏览器的一个行为。理解这两点对使用这个库有很大帮助。另外，比较常用的两个对象就是browser和page对象，对象上有一堆用来操作两个对象的方法。接下来，我们就写一个登录网站的小demo。

没有验证码的网站

对于没有验证码的网站，基本上就是输入账号，输入密码，点击登录这三步，需要用到page对象的两个方法：type用来在输入框中输入信息，click用来点击登录。下面以登录http://豆瓣为例来举个例子：

const puppeteer = require('puppeteer');

const account = `123456@qq.com`;

const password = `123456`;

(async () => {

const browser = await puppeteer.launch();//打开浏dyVPRHOl览器

const page = await browser.newPage();//打开一个空白页

await page.goto('https://douban.com/');//打开豆瓣网站

await page.type('#form_email', account);

await page.type('#form_password', password);

await page.click('.bn-submit');

await page.waitForNavigation({

waitUntil: 'load'

});//等待页面加载出来，等同于window.onload

await page.screenshot({path: 'example.png'});//截个图

await browser.close();//关掉浏览器

})();

有人说，我怎么知道到底有没有登录成功呢，一种调试的办法就是使用screenshot,如果你看到的是一个验证码页面，说明没有登录成功，还有一种办法像下面这样：

const browser = await puppeteer.launch({headless: false});//打开有界面的浏览器

传入headless：false后会真的打开一个浏览器的界面，这样你就可以实时看到代码执行到什么地方了。接下来我们说说碰到验证码时怎么办。

有验证码的网站

碰到有验证码的网站，可以将headless设成false，借助界面输入验证码,同时监听页面加载事件，实现登录，代码如下：

...

dyVPRHOl awadyVPRHOlit page.waitForNavigation({

waitUntil: 'load'

});//等待页面加载出来，等同于window.onload

//代码中监听跳转事件

if(page.url() === 'https://douban.com/accounts/login'){

//登录不成http://功

console.log('需要输入验证码');

//等待再一次跳转

while(true){

await page.waitForNavigation({

waitUntil: 'load'

})

console.log(page.url())

if(page.url() === 'https://douban.com/'){

console.log('登录成功');

break;

}

整体思路就是写也个循环，不断监听页面跳转，直到浏览器登录成功后跳转到首页为止。

Flask接口签名sign原理与实例代码浅析

717 2023-02-05

node puppeteer(headless chrome)实现网站登录

Flask接口签名sign原理与实例代码浅析

java中的接口是类吗

vue项目接口域名动态的获取方法

推荐文章

接口调用是什么意思？几种常用接口调用方式

接口设计原则

8款在线 API 接口文档管理工具

api管理系统是什么？

什么是接口调试？接口调试的步骤有哪些？

api 接口管理系统有哪些？

接口测试有几种测试方法

API文档生成工具有哪些？

微服务和api网关区别

交换机配置步骤

最近发表

热评文章

在线接口文档管理工具推荐，支持在线测试，HTTP接口

开源的在线接口文档wiki工具Mindoc的介绍与使

如何优雅的进行接口设计？接口设计的六大原则是什么？

什么是API测试,api检测公司

软件接口设计怎么做？前后端分离软件接口设计思路

接口管理平台推荐，几大接口管理平台总有一款适合你！