标签：Selenium - 🛫Qifei's Blog

如何利用Selenium实现更加高效的爬虫

1. 导语Selenium作为浏览器自动化工具，由于其可以直接执行js代码的优越性，经常被用做爬虫工具。但是，毕竟需要控制浏览器，低效率高内存始终是其难以甩掉的标签。在我个人爬虫开发中，对如何高效利用selenium有了一套个人的理解。 2. 用js注入代替selenium原生操作selenium库提供的execute_script方法使js注入成为可能。下面是一个js注入的例子 12js&...

2021-07-09 网络爬虫

阅读全文

Selenium-Webdriver接口

越来越多的人开始使用Serverless构架搭建自己的应用，而Serverless的缺点显而易见，很难自定义运行时。当我尝试在云函数搭建一个基于Webdriver的爬虫程序时，我了解到，基于python的Selenium应用还无法在云函数上运行，这是由于云函数并没有安装chrome浏览器。如果想在云函数上运行Selenium，则必须使用node.js 8.10版本+puppeteer插件。...

2021-02-23 网络爬虫

阅读全文

树莓派Chrome浏览器驱动webdriver

树莓派上的系统是基于Arm内核的Linux，且是32位系统，在Google上面下载的chromedriver在selenium运行时，会报错，可以直接使用apt-get安装chromedriver。安装命令： 1sudo apt-get install chromium-chromedriver 会自动识别树莓派上原有的chrome浏览器版本。在python程序中，可直接使用webdr...

2020-09-21 Linux

阅读全文

Selenium库常用操作记录

1：Selenium简介Selenium库是一个用于浏览器自动化pyhon库。对提高爬虫容错率有很好的效果。它可用于驱动浏览器，来帮助我们实现获取网站js脚本执行后的网页。 2：Selenium安装2.1 安装1pip install selenium 2.2 浏览器驱动下载浏览器驱动： Firefox浏览器驱动：geckodriver Chrome浏览器驱动：chromedriver ,...

2020-09-18 学习笔记

阅读全文