Selenium 获取图像

Selenium 是一个 Web 自动化框架,可用于从网页获取所有图像链接。在本文中,我们将给出一个示例。

获取图像链接

首先,我们导入 selenium 模块并启动 Web 驱动程序对象。

driver = webdriver.Chrome(chrome_options=options)

该网页由 html 代码组成,由标签定义。要显示图像,网页上有一个代码:

<img src=".../image.jpg">

然后我们使用 img 标签(来自 html)找到所有元素:

images = driver.find_elements_by_tag_name('img')

最后我们使用以下方法打印每个图像的链接:

for image in images:
    print(image.get_attribute('src'))

完整代码:

from selenium import webdriver
 
options = webdriver.ChromeOptions()
options.add_argument('--ignore-certificate-errors')
options.add_argument("--test-type")
options.binary_location = "/usr/bin/chromium"
driver = webdriver.Chrome(chrome_options=options)
 
driver.get('http://imgur.com/')
 
images = driver.find_elements_by_tag_name('img')
for image in images:
    print(image.get_attribute('src'))
 
driver.close()

这将返回网页上的所有图片网址。

要下载 import urllib 并使用该行:

urllib.urlretrieve(src, "filename.png")

你也可以使用 os.system() 中的 wget;