Selenium 获取图像
Selenium 是一个 Web 自动化框架,可用于从网页获取所有图像链接。在本文中,我们将给出一个示例。
获取图像链接
首先,我们导入 selenium 模块并启动 Web 驱动程序对象。
driver = webdriver.Chrome(chrome_options=options)
该网页由 html 代码组成,由标签定义。要显示图像,网页上有一个代码:
<img src=".../image.jpg">
然后我们使用 img
标签(来自 html)找到所有元素:
images = driver.find_elements_by_tag_name('img')
最后我们使用以下方法打印每个图像的链接:
for image in images:
print(image.get_attribute('src'))
完整代码:
from selenium import webdriver
options = webdriver.ChromeOptions()
options.add_argument('--ignore-certificate-errors')
options.add_argument("--test-type")
options.binary_location = "/usr/bin/chromium"
driver = webdriver.Chrome(chrome_options=options)
driver.get('http://imgur.com/')
images = driver.find_elements_by_tag_name('img')
for image in images:
print(image.get_attribute('src'))
driver.close()
这将返回网页上的所有图片网址。
要下载 import urllib 并使用该行:
urllib.urlretrieve(src, "filename.png")
你也可以使用 os.system()
中的 wget
;