Selenium 獲取影象
Selenium 是一個 Web 自動化框架,可用於從網頁獲取所有影象連結。在本文中,我們將給出一個示例。
獲取影象連結
首先,我們匯入 selenium 模組並啟動 Web 驅動程式物件。
driver = webdriver.Chrome(chrome_options=options)
該網頁由 html 程式碼組成,由標籤定義。要顯示影象,網頁上有一個程式碼:
<img src=".../image.jpg">
然後我們使用 img
標籤(來自 html)找到所有元素:
images = driver.find_elements_by_tag_name('img')
最後我們使用以下方法列印每個影象的連結:
for image in images:
print(image.get_attribute('src'))
完整程式碼:
from selenium import webdriver
options = webdriver.ChromeOptions()
options.add_argument('--ignore-certificate-errors')
options.add_argument("--test-type")
options.binary_location = "/usr/bin/chromium"
driver = webdriver.Chrome(chrome_options=options)
driver.get('http://imgur.com/')
images = driver.find_elements_by_tag_name('img')
for image in images:
print(image.get_attribute('src'))
driver.close()
這將返回網頁上的所有圖片網址。
要下載 import urllib 並使用該行:
urllib.urlretrieve(src, "filename.png")
你也可以使用 os.system()
中的 wget
;