Selenium 獲取影象

Selenium 是一個 Web 自動化框架,可用於從網頁獲取所有影象連結。在本文中,我們將給出一個示例。

獲取影象連結

首先,我們匯入 selenium 模組並啟動 Web 驅動程式物件。

driver = webdriver.Chrome(chrome_options=options)

該網頁由 html 程式碼組成,由標籤定義。要顯示影象,網頁上有一個程式碼:

<img src=".../image.jpg">

然後我們使用 img 標籤(來自 html)找到所有元素:

images = driver.find_elements_by_tag_name('img')

最後我們使用以下方法列印每個影象的連結:

for image in images:
    print(image.get_attribute('src'))

完整程式碼:

from selenium import webdriver
 
options = webdriver.ChromeOptions()
options.add_argument('--ignore-certificate-errors')
options.add_argument("--test-type")
options.binary_location = "/usr/bin/chromium"
driver = webdriver.Chrome(chrome_options=options)
 
driver.get('http://imgur.com/')
 
images = driver.find_elements_by_tag_name('img')
for image in images:
    print(image.get_attribute('src'))
 
driver.close()

這將返回網頁上的所有圖片網址。

要下載 import urllib 並使用該行:

urllib.urlretrieve(src, "filename.png")

你也可以使用 os.system() 中的 wget;