捲曲刮痧

Created: November-22, 2018

匯入：

from subprocess import Popen, PIPE
from lxml import etree
from io import StringIO

下載：

user_agent = 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_11_6) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/55.0.2883.95 Safari/537.36'
url = 'http://stackoverflow.com'
get = Popen(['curl', '-s', '-A', user_agent, url], stdout=PIPE)
result = get.stdout.read().decode('utf8')

-s：無聲下載

-A：使用者代理標誌

解析：

tree = etree.parse(StringIO(result), etree.HTMLParser())
divs = tree.xpath('//div')