从 HTML 文档文件中提取数据
Jsoup 可用于操作或从包含 HTML 的本地文件中提取数据。filePath
是磁盘上文件的路径。ENCODING
是理想的 Charset Name,例如“Windows-31J”。这是可选的。
// load file
File inputFile = new File(filePath);
// parse file as HTML document
Document doc = Jsoup.parse(filePath, ENCODING);
// select element by <a>
Elements elements = doc.select("a");