nltk 入門
NLTK 是構建 Python 程式以使用人類語言資料的領先平臺。它為 50 多種語料庫和詞彙資源 (如 WordNet) 提供了易於使用的介面,以及一套用於分類,標記化,詞幹化,標記,解析和語義推理的文字處理庫,用於工業級 NLP 庫的包裝器,和積極的討論論壇 。
這本書
Python 的自然語言處理 提供了語言處理程式設計的實用介紹。它由 NLTK 的建立者撰寫,引導讀者瞭解編寫 Python 程式,處理語料庫,分類文字,分析語言結構等的基礎知識。本書正在針對 Python 3 和 NLTK 3 進行更新。(最初的 Python 2 版本仍然可以在 http://nltk.org/book_1ed 上找到 。)