使用 Python 的 Stanford CoreNLP
你首先需要執行 Stanford CoreNLP 伺服器:
java -mx4g -cp "*" edu.stanford.nlp.pipeline.StanfordCoreNLPServer -port 9000 -timeout 50000
這是一個程式碼片段,展示瞭如何使用 pycorenlp
Python 包將資料傳遞到 Stanford CoreNLP 伺服器。
from pycorenlp import StanfordCoreNLP
import pprint
if __name__ == '__main__':
nlp = StanfordCoreNLP('http://localhost:9000')
fp = open("long_text.txt")
text = fp.read()
output = nlp.annotate(text, properties={
'annotators': 'tokenize,ssplit,pos,depparse,parse',
'outputFormat': 'json'
})
pp = pprint.PrettyPrinter(indent=4)
pp.pprint(output)