官方釋出的基本設定
這個例子討論瞭如何從最新的官方版本中設定 CoreNLP。此示例將指導你下載程式包,並執行 CoreNLP 的簡單命令列呼叫。
先決條件:
- Java JVM 8.命令
java -version
應該成功完成,如: java version“1.8.0_92” 。 - Zip 工具
- 例如:Bash 或類似的 shell,以及 wget
腳步:
-
下載 CoreNLP zip 檔案: http : //stanfordnlp.github.io/CoreNLP/index.html#download :
wget http://nlp.stanford.edu/software/stanford-corenlp-full-2015-12-09.zip
-
解壓縮版本:
unzip stanford-corenlp-full-2015-12-09.zip
-
輸入新解壓縮的目錄:
cd stanford-corenlp-full-2015-12-09
-
設定類路徑。如果你使用的是 IDE,則應在 IDE 中設定類路徑。
for file in `find . -name "*.jar"`; do export CLASSPATH="$CLASSPATH:`realpath $file`"; done
如果你經常使用 CoreNLP,這在你的
~/.bashrc
(或等效)檔案中有用,將目錄/path/to/corenlp/
替換為解壓縮 CoreNLP 的相應路徑:for file in `find /path/to/corenlp/ -name "*.jar"`; do export CLASSPATH="$CLASSPATH:`realpath $file`"; done
-
試試看! 例如,以下內容將生成一個簡單的文字檔案進行註釋,並在此檔案上執行 CoreNLP。輸出將作為 JSON 檔案儲存到
input.txt.out
。請注意,CoreNLP 需要相當多的記憶體。在大多數情況下,你應該給它至少 2GB(-mx2g
)。echo "the quick brown fox jumped over the lazy dog" > input.txt java -mx2g edu.stanford.nlp.pipeline.StanfordCoreNLP -outputFormat json -file input.txt