官方发布的基本设置
这个例子讨论了如何从最新的官方版本中设置 CoreNLP。此示例将指导你下载程序包,并运行 CoreNLP 的简单命令行调用。
先决条件:
- Java JVM 8.命令
java -version
应该成功完成,如: java version“1.8.0_92” 。 - Zip 工具
- 例如:Bash 或类似的 shell,以及 wget
脚步:
-
下载 CoreNLP zip 文件: http : //stanfordnlp.github.io/CoreNLP/index.html#download :
wget http://nlp.stanford.edu/software/stanford-corenlp-full-2015-12-09.zip
-
解压缩版本:
unzip stanford-corenlp-full-2015-12-09.zip
-
输入新解压缩的目录:
cd stanford-corenlp-full-2015-12-09
-
设置类路径。如果你使用的是 IDE,则应在 IDE 中设置类路径。
for file in `find . -name "*.jar"`; do export CLASSPATH="$CLASSPATH:`realpath $file`"; done
如果你经常使用 CoreNLP,这在你的
~/.bashrc
(或等效)文件中有用,将目录/path/to/corenlp/
替换为解压缩 CoreNLP 的相应路径:for file in `find /path/to/corenlp/ -name "*.jar"`; do export CLASSPATH="$CLASSPATH:`realpath $file`"; done
-
试试看! 例如,以下内容将生成一个简单的文本文件进行注释,并在此文件上运行 CoreNLP。输出将作为 JSON 文件保存到
input.txt.out
。请注意,CoreNLP 需要相当多的内存。在大多数情况下,你应该给它至少 2GB(-mx2g
)。echo "the quick brown fox jumped over the lazy dog" > input.txt java -mx2g edu.stanford.nlp.pipeline.StanfordCoreNLP -outputFormat json -file input.txt