官方发布的基本设置

这个例子讨论了如何从最新的官方版本中设置 CoreNLP。此示例将指导你下载程序包,并运行 CoreNLP 的简单命令行调用。

先决条件:

  • Java JVM 8.命令 java -version 应该成功完成,如: java version“1.8.0_92”
  • Zip 工具
  • 例如:Bash 或类似的 shell,以及 wget

脚步:

  1. 下载 CoreNLP zip 文件: http : //stanfordnlp.github.io/CoreNLP/index.html#download :

    wget http://nlp.stanford.edu/software/stanford-corenlp-full-2015-12-09.zip
    
  2. 解压缩版本:

    unzip stanford-corenlp-full-2015-12-09.zip
    
  3. 输入新解压缩的目录:

    cd stanford-corenlp-full-2015-12-09
    
  4. 设置类路径。如果你使用的是 IDE,则应在 IDE 中设置类路径。

    for file in `find . -name "*.jar"`; do export CLASSPATH="$CLASSPATH:`realpath $file`"; done
    

    如果你经常使用 CoreNLP,这在你的~/.bashrc(或等效)文件中有用,将目录/path/to/corenlp/替换为解压缩 CoreNLP 的相应路径:

    for file in `find /path/to/corenlp/ -name "*.jar"`; do export CLASSPATH="$CLASSPATH:`realpath $file`"; done
    
  5. 试试看! 例如,以下内容将生成一个简单的文本文件进行注释,并在此文件上运行 CoreNLP。输出将作为 JSON 文件保存到 input.txt.out。请注意,CoreNLP 需要相当多的内存。在大多数情况下,你应该给它至少 2GB(-mx2g)。

    echo "the quick brown fox jumped over the lazy dog" > input.txt
    java -mx2g edu.stanford.nlp.pipeline.StanfordCoreNLP -outputFormat json -file input.txt