在 HDFS 中查找文件

要在 Hadoop 分布式文件系统中查找文件:

hdfs dfs -ls -R / | grep [search_term]

在上面的命令中,

-ls 用于列出文件

-R 用于递归(遍历子目录)

/表示从根目录

|将第一个命令的输出传递给第二个命令

grep 命令提取匹配的字符串

要在 hadoop 文件系统中的所有文件列表中搜索的 [search_term] 文件名。

或者,也可以使用以下命令查找并应用一些表达式:

hadoop fs -find / -name test -print

查找与指定表达式匹配的所有文件,并将选定的操作应用于它们。如果未指定路径,则默认为当前工作目录。如果未指定表达式,则默认为 -print。

识别以下主要表达式:

  • name pattern
  • iname pattern

如果文件的基名与使用标准文件系统通配符的模式匹配,则求值为 true。如果使用 -iname,则匹配不区分大小写。

  • print
  • print0Always

评估为真。导致将当前路径名写入标准输出。如果使用 -print0 表达式,则附加 ASCII NULL 字符。

识别以下运算符:

expression -a expression
expression -and expression
expression expression