Hive 中的字数计数示例
文档文件(输入文件)
玛丽有只小羊羔
它的羊毛像雪一样白
玛丽去的地方
羔羊肯定会去的。
Hive 查询
CREATE TABLE FILES (line STRING);
LOAD DATA INPATH 'docs' OVERWRITE INTO TABLE FILES;
CREATE TABLE word_counts AS
SELECT word, count(1) AS count FROM
(SELECT explode(split(line, ' ')) AS word FROM FILES) w
GROUP BY word
ORDER BY word;
在 Hive 中输出 word_counts 表
玛丽,2
有,1
一个,1
小,1
羊肉,2
其 1
摇粒绒,1
是,2
白色,1
如,1
雪,1
并且,1
无处不在,1
即,1
所到之处,1
,1
肯定的是,1
于 1
走,1