实木复合地板

Hive 0.13.0 及更高版本中的镶木地板柱状存储格式。Parquet 是从头开始构建的,其中考虑了复杂的嵌套数据结构,并使用 Dremel 文件中描述的记录粉碎和组装算法。我们相信这种方法优于嵌套名称空间的简单扁平化。

Parquet 旨在支持非常有效的压缩和编码方案。多个项目已经证明了将正确的压缩和编码方案应用于数据的性能影响。Parquet 允许在每列级别指定压缩方案,并且可以面向未来,以允许在发明和实现时添加更多编码。

在 Cloudera 发行版中推荐使用 Impala 表的 Parquet 文件格式。

请参阅: http//parquet.apache.org/documentation/latest/

CREATE TABLE parquet_table_name (x INT, y STRING) STORED AS PARQUET;