行程编码

运行是重复值或观察的连续序列。对于重复值,R 的游程编码根据其运行简明地描述了一个向量。考虑:

dat <- c(1, 2, 2, 2, 3, 1, 4, 4, 1, 1)

我们有一个 1 的长度; 然后是长度为 3 的 2s; 然后长度为一次 3s; 等等。R 的游程编码捕获了矢量运行的所有长度和值。

扩展

运行也可以参考表格数据中的连续观察。虽然 R 没有自然的编码方式,但可以使用 data.table 包中的 rleid 处理它们 (目前是一个死胡同)