根据表格数据计算列中值的中位数
给定一个文件使用 ;
作为列分隔符。我们使用以下为 GNU awk 编写的程序计算第二列中值的中值。提供的输入是学生组的成绩列表:
gawk -F';' '{ sample[NR] = $2 }
END {
asort(sample);
if(NR % 2 == 1) {
print(sample[int(NR/2) + 1])
} else {
print(sample[NR/2])
}
}' <<EOF
Alice;2
Victor;1
Barbara;1
Casper;4
Deborah;0
Ernest;1
Fabiola;4
Giuseppe;4
EOF
这个程序的输出是 1
。
请记住,NR
保存正在处理的行的编号,因此在 END
块中它保存文件中的总行数。
awk 的许多实现没有对数组进行排序的函数,因此需要在使用上面的代码之前对其进行定义。