根据表格数据计算列中值的中位数

给定一个文件使用 ; 作为列分隔符。我们使用以下为 GNU awk 编写的程序计算第二列中值的中值。提供的输入是学生组的成绩列表:

gawk -F';' '{ sample[NR] = $2 }
 END {
   asort(sample);
   if(NR % 2 == 1) {
     print(sample[int(NR/2) + 1])
   } else {
     print(sample[NR/2])
   }
}' <<EOF
Alice;2
Victor;1
Barbara;1
Casper;4
Deborah;0
Ernest;1
Fabiola;4
Giuseppe;4
EOF

这个程序的输出是 1

请记住,NR 保存正在处理的行的编号,因此在 END 块中它保存文件中的总行数。

awk 的许多实现没有对数组进行排序的函数,因此需要在使用上面的代码之前对其进行定义。