箱线图

来自Wiki.Citydatum
Reiziuh讨论 | 贡献2017年9月14日 (四) 21:05的版本
跳转至: 导航搜索
TODO
提示:该页面还需进一步完善,来搭把手吧!


BoxPlot.jpg

箱线图(也称箱须图,box-and-whisker plot)、箱形图(boxplot)都是利用分位值来描述数值型数据分散情况的图示化表达方法,可以应用于各类数值型数据的描述性统计。箱线图通过添加上下延伸的线,来描述落在上、下四分位以外数值的分布情况。异常值(outlier)通常以独立的点来表示。在城市数据分析和城市规划领域中,箱形图有更多的潜在应用可能,如地块指标赋值的描述性统计分析,校核异常值等。

箱形图概述

箱形图、箱线图在箱体部分的绘制方法和代表含义是一致的:箱体上边为上四分位值(1st quartile),中线为中位值(2nd quartile/median),箱体下边为下四分位值(3rd quartial)。但箱线图上下延伸线代表的含义不尽相同,常见的有:

箱形图绘制

  • 人工绘制箱线图:先绘制数轴,计算需要的分位值;随后根据上下四分位和中位值绘制箱体;再根据需要计算和绘制异常值截断点(也被称为内限)、外限等要素;最后标注异常值(有时会区分温和异常值、极端异常值);
  • Excel绘制箱线图:
  • R语言绘制箱线图:

箱形图应用

参考资料