“箱线图”的版本间的差异

来自Wiki.Citydatum
跳转至: 导航搜索
第2行: 第2行:
  
 
[[文件:BoxPlot.jpg|缩略图]]
 
[[文件:BoxPlot.jpg|缩略图]]
箱形图(boxplot)是一种利用[[分位值]]来描述数值型数据分散情况的图示化表达方法,可以应用于各类数值型数据的描述性统计。箱形图也和通过上下延伸的线,来描述落在上、下四分位以外数值的分布情况,因而也被称为箱线图或箱须图(box-and-whisker plot)。在城市数据分析和城市规划领域中,箱形图有更多的潜在应用可能,如用来规划指标赋值的描述性统计分析,校核异常值等。
+
'''箱线图'''(也称'''箱须图''',box-and-whisker plot)、'''箱形图'''(boxplot)都是利用[[分位值]]来描述数值型数据分散情况的图示化表达方法,可以应用于各类数值型数据的[[描述性统计]]。箱线图通过添加上下延伸的线,来描述落在上、下四分位以外数值的分布情况。异常值(outlier)通常以独立的点来表示。在城市数据分析和城市规划领域中,箱形图有更多的潜在应用可能,如地块指标赋值的描述性统计分析,校核异常值等。
  
 
== 箱形图概述 ==
 
== 箱形图概述 ==
箱线图应用[[分位值]]概念,主要包含六个数据节点,将一组数据从大到小排列,分别计算出他的上边缘,上四分位数Q3,[[中位数]],下四分位数Q1,下边缘,还有一个异常值。
+
箱形图、箱线图在箱体部分的绘制方法和代表含义是一致的:箱体上边为'''上四分位值'''(1st quartile),中线为'''中位值'''(2nd quartile/median),箱体下边为下'''四分位值'''(3rd quartial)。但箱线图上下延伸线代表的含义不尽相同,常见的有:
  
 
== 箱形图绘制 ==
 
== 箱形图绘制 ==
 +
* 人工绘制箱线图:先绘制数轴,计算需要的分位值;随后根据上下四分位和中位值绘制箱体;再根据需要计算和绘制异常值截断点(也被称为内限)、外限等要素;最后标注异常值(有时会区分温和异常值、极端异常值);
 +
* Excel绘制箱线图:
 +
* R语言绘制箱线图:
  
 
== 箱形图应用 ==
 
== 箱形图应用 ==
 +
* [http://blog.citydatum.com/2017/08/24/r%E8%AF%AD%E8%A8%80%E5%BA%94%E7%94%A8%EF%BC%9A%E6%8E%A7%E8%A7%84%E6%8C%87%E6%A0%87%E6%A0%A1%E9%AA%8C/ 用箱线图进行控规地块指标的描述性统计分析,校核异常值];
  
 
== 参考资料 ==
 
== 参考资料 ==

2017年9月14日 (四) 20:05的版本

TODO
提示:该页面还需进一步完善,来搭把手吧!


BoxPlot.jpg

箱线图(也称箱须图,box-and-whisker plot)、箱形图(boxplot)都是利用分位值来描述数值型数据分散情况的图示化表达方法,可以应用于各类数值型数据的描述性统计。箱线图通过添加上下延伸的线,来描述落在上、下四分位以外数值的分布情况。异常值(outlier)通常以独立的点来表示。在城市数据分析和城市规划领域中,箱形图有更多的潜在应用可能,如地块指标赋值的描述性统计分析,校核异常值等。

箱形图概述

箱形图、箱线图在箱体部分的绘制方法和代表含义是一致的:箱体上边为上四分位值(1st quartile),中线为中位值(2nd quartile/median),箱体下边为下四分位值(3rd quartial)。但箱线图上下延伸线代表的含义不尽相同,常见的有:

箱形图绘制

  • 人工绘制箱线图:先绘制数轴,计算需要的分位值;随后根据上下四分位和中位值绘制箱体;再根据需要计算和绘制异常值截断点(也被称为内限)、外限等要素;最后标注异常值(有时会区分温和异常值、极端异常值);
  • Excel绘制箱线图:
  • R语言绘制箱线图:

箱形图应用

参考资料