箱線圖
箱線圖或箱形圖是由5個(gè)特征值繪制而成的圖形,其有一個(gè)箱子和兩條線段組成。5個(gè)特征值是變量的最大值、最小值、中位數(shù)、第一四分位數(shù)和第三四分位數(shù)。連接兩個(gè)分位數(shù)畫(huà)出一個(gè)箱子,箱子用中位數(shù)分割,把兩個(gè)極值點(diǎn)與箱子用線條連接,即成箱線圖。箱線圖的形式如下圖所示:

圖片來(lái)源于網(wǎng)絡(luò)
在R中繪制箱線圖可以使用boxplot函數(shù)。
boxplot函數(shù)的基本用法為:
boxplot(x, ...)
公式形式的用法
boxplot(formula, data = NULL, ..., subset, na.action = NULL,
drop = FALSE, sep = ".", lex.order = FALSE)
默認(rèn)用法:
boxplot(x, ..., range = 1.5, width = NULL, varwidth = FALSE,
notch = FALSE, outline = TRUE, names, plot = TRUE,
border = par("fg"), col = NULL, log = "",
pars = list(boxwex = 0.8, staplewex = 0.5, outwex = 0.5),
horizontal = FALSE, add = FALSE, at = NULL)
主要參數(shù)的含義:
x: 向量,列表或數(shù)據(jù)框。
formula: 公式,形如y~grp,其中y為向量,grp是數(shù)據(jù)的分組,通常為因子。
data: 數(shù)據(jù)框或列表,用于提供公式中的數(shù)據(jù)。
range: 數(shù)值,默認(rèn)為1.5,表示觸須的范圍,即range × (Q3 - Q1)
width: 箱體的相對(duì)寬度,當(dāng)有多個(gè)箱體時(shí),有效。
varwidth: 邏輯值,控制箱體的寬度, 只有圖中有多個(gè)箱體時(shí)才發(fā)揮作用,默認(rèn)為FALSE, 所有箱體的寬度相同,當(dāng)其值為T(mén)RUE時(shí),代表每個(gè)箱體的樣本量作為其相對(duì)寬度
notch: 邏輯值,如果該參數(shù)設(shè)置為T(mén)RUE,則在箱體兩側(cè)會(huì)出現(xiàn)凹口。默認(rèn)為FALSE。
outline: 邏輯值,如果該參數(shù)設(shè)置為FALSE,則箱線圖中不會(huì)繪制離群值。默認(rèn)為T(mén)RUE。
names:繪制在每個(gè)箱線圖下方的分組標(biāo)簽。
plot : 邏輯值,是否繪制箱線圖,如設(shè)置為FALSE,則不繪制箱線圖,而給出繪制箱線圖的相關(guān)信息,如5個(gè)點(diǎn)的信息等。
border:箱線圖的邊框顏色。
col:箱線圖的填充色。
horizontal:邏輯值,指定箱線圖是否水平繪制,默認(rèn)為FALSE。
下面舉例說(shuō)明R中繪制箱線圖的方法:
統(tǒng)計(jì)某中學(xué)學(xué)生的身高數(shù)據(jù)如下:
144,166,163,143,152,169,130,159,160,175,161,170,146,159,150,183,165,146,169
繪制其箱線圖
(1)簡(jiǎn)單的使用
h <- c(144,166,163,143,152,169,130,159,160,175,161,170,
146,159,150,183,165,146,169)
boxplot(h)
結(jié)果如下圖所示:

(2)多組的箱線圖
某工廠推行新的工作方法,實(shí)驗(yàn)組和對(duì)照組(原方法)的工作效率(每小時(shí)產(chǎn)量),如下面的數(shù)據(jù):
試驗(yàn)組:35, 41, 40, 37, 43, 32, 39, 46
對(duì)照組:32, 39, 34, 36, 32, 38, 34, 31
繪制其箱線圖。
編寫(xiě)R程序如下:
x <- c(35, 41, 40, 37, 43, 32, 39, 46, 32, 39, 34, 36, 32, 38, 34, 31)
f <- factor(rep(c("試驗(yàn)組","對(duì)照組"),each=8))
data<- data.frame(x,f)
boxplot(x~f,data)
結(jié)果如下圖所示:

(3)width參數(shù)的效果
x <- c(35, 41, 40, 37, 43, 32, 39, 46, 32, 39, 34, 36, 32, 38, 34, 31)
f <- factor(rep(c("試驗(yàn)組","對(duì)照組"),each=8))
data<- data.frame(x,f)
boxplot(x~f,data,width=c(1,2),ylab="工作效率(個(gè)/小時(shí))")
效果圖如下圖所示:

(4)箱體顏色
x <- c(35, 41, 40, 37, 43, 32, 39, 46, 32, 39, 34, 36, 32, 38, 34, 31)
f <- factor(rep(c("試驗(yàn)組","對(duì)照組"),each=8))
data<- data.frame(x,f)
boxplot(x~f,data,width=c(1,2),col=c(2,3),border=c("darkgray","purple"))
效果如下圖所示:

(5)帶凹口的箱線圖
x <- c(35, 41, 40, 37, 43, 32, 39, 46, 32, 39, 34, 36, 32, 38, 34, 31)
f <- factor(rep(c("試驗(yàn)組","對(duì)照組"),each=8))
data<- data.frame(x,f)
boxplot(x~f,data,width=c(1,2),col=c(2,3),notch=TRUE)
如下圖所示:

新聞熱點(diǎn)
疑難解答
圖片精選