内容

作者:Sonali Arora(sarora@fredhutch.org
日期:2015年7月20日至22日

本课程中的材料需要R版本3.2.1和Bioconductor版本3.2

0.1r

0.2基础r中有用的功能

0.3在R中获得帮助

0.4R中的数据类型

0.5R编程概念

平均(1:10)
## [1] 5.5
rnorm(1:10)
## [1] -0.33290892 -1.03732032 0.00358368 -0.45695476 1.00505058 0.67227284 -0.90495556 -1.45142584
摘要(rnorm(1:10))
##最小。第1次。中值平均第三次。最大限度。## -0.9524 -0.4189 0.4298 0.3124 0.6072 2.2260
数据(虹膜)#找到petal.width正好为0.2 iris [iris $ petal.width == 0.2,]的那些行。
## sepal.length Sepal.Width Petal.length Petal.Width物种## 1 5.1 3.5 1.4 0.2 Setosa ## 2 4.9 3.0 1.4 0.4 0.2 Setosa ## 3 4.7 3.2 1.3 0.2 1.3 0.2 Setosa ## 4 4.6 4.6 4.6 3.1 1.5 0.2 Setosa ## 5 0.2 Setosa ## 5 0.25.0 3.6 1.4 0.2 setosa ## 8 5.0 3.4 1.5 0.2 setosa ## 9 4.4 2.9 1.4 0.2 setosa ## 11 5.4 3.7 1.5 0.2 setosa ## 12 4.8 3.4 1.6 0.2 setosa ## 15 5.8 4.0 1.2 0.2 setosa ## 21 5.4 3.41.7 0.2 setosa ## 23 4.6 3.6 1.0 0.2 setosa ## 25 4.8 3.4 3.4 1.9 0.2 setosa ## 26 5.0 3.0 3.0 1.6 0.6 0.2 setosa ## 28 5.2 3.5 1.5 0.2 setosa ## 29 5.2 29 5.2 3.4 1.4 1.4 1.4 1.4 1.4 0.2setosa ## 31 4.8 3.1 1.6 0.2 setosa ## 34 5.5 4.2 4.2 1.4 0.2 setosa ## 35 4.9 4.9 3.1 1.5 0.2 setosa ## 36 56 5.0 3.2 1.2 1.2 0.2 setosa ## 37 5.5 3.5 3.5 3.5 1.3 0.2 setosa ## 39 4.4 3.0 1.3 0.4 3.0 1.3 0.2 setosa#2 setosa#2 setosa##40 5.1 3.4 1.5 0.2 setosa ## 43 4.4 3.2 1.3 0.2 setosa ## 47 5.1 3.8 1.6 0.6 0.2 setosa ## 48 4.6 4.6 3.2 1.4 0.2 setosa ## 49 5.3 3.7 1.5 1.5 0.2 setosa ## setosa ## 50 50 50 50 50 50 3.3 1.4 0.2 setosa 0.2 setosa 0.2 setosa
#找到那些sepal.length的行小于4.5 iris [iris $ sepal.length <4.5,]
## sepal.length Sepal.Width Petal.length Petal.Width物种## 9 4.4 2.9 1.4 0.2 setosa ## 14 4.3 3.0 1.1 0.1 setosa ## 39 4.4 3.0 1.3 0.3 0.3 0.2 setosa ## 43 4.4 3.4 3.4 3.2 1.3 0.2 setosa setosa setosa
#找到属于setosa setosa_iris = iris的所有行
## [1] 50 5
头(setosa_iris)
## sepal.length Sepal.Width Petal.length Petal.Width物种## 1 5.1 3.5 1.4 0.2 Setosa ## 2 4.9 3.0 1.4 0.4 0.2 Setosa ## 3 4.7 3.2 1.3 0.2 1.3 0.2 Setosa ## 4 4.6 4.6 4.6 3.1 1.5 0.2 Setosa ## 5 0.2 Setosa ## 5 0.25.0 3.6 1.4 0.2 setosa ## 6 5.4 3.9 1.7 0.4 setosa
#删除包含字符的列,即iris <-iris [,!(inames in fim%“物种”)] dim(iris)
## [1] 150 4
#找到前4列的平均值lapply(iris,均值)#简单:colmeans(iris)
## $ sepal.length ## [1] 5.843333 ## ## $ sepal.width ## [1] 3.057333 ## ## ## $ petal.length.length ## [1] 3.758 ## ## ## $ petal.width ##[1] 1.199333
#简化结果sapply(虹膜,平均)
## sepal.length Sepal.Width Petal.Length Petal.Width ## 5.843333 3.057333 3.758000 1.1993333333333
#找到每行的平均值。申请(虹膜,1,平均)#simpler:Rowmeans(iris)
## [1] 2.550 2.375 2.350 2.350 2.550 2.850 2.425 2.525 2.225 2.225 2.400 2.700 2.500 2.325 2.325 2.125 2.800 ## [16] 3.000 2.750 2.750 2.575 2.575 2.875 2.675 2.675 2.675 2.675 2.575 2.575 2.575 2.575 2.575 2.575 2.575 2.575 2.575 2.575 2.575 2.575 2.575 2.45.575 #45.575 #45.5752.452.452.452.452.45.45.45.45.45.45#ime2.400 2.625 2.500 2.225 2.550 2.525 2.100 2.275 2.675 2.800 ## [46] 2.375 2.675 2.350 2.675 2.475 4.075 3.900 4.100 3.275 3.850 3.575 3.975 2.900 3.850 3.300 ## [61] 2.875 3.650 3.300 3.775 3.350 3.900 3.650 3.400 3.600 3.275 3.925 3.550 3.800 3.700 3.725## [76] 3.850 3.950 4.100 3.725 3.200 3.200 3.150 3.400 3.850 3.600 3.875 4.000 3.575 3.500 3.325 ## [91] 3.425 3.775 3.400 2.900 3.450 3.525 3.525 3.675 2.925 3.475 4.525 3.875 4.525 4.150 4.375 ## [106] 4.825 3.400 4.575 4.200 4.8504.200 4.075 4.350 3.800 4.025 4.300 4.200 5.100 4.875 3.675 ## [121] 4.525 3.825 4.800 3.925 4.450 4.550 3.900 3.950 4.225 4.400 4.550 5.025 4.250 3.925 3.925 ## [136] 4.775 4.425 4.200 3.900 4.375 4.450 4.350 3.875 4.550 4.550 4.300 3.925 4.175 4.325 3.950

0.6R作为统计计算环境

#定义向量x <-rnorm(1000)#矢量计算y <-x + rnorm(1000,sd = .8)#对象构造df <-data.frame(x = x,y = y)#线性模型拟合<-lm(y〜x,df)

0.7在R中可视化数据

par(mfrow = c(1,2))图(y〜x,df,cex.lab = 2)abline(fit,col =“ red”,lwd = 2)library(ggplot2)ggplot(df,aes(x x),y)) + geom_point() + stat_smooth(method =“ lm”)

0.8SessionInfo()

SessionInfo()
## R版本3.2.1(2015-06-18)##平台:x86_64- inknown-linux-gnu(64位)##运行下:ubuntu 14.04.2 lts ## ## ## ## locale:## [1] lc_ctype = en_us.utf-8 lc_numeric = c lc_time = en_us.utf-8 ## [4] lc_collat​​e = c lc_monetary = en_us.utf-8 lc_messages = en_us.us.utf-8 ## [7]-8 lc_name = c lc_address = c ## [10] lc_telephone = c lc_measurement = en_us.utf-8 lc_istification = c ## ## ## ##附件基本软件包:## [1] Stats stats grdevices grdevices grdevices grdevices grdevices utils utils utils datasets datasets datasets base ## ## ## ## ## ## ## ## ## ## ## ##其他随附的软件包:## [1] ggplot2_1.0.1 biocStyle_1.7.7.4 ## ## ##通过命名空间加载(并且未连接):## [1] rcpp_0.11.11.1 codeTools_0.2-14grid_3.2.1 ## [6] plyr_1.8.3 gtable_0.1.1 formatr_1.2 magrittr_1.5 scales_0.2.5 ## [11] evaliuate_0.0.7 stringuate_0.5-5 reshape2_1.1.1.1.1.1.1.1.1.4.1 rmarkdown_0.0.0.0.0.0.7 labelling_0.0.0.3 ## [16]Proto_0.3-10 Tools_3.2.1 StringR_1.0.0 Munsell_0.4.4