recountmethylation 1.8.3
recountmethylation
是一个R/Bioconductor包,提供资源来访问和分析来自基因表达Omnibus (GEO)的公共DNA甲基化(DNAm)阵列数据汇编。数据库编译文件跨越两个数组平台,包括挖掘的、映射的和基于模型的样例元数据。可以以各种格式和数据存储类型访问DNAm信号。本用户指南说明如何使用recountmethylation
包,包括关于平台和数据类型的关键背景,以及使用2个小示例文件的可运行示例。附加信息和更高级的分析示例包含在其他包插图中。bob彩票平台
数据库编译文件的下载和访问是由get_db
函数,其中DNAm数组平台类型使用平台
参数(见get_db ?
详情)。目前支持HM450K和EPIC/HM850K平台(参见下面的平台详细信息)。请注意,存储单个数据库文件最多需要193 Gb的磁盘空间。文件对样本元数据和分析数据在各种格式,包括HDF5-SummarizedExperiment
数据库目录,以及HDF5
数据库文件.h5
扩展。
数据库位于https://methylation.recount.bio/,文件详情如下:
sm <- as.data.frame(get_servermatrix()) sm$version <- ifelse(grepl("0-0-1", sm$filename), "v0.0.1", ifelse(grepl("0-0-2", sm$filename), "v0.0.2", ifelse(grepl("0-0-3", sm$filename), "v0.0.3", "NA"))) sm$ ' size (bytes) ' <- unlist(lapply(sm$ ' size (bytes) ', function(si){val <- unlist(strsplit(si, ";")) val <- paste0(round(as.numeric(gsub("。* = ", "", val [1])) / 1 e9, 2),“g”)val})) sm < - sm(牧师(订单(sm版)美元),)如果((sm, data.frame)) {knitr: kable (sm,对齐= " c ")}
文件名 | 日期 | 时间 | 大小(字节) | 版本 | |
---|---|---|---|---|---|
26 | remethdb_hm450k_h5_rg_1669220733_0 - 0 - 3. - h5 | 21 - 12月- 2022 | 21:44 | 22.66 gb | v0.0.3 |
25 | remethdb_hm450k_h5_gr_1669220733_0 - 0 - 3. - h5 | 21 - 12月- 2022 | 23:46 | 25.98 gb | v0.0.3 |
24 | remethdb_hm450k_h5_gm_0-0-3_1669220733.h5 | 21 - 12月- 2022 | 22:44 | 18.83 gb | v0.0.3 |
21 | remethdb_epic - hm850k_h5_rg_1669220613_0 0 - 3. - h5 | 20 - 12月- 2022 | 12:31 | 135.77 gb | v0.0.3 |
20. | remethdb_epic - hm850k_h5_gr_1669220613_0 0 - 3. - h5 | 21 - 12月- 2022 | 00:09 | 100.05 gb | v0.0.3 |
19 | remethdb_epic-hm850k_h5_gm_0-0-3_1669220613.h5 | 20 - 12月- 2022 | 18:59 | 118.06 gb | v0.0.3 |
16 | remethdb_hm450k_h5se_rg_1669220733_0-0-3 | 21 - 12月- 2022 | 22:17 | 23.14 gb | v0.0.3 |
15 | remethdb_hm450k_h5se_gr_1669220733_0-0-3 | 22日- 12月- 2022 | 00:23 | 25.97 gb | v0.0.3 |
14 | remethdb_hm450k_h5se_gm_1669220733_0-0-3 | 21 - 12月- 2022 | 23:10 | 18.4 gb | v0.0.3 |
4 | remethdb_epic-hm850k_h5se_rg_1669220613_0-0-3 | 20 - 12月- 2022 | 16:14 | 139.36 gb | v0.0.3 |
3. | remethdb_epic-hm850k_h5se_gr_1669220613_0-0-3 | 21 - 12月- 2022 | 19:56 | 100.08 gb | v0.0.3 |
2 | remethdb_epic-hm850k_h5se_gm_1669220613_0-0-3 | 20 - 12月- 2022 | 21:44 | 115.39 gb | v0.0.3 |
23 | remethdb_h5-rg_hm450k_0-0-2_1607018051.h5 | 07 - 1月- 2021 | 10:01 | 193.34 gb | v0.0.2 |
22 | remethdb_h5-rg_epic_0-0-2_1589820348.h5 | 08 - 1月- 2021年 | 09:46 | 66.75 gb | v0.0.2 |
13 | remethdb_h5se-rg_hm450k_0-0-2_1607018051 | 06 - 1月- 2021 | 10:44 | 164.79 gb | v0.0.2 |
12 | remethdb_h5se-rg_epic_0-0-2_1589820348 | 06 - 1月- 2021 | 10:19 | 68.71 gb | v0.0.2 |
10 | remethdb_h5se-gr_hm450k_0-0-2_1607018051 | 07 - 1月- 2021 | 10:50 | 184.36 gb | v0.0.2 |
9 | remethdb_h5se-gr_epic_0-0-2_1607018051 | 06 - 1月- 2021 | 10:09 | 82.09 gb | v0.0.2 |
7 | remethdb_h5se-gm_hm450k_0-0-2_1607018051 | 07 - 1月- 2021 | 10:23 | 130.94 gb | v0.0.2 |
6 | remethdb_h5se-gm_epic_0-0-2_1589820348 | 06 - 1月- 2021 | 09:56 | 56.96 gb | v0.0.2 |
18 | remethdb-h5_rg_0-0-1_1590090412.h5 | 06 - jun - 2020 | 08:21 | 120.17 gb | v0.0.1 |
17 | remethdb-h5_rg-test_0-0-1_1590090412.h5 | 31日- 2020年5月, | 07:26 | 0 gb | v0.0.1 |
11 | remethdb_h5se-rg_0-0-1_1604642113 | 2020年07 - 11月 | 11:58 | 118.5 gb | v0.0.1 |
8 | remethdb_h5se-gr_0-0-1_1604642113 | 2020年07 - 11月 | 10:22 | 132.55 gb | v0.0.1 |
5 | remethdb_h5se-gm_0-0-1_1604642113 | 2020年07 - 11月 | 10:22 | 94.16 gb | v0.0.1 |
1 | remethdb-h5se_gr-test_0-0-1_1590090412 | 29日- 5月- 2020年 | 07:28 | 0 gb | v0.0.1 |
在DNAm数组数据库文件上建立索引ExperimentHub
,以及如下所示。注意,缓存需要设置为R_user_dir ()
每一个指令在这里.
缓存。path <- tools::R_user_dir(" recretmethylation ") setExperimentHubOption("CACHE", CACHE .path) hub <- ExperimentHub::ExperimentHub() #连接到hub rmdat <- AnnotationHub::query(hub, " recretmethylation ") #查询hub
除了使用getdb
功能,HDF5
(“。h5”" extension) files may be downloaded from the hubs.
fpath <- rmdat[["EH3778"]] #下载默认缓存rhdf5::h5ls(fpath) #加载h5文件
注意下载是使用集线器还是getdb
函数,实现缓存以检查之前下载的数据库文件。
请注意以下免责声明,其中还显示了时间recountmethylation
加载:
通过“重记甲基化”访问的数据库包含来自GEO (ncbi.nlm.nih.gov/geo/)的数据,GEO是一个实时公共数据库,随着时间的推移,在线记录的更改可能会导致与存储数据的差异。我们不能保证所存储数据的准确性,并建议用户与最新可用记录交叉检查他们的发现。
本节包括有关DNAm阵列平台、分析和文件类型以及示例元数据的基本背景。
数据库包括在Illumina Infinium HM450K BeadArray平台上运行的人体样本。HM450K是一种流行的2通道平台,可探测超过48万个CpG全基因组位点,具有丰富的CG岛、基因和增强子覆盖[1].最新发布的EPIC/HM850K平台包含了一个扩展的探针集,目标超过850,000 cpg,包括90%以上的HM450K探针,具有更大的潜在基因间调控区域覆盖范围[2].
阵列处理为每个样本生成2个强度文件(IDATs),红色和绿色通道各一个。这些原始文件还包含对质量评估有用的控制信号[3].BeadArray探针使用2种珠技术中的任何一种,被称为Type I和Type II,其中大多数(72%)探针使用后者。对于II型探针,单珠分析通知一个探针,而I型探针每个使用2珠。实际上,这意味着在RGChannelSet
对象大于派生对象类型中发现的探针特定矩阵(例如,对于HM450K样本,红色/绿色信号矩阵的测定量为622,399次,而甲基化/非甲基化信号、DNAm分量矩阵的测定量为485,512次,见下文)。
SummarizedExperiment
对象类DNAm数组示例idat可以作为类对象读入R会话RGChannelSet
,是一种SummarizedExperiment
.这些对象支持对高通量基因组数据集的分析,它们包括用于分析矩阵、样本元数据和实验元数据的插槽。在一个典型的工作流中,规范化和预处理是相互转换的RGChannelSet
对象转换为新的类型MethylSet
而且RatioSet
.虽然并非所有IDAT信息都可以从每种对象类型中访问(例如,仅可以访问)RGChannelSet
S可以包含控制分析),派生对象像MethylSet
年代和RatioSet
S可能更小和/或更快地访问。
三个SummarizedExperiment
数据库提供如下HDF5-SummarizedExperiment
文件,包括非规范化文件RGChannelSet
(红/绿信号),未归一化MethylSet
(甲基化/非甲基化信号)和标准化GenomicRatioSet
(DNAm分数)。对于后者,DNAm分数(logit2 beta值或m值)使用带外信号或“noob”方法进行归一化,这是一种有效的样本内归一化,可以去除信号伪影[4].
数据库文件以任意一种方式存储HDF5
或HDF5-SummarizedExperiment
.对于大多数R用户来说,后一种文件使用起来最方便。HDF5
,或分层数据格式5,结合压缩和分块,方便处理大型数据集。HDF5-SummarizedExperiment
文件结合了的优点HDF5
而且SummarizedExperiment
实体使用一个delayedarray支持的后端。一旦一个HDF5-SummarizedExperiment
文件加载时,它可以类似于SummarizedExperiment
对象在活动内存中。也就是说,摘要和子集操作快速执行,活动内存中大数据块的实现被延迟,直到脚本调用(参见示例)。
样本元数据包含在数据库文件中的DNAm分析中。目前,元数据变量包括样本(GSM)和研究(GSE)的GEO记录id、样本记录标题、组织和疾病的学习标签、来自metasra管道的样本类型预测,以及基于年龄、性别和血细胞类型的DNAm模型预测。访问样例元数据SummarizedExperiment
对象使用pData
Minfi函数(参见示例)。的例子data_analyses
小插图说明了利用所提供的样例元数据的一些方法。
提供的元数据来自特定于gse的SOFT文件,其中包含实验、示例和平台元数据。在学习、协调和预测元数据标签方面做了大量的工作。某些类型的信息缺乏recountmethylation
元数据可能在SOFT文件中可用,特别是如果它是非特定的样本(例如方法文本,PubMed ID等)或与DNAm派生的度量(例如DNAm摘要,预测性别等)冗余。
使用原始元数据记录验证协调的元数据是一种良好的实践,特别是在标签不明确或给定查询的信息不足的情况下。GEO GSM和GSE记录可以从浏览器中查看,也可以直接下载SOFT文件。像geoometadb和GEOquery这样的包对于查询和汇总GEO元数据也很有用。
HDF5-SummarizedExperiment
例子的基本处理HDF5-SummarizedExperiment
(又名“h5se”)文件。对于这些文件,使用getdb
函数返回加载的文件。多亏了DelayedArray
后端,甚至是全尺寸的h5se
可以将数据库视为已完全加载到活动内存中。
测试h5se
数据集包括2个样本的22号染色体探针的样本元数据和noob归一化DNAm分数(beta值)。数据集可以使用getdb
函数系列(参见getdb ?
有关详情)dfp
参数指定下载目的地。测试h5se
文件包含在包“inst”目录中,可以按如下方式加载。
Dn <- "remethdb-h5se_gr-test_0-0-1_1590090412" path <- system. sh "文件("extdata", dn, package = "叙述甲基化")h5se。- HDF5Array:: loadhdf5summarizeexperiment (path)
在数据集加载后,可以在数据集上使用常见的特征函数。这些函数包括SummarizedExperiment
类对象,例如getBeta
,pData
,getAnnotation
minfi功能。首先,使用标准函数检查数据集类
,昏暗的
,总结
如下。
检查对象类
# #[1]“GenomicRatioSet”# # attr(“包”)# #[1]“minfi”
Dim (h5se.test) #获取对象尺寸
## [1] 8552 2
Summary (h5se.test) #总结数据集组件
##[1]“长度为8552的基因组比率集对象,包含0个元数据列”
访问2个可用示例的示例元数据pData
.
h5se。md <- minfi::pData(h5se.test) #获取样本元数据dim(h5se.md) #获取元数据维度
## [1] 2 19
Colnames (h5se.md) #获取元数据列名
## [1] "gsm" "gsm_title" "gseid" "disease" ## [5] "tissue" "sampletype" "arrayid_full" "basename" ## [9] "age" "predage" "sex" "predsex" ## [13] "predcell。CD8T”“predcell。CD4T”“predcell。NK”“predcell。Bcell“##[17]”predcell。Mono”“predcell。格兰”“存储”
接下来得到CpG探针特定的DNAm分数,或“beta值”,与getBeta
(行是探测,列是样本)。
h5se。bm <- minfi::getBeta(h5se.test) #获取dnam分数dim(h5se.bm) #获取dnam分数维度
## [1] 8552 2
Colnames (h5se.bm) <- h5se.bm。测试$gsm #为dnam分数分配样本id knitr::kable(head(h5se.bm), align = "c") #显示dnam分数表
GSM1038308 | GSM1038309 | |
---|---|---|
cg00017461 | 0.9807283 | 0.9746836 |
cg00077299 | 0.3476970 | 0.3456837 |
cg00079563 | 0.8744652 | 0.9168005 |
cg00087182 | 0.9763206 | 0.9760947 |
cg00093544 | 0.0225112 | 0.0265087 |
cg00101350 | 0.9736359 | 0.9789818 |
访问探测的清单信息getAnnotation
.这包括珠子地址、探针类型和基因组坐标和区域。有关探针注释的完整细节,请参阅minfi和Illumina平台文档。
a <- minfi::getAnnotation(h5se.test) #获取平台注释dim(an) #获取注释维度
## [1] 8552 33
Colnames (an) #获取注释列名
[1]“chr”“pos”##[5]“AddressA”“AddressB”##[7]“ProbeSeqA”“ProbeSeqB”##[9]“Type”“NextBase”##[11]“Color”“Probe_rs”##[13]“Probe_maf”“CpG_rs”##[15]“CpG_maf”“SBE_rs”##[15]“CpG_maf”“Islands_Name”##[19]“Relation_to_Island”“Forward_Sequence”##[21]“SourceSeq”“Random_Loci”##[23]“Methyl27_Loci”“UCSC_RefGene_Name”##[25]“UCSC_RefGene_Accession”“UCSC_RefGene_Group”##[27]“Phantom”“DMR”##[29]“Enhancer”“HMM_Island”## [31]"Regulatory_Feature_Name" "Regulatory_Feature_Group" ## [33] "DHS"
Ant <- as.matrix(t(an[c(1:4), c(1:3, 5:6, 9,19,24,26)])) #子集注释knitr::kable(Ant, align = "c") #显示注释表
cg00017461 | cg00077299 | cg00079563 | cg00087182 | |
---|---|---|---|---|
空空的 | chr22 | chr22 | chr22 | chr22 |
pos | 30663316 | 18632618 | 43253521 | 24302043 |
链 | - | + | + | + |
AddressA | 31616369 | 13618325 | 65630302 | 37797387 |
AddressB | 70798487 | 37626331 | 55610348 | 20767312 |
类型 | 我 | 我 | 我 | 我 |
Relation_to_Island | OpenSea | N_Shore | 岛 | N_Shore |
UCSC_RefGene_Name | OSM | USP18 | ARFGAP3; ARFGAP3 | GSTT2B; GSTT2 |
UCSC_RefGene_Group | TSS1500 | TSS200 | TSS200; TSS200 | 身体,身体 |
HDF5
数据库和示例为了提供更多的工作流程选项,特定于珠子的红色和绿色信号数据已在样例元数据中提供HDF5
/h5
文件。这个例子展示了如何处理这种类型的对象recountmethylation
.
测试h5
文件包括元数据和珠特定信号从22号染色体为相同的2个样本h5se
测试文件。请注意getdb
功能h5
文件只是返回数据库路径。自从测试之后h5
文件也包含在包的“inst”文件夹中,获取加载文件的路径如下所示。
Dn <- "remethdb-h5_rg-test_0-0-1_1590090412. "H5 " #获取h5se目录名H5。测试<-系统。File ("extdata", "h5test", dn, package = "叙述甲基化")#获取h5se目录路径
使用文件路径将数据读入RGChannelSet
与getrg
函数。设置all.gsm= TRUE
获取数据库文件中所有样本的数据,同时将GSM id的向量传递给gsmv
参数将查询可用样本的子集。默认情况下,将检索所有可用探针的信号,并且可以通过将有效珠子地址的向量传递给cgv
论点。
h5。rg<- getrg(dbn = h5.test, all.gsm = TRUE) # get red/grn signals from an h5 db
避免使用全尺寸内存耗尽活动内存h5
数据集,提供gsmv
或cgv
来getrg
,并设置all.cg
或all.gsm
改为FALSE(见getrg ?
详情)。
在前面的例子中,使用pData
而且getAnnotation
以分别获取样例元数据和数组清单信息。中的绿色和红色信号矩阵RGChannelSet
与getRed
而且getGreen
minfi功能。
h5。red <- minfi::getRed(h5.rg) # get red信号矩阵h5.rg。green <- minfi::getGreen(h5.rg) # get grn信号矩阵dim(h5.red) #获取红色信号矩阵的维数
## [1] 11162 2
Knitr::kable(head(h5.red), align = "c") #显示第一行红色信号矩阵
GSM1038308 | GSM1038309 | |
---|---|---|
10601475 | 1234 | 1603 |
10603366 | 342 | 344 |
10603418 | 768 | 963 |
10605304 | 2368 | 2407 |
10605460 | 3003 | 3322 |
10608343 | 357 | 399 |
Knitr::kable(head(h5.green), align = "c") #显示GRN信号矩阵的第一行
GSM1038308 | GSM1038309 | |
---|---|---|
10601475 | 6732 | 8119 |
10603366 | 288 | 356 |
10603418 | 267 | 452 |
10605304 | 4136 | 4395 |
10605460 | 1395 | 1762 |
10608343 | 840 | 1269 |
相同的(rownames(h5.red), rownames(h5.green)) #检查CPG探针名称相同
##[1]真
这些信号矩阵中的行映射到珠地址,而不是探针id。这些矩阵的行数比h5se
测试beta值矩阵,因为任何I型探针每个都使用来自2个珠子的数据。
本节演示使用测试数据库进行验证。本文提供了复制本节的完整代码,但没有进行评估,因为需要从GEO服务器下载。正如免责声明所指出的,根据最新可用的GEO文件验证数据是一种良好的实践。这一步骤可能对接近最终编译日期(当前版本截止到2020年11月7日)发布的新样本最有用,这可能更容易在首次发布时进行修订。
使用gds_idat2rg
函数下载两个测试样本的IDATs,并将它们加载到一个新的RGChannelSet
对象。通过传递GSM id的矢量来做到这一点gsmv
和下载目的地dfp
.(注意,本节中的块是完全可执行的,但不用于本小插图)。
# download from GEO dlpath <- tempdir() #获取一个临时目录路径gsmv <- c("GSM1038308", "GSM1038309")Rg <- gds_idat2rg(gsmv, DFP = dlpath) # load sample idats into rgset colnames(geo.rg) <- gsub("\\_. Rg . "*", "", colnames(geo.rg)) #为列分配示例id
提取红色和绿色信号矩阵geo.rg
.
地理。red <- minfi::getRed(geo.rg) # get红色信号矩阵green <- minfi::getGreen(geo.rg) # get grn信号矩阵
匹配GEO和之间的索引和标签h5
测试信号矩阵。
int。地址<- intersect(rownames(geo.red), rownames(h5.red)) #获取探测地址idRed <- geo.red[int. Red]地址,]#子集地理rgset红色信号地理。Green <- geo.green[int。地址,]#子集gro rgset GRN信号。Red <- geo. Red [order(match(rownames(geo. Red), rownames(h5.red))),] geo. Red。绿色<- geo.green[order(match(rownames(geo.green), rownames(h5.green))),] same (rownames(geo.red), rownames(h5.red))) #检查相同地址,红色same (rownames(geo.green), rownames(h5.green)) #检查相同地址,GRN class(h5.red) <- "integer";Class (h5.green) <- "integer" #设置矩阵数据类为整数
最后,比较信号矩阵数据。
(geo相同。#比较矩阵信号,红色
(geo相同。绿色,h5.green) #比较矩阵信号,GRN
在将geo下载的数据与h5se.test
数据库中,使用用于生成数据的带外或“noob”归一化技术对数据进行归一化h5se
数据库。
地理。gr <- minfi::preprocessNoob(geo.rg) # get normalized se data
接下来,提取beta值。
地理。bm <- as.matrix(minfi::getBeta(geo.gr)) #获取归一化dnam分数矩阵
现在匹配行和列标签和索引。
h5se。Bm <- as.matrix(h5se.bm) #设置dnam分数为矩阵int。CG <- intersect(rownames(geo.bm), rownames(h5se.bm))Bm <- geo.bm[int。共享探针id上的子集分数。Bm <- geo.bm[order(match(rownames(geo.bm), rownames(h5se.bm))),]
最后,比较两个数据集。
same (summary(geo.bm), summary(h5se.bm)) #检查相同的摘要值
same (rownames(geo.bm), rownames(h5se.bm)) #检查相同的探测id
属性时可能出现的问题DelayedArray
本地基于对象。
如果多次尝试下载数据库编译文件失败,您可以尝试以下方法:
首先确保您的互联网连接稳定,并且在下载目的地有足够的空间存放数据库文件。
其次,在重复下载尝试之前,尝试将超时时间增加到默认值之外getdb
.检查R会话的当前超时时间getOptions(“超时”)
,然后手动增加超时时间选项(timeout = new.time)
.
最后,您可以尝试使用命令行调用将服务器文件下载到系统终端或控制台。例如,在Mac电脑上,你可以试试Wget -r
.如果这不起作用,您可以再次尝试增加超时时间并重复下载尝试。
DelayedArray
输入使用时可能会出现意想不到的功能行为DelayedArray
的输入。这主要是由于标准矩阵和矩阵之间缺乏互操作性DelayedArray
基于矩阵。已知的例子包括:
minfi: detectionP ()
:对于特定的数据子集抛出错误,例如对于恰好50个样本的查询。
detectionP(rg[,1:50]) # get检测pvalues from rgset "Error in .local(Red, Green, locusNames, controlIdx, TypeI. local) "红色,TypeI。Green, dim(Red_grid) == dim(detP_sink_grid) not all TRUE"
minfi: preprocessFunnorm ()
:类调用时抛出错误RGChannelSet
类型的HDF5-SummarizedExperiment
.
preprocessFunnorm(rg) # get nob -normalized data "错误:'preprocessFunnorm()'只支持矩阵支持的minfi对象。"
这些错误和其他相关错误可以通过将数据查询或数据块实例化为一个新的非DelayedArray
对象。例如,重新制作完整的子集h5se
数据集,rg
,如下。
rg。h5se <- loadHDF5SummarizedExperiment(rg.path) # full h5se RGChannelSet rg.sub <- rg.h5se[,c(1:20)] # subset samples of interest rg.new <- RGChannelSet(Red = getRed(rg.sub), Green = getGreen(rg.sub), annotation = annotation(rg.sub)) # re-make as non-DA object gr <- preprocessFunnorm(rg.new) # repeat preprocessing
另外,非DelayedArray
RGChannelSet
对象可以很容易地从完整的h5
RGChannelSet
数据库提供的函数getrg ()
.
sessionInfo ()
## R版本4.2.2(2022-10-31)##平台:x86_64-pc-linux-gnu(64位)##运行在Ubuntu 20.04.5 LTS ## ##矩阵产品:默认## BLAS: /home/biocbuild/bbs-3.16-bioc/R/lib/libRblas。/home/biocbuild/bbs-3.16-bioc/R/lib/libRlapack。所以## ## locale: ## [1] LC_CTYPE=en_US。UTF-8 LC_NUMERIC= c# # [3] LC_TIME=en_GB LC_COLLATE= c# # [5] LC_MONETARY=en_US。utf - 8 LC_MESSAGES = en_US。UTF-8 ## [7] LC_PAPER=en_US。UTF-8 LC_NAME= c# # [9] LC_ADDRESS=C lc_phone = c# # [11] LC_MEASUREMENT=en_US。UTF-8 LC_IDENTIFICATION=C ## ##附加的基本包:##[1]并行stats4统计图形grDevices utils数据集##[8]方法基础## ##其他附加包:# # # # [1] IlluminaHumanMethylation450kanno.ilmn12.hg19_0.6.1 [2] ExperimentHub_2.6.0 # # [3] AnnotationHub_3.6.0 # # [4] BiocFileCache_2.6.0 # # [5] dbplyr_2.2.1 # # [6] reticulate_1.26 # # [7] basilisk_1.10.2 # # [8] HDF5Array_1.26.0 # # [9] DelayedArray_0.24.0 # # [10] Matrix_1.5-3 # # [11] limma_3.54.0 # # [12] gridExtra_2.3 # # [13] ggplot2_3.4.0 # # [14] knitr_1.41 # # [15] recountmethylation_1.8.3 # # [16] minfi_1.44.0 # # [17] bumphunter_1.40.0 # # [18] locfit_1.5 - 9.6 # # [19] iterators_1.0.14 # # [20][27] genome ranges_1.5 . 0.2 ## [28] GenomeInfoDb_1.34.4 ## [29] IRanges_2.32.0 ## [30] S4Vectors_0.36.1 ## [31] BiocGenerics_0.44.0 ## [32] rhdf5_2.42.0 ## [33] BiocStyle_2.26.0 ## ##通过命名空间加载(并且没有附加):# # # # [1] plyr_1.8.8 splines_4.2.2 [3] BiocParallel_1.32.4 digest_0.6.31 # # [5] htmltools_0.5.4 magick_2.7.3 # # [7] fansi_1.0.3 magrittr_2.0.3 # # [9] memoise_2.0.1 tzdb_0.3.0 # # [11] readr_2.1.3 annotate_1.76.0 # # [13] askpass_1.1 siggenes_1.72.0 # # [15] prettyunits_1.1.1 colorspace_2.0-3 # # [17] blob_1.2.3 rappdirs_0.3.3 # # [19] xfun_0.36 dplyr_1.0.10 # # [21] crayon_1.5.2 rcurl_1.98 - 1.9 # # [23] jsonlite_1.8.4 genefilter_1.80.2 # # [25] GEOquery_2.66.0 survival_3.4-0 # # [27] glue_1.6.2gtable_0.3.1 # # [29] zlibbioc_1.44.0 Rhdf5lib_1.20.0 # # [31] scales_1.2.1 DBI_1.1.3 # # [33] rngtools_1.5.2 Rcpp_1.0.9 # # [35] xtable_1.8-4 progress_1.2.2 # # [37] bit_4.0.5 mclust_6.0.0 # # [39] preprocessCore_1.60.1 httr_1.4.4 # # [41] dir.expiry_1.6.0 RColorBrewer_1.1-3 # # [43] ellipsis_0.3.2 farver_2.1.1 # # [45] pkgconfig_2.0.3 reshape_0.8.9 # # [47] xml_3.99 - 0.13 sass_0.4.4 # # [49] utf8_1.2.2 later_1.3.0 # # [51] labeling_0.4.2 tidyselect_1.2.0 # # [53] rlang_1.0.6 AnnotationDbi_1.60.0 # # [55][61] RSQLite_2.2.20 evaluate_0.19 ## [63] string_1 .5.0 fastmap_1.1.0 ## [65] yaml_2.3.6 bit64_4.0.5 ## [67] beanplot_1.3.1 scrime_1.3.5 ## [69] purrr_1.0.0 KEGGREST_1.38.0 ## [71] nlme3.1 -161 doRNG_1.8.3 ## [73] sparseMatrixStats_1.10.0 mime_0.12 ## [75] nor1mix_1.3-0 xml2_1.3.3 ## [77] biomaRt_2.54.0 compiler_4.2.2 ## [79] interactiveDisplayBase_1.36.0 filelock_1.0.2 ## png_0.1-8 ## [83] tibble_3.1.8 bslib_0.4.2 ## [85] stringi_1.7.8 basilisk.utils_1.10.0 ## [87] highr_0.10 GenomicFeatures_1.50.3 ## [89] lattice_0.20-45 multtest_2.54.0 ## [91] vctrs_0.5.1 pillar_1.8.1 ## [93] lifecycle_1.0.3 rhdf5filters_1.10.0 ## [95] BiocManager_1.30.19 jquerylib_0.1.4 ## [97] data.table_1.14.6 bitops_1.0-7 ## [99] httpuv_1.6.7 rtracklayer_1.58.0 ## [101] R6_2.5.1 BiocIO_1.8.0 ## [103] promises_1.2.0.1 bookdown_0.31 ## [105] codetools_0.2-18 MASS_7.3-58.1 ## [107] assertthat_0.2.1 openssl_2.0.5 ## [109] rjson_0.2.21 withr_2.5.0 ## [111] GenomicAlignments_1.34.0 Rsamtools_2.14.0 ## [113] GenomeInfoDbData_1.2.9 mgcv_1.8-41 ## [115] hms_1.1.2 quadprog_1.5-8 ## [117] grid_4.2.2 tidyr_1.2.1 ## [119] base64_2.0.1 rmarkdown_2.19 ## [121] DelayedMatrixStats_1.20.0 illuminaio_0.40.0 ## [123] shiny_1.7.4 restfulr_0.0.15
1.Sandoval, J., Heyn, H. A., Moran, S., Serra-Musach, J., Pujana, M., Bibikova, M.和Esteller, M.(2011)。人类基因组中450,000 CpG位点的DNA甲基化微阵列的验证。表观遗传学6, 692 - 702。可以在:http://www.landesbioscience.com/journals/epigenetics/article/16196/?nocache=1384341162.
2.皮德利,R.,佐滕科,E.,彼得斯,T. J.,劳伦斯,M. G.,里斯布里杰,G. P.,莫洛伊,P.,范·吉克,S.,米尔豪斯勒,B.,斯特扎克,C.和克拉克,S. J.(2016)。Illumina MethylationEPIC串珠芯片微阵列用于全基因组DNA甲基化分析的关键评估。基因组生物学17.可以在:https://www.ncbi.nlm.nih.gov/pmc/articles/PMC5055731/[2019年4月19日访问]。
4.特里什,T. J.,魏森伯格,D.,范登伯格,D.,莱尔德,P. W.和西格蒙德,K. D.(2013)。Illumina Infinium DNA甲基化珠阵列的低水平加工。核酸研究41, e90。