1共识de介绍

consensusDE旨在进行差异表达(DE)分析,报告来自多种方法的显著性评分,去除或不去除不需要的变异(RUV)。容易.它实现了voom/limma, DESeq2和edgeR,并分别报告每种算法的差分表达式结果,并将结果合并到一个表中进行确定共识.合并表的结果,按每个算法的p值的和秩排序,所有方法在最小p值阈值处的相交被提供为p_intersect,此外还有一些统计数据(见下文)。

consensusDE被简化为两个函数:

  • buildSummarized ()生成一个总结实验,对转录组的读映射(来自bam文件或htseq计数文件)进行计数
  • multi_de_pairs ()执行DE分析(所有可能的成对比较)

下面是consensusDE的核心功能以及如何使用diag_plots函数。

2consensusDE例子

首先安装和加载consensusDE图书馆。为了说明consensusDE,我们将利用RNA-seq数据气道和注释库,如下所示。首先从这些库中安装和附加数据,如下所示:

# load consensusDE图书馆(consensusDE)#加载气道和dm3/Hs转录本数据库为例注释图书馆(气管)图书馆(TxDb.Dmelanogaster.UCSC.dm3.ensGene)图书馆(EnsDb.Hsapiens.v86)图书馆(org.Hs.eg.db)数据“气道”

3.建立一个总结实验

摘要实验是一个存储所有相关信息的对象,用于进行微分表达式分析。buildSummarized ()允许用户通过简单地提供1)bam/htseq文件表(更多关于格式),2)定位文件的目录和3)将读取映射到(GTF文件或txdb)的转录数据库来构建一个总结的实验对象。下面我们将使用bam文件(来自GenomicAlignments)作为创建总结实验的示例:

#构建一个列出文件及其分组的设计表file_list < -list.files执行“extdata”包=“GenomicAlignments”),递归=真正的模式=“*”(bam美元完整的=真正的#准备一个用于buildsummarest()的示例表#必须由至少两列组成,分别命名为“file”和“group”,#和一个额外的列:"pairs"如果数据是成对的sample_table < -data.frame“文件”basename(file_list),“集团”c“治疗”“untreat”))#提取到bam目录的路径-在这里搜索“sample_table”中列出的文件bam_dir < -as.charactergsubbasename(file_list) [1),"", file_list [1)))

现在已经准备好了构建一个总结实验的最小信息:

# NB。force_build = TRUE,设置为允许构建总结实验。#这将报告一个警告消息,当前的副本少于两个在sample_table中。summarized_dm3 < -buildSummarizedsample_table =sample_table,bam_dir =bam_dir,tx_db =TxDb.Dmelanogaster.UCSC.dm3.ensGene,read_format =“配对”force_build =真正的
## strand_mode被定义为0(非搁浅)。这适用于##非搁浅协议,或者如果您希望在##计数读取时忽略搁浅。更多信息请参见基因组校准中的?strandMode。

这将输出一个汇总对象,该对象映射了中列出的bam文件的读取sample_table,位于bam_dir,以核对所提供的笔录资料库:TxDb.Dmelanogaster.UCSC.dm3.ensGene.Bam文件格式,无论是“成对”还是“单”端(所使用的测序技术类型)都必须使用read_format参数。gtf为matted transcript databases can also be used instead of a txdb, by providing the full path to the gtf file using thegtf参数。若要将总结的实验保存在外部,以供将来使用,请指定保存总结实验的路径output_log

strand_mode用于定义链库准备协议如何处理链。对于配对数据,这用于指示如何从配对读取的第一个和最后一个片段推断出链。如果协议是非搁浅的或者搁浅应该被忽略,Strand_mode = 0ConsensusDE调用Strand_mode = 0默认情况下。如果协议是绞链的,并且读取的链是第一个片段的链(或在单端库中读取),Strand_mode = 1.如果协议是绞链的,并且读的链是第二个片段的链(或者在单端库中读的链相反),Strand_mode = 2.要了解更多信息,请参见基因组校准包中的?strandMode。

要查看所有参数的详细信息,请参见buildSummarized ?

实验总结概述:

summarized_dm3
##类:rangedsummarize实验## dim: 15682 2 ##元数据(2):gene_cods sample_table ## assays(1):计数## rownames(15682): FBgn0000003 FBgn0000008…FBgn0264726 FBgn0264727 ## rowData names(0): ## colnames(2): sm_treated1。bam sm_untreated1。colData名称(2):文件组

3.1过滤低计数数据

buildSummarized ()还允许用户过滤低读取计数。这可以在构建总结的实验时完成,或使用总结的实验输出重新运行时完成buildSummarized ().参见下面的“执行微分表达式”和过滤器示例。

3.2首先构建tx_db对象

有时,先构建一个txdb对象,然后传递这个txdb使用tx_db参数将对象转换为buildsummary。可以这样做:

txdb <- makeTxDbFromGFF("/path/to/my. txt ")gtf", format="gtf", circ_seqs=character())

4执行微分表达式

对于微分表达式(DE)分析,我们将使用气道RNA-seq数据演示。看到气道吗?关于这个实验的更多细节。注意:总结的元数据必须包含“组”和“文件”列,以构建正确的模型。为了说明,我们从这个数据集中采样了1000个基因。

# DE分析的兼容性,添加“组”和“文件”列colData(气管)组< -colData(气管)敏捷colData(气管)文件< -rownamescolData(气管))#过滤低计数数据airway_filter < -buildSummarized总结了=气道,过滤器=真正的#作为说明,我们只使用1000个文本的随机样本set.seed1234airway_filter < -样本(airway_filter1000#调用multi_de_pairs()all_pairs_airway < -multi_de_pairs总结了=airway_filter,成对的=“孤”ruv_correct =

运行multi_de_pairs ()将对所有可能的“组”对进行DE分析,并将这些结果保存为“合并”的简单列表-将“deseq”,“voom”和“edger”的合并结果保存到一个表中,后三者也作为独立的对象保存。类型对数据帧进行排序rank_sum.包括下列各列:

  • ID——标识符
  • AveExpr-平均表达(edgeR, DESeq2和voom的平均值)
  • LogFC- Log2 Fold-Change,也称为log-ratio (edgeR, DESeq2和voom的平均值)
  • LogFC_sdLog2 LogFC的Fold-Change标准差(平均值)
  • edger_adj_p-根据多个假设调整EdgeR p值
  • deseq_adj_p-针对多个假设调整了DESeq2 p值
  • voom_adj_p-根据多个假设调整了Limma/ boom p值
  • edger_rank- EdgeR得到的p值的秩
  • deseq_rank- DESeq2得到的p值的秩
  • voom_rank- Limma/voom得到的p值的秩
  • rank_sum- edger_rank, voom_rank, rank_sum的秩和
  • p_intersect-所有测试方法中观察到的最大p值。
    • 这表示在p_intersect列上设置阈值时的交集
  • p_union-所有测试方法中观察到的最小p值。
    • 这表示在p_union列上设置阈值时的并集访问合并结果:
查看所有进行的比较:的名字(all_pairs_airway合并)
##[1]“untrt-trt”
# [1] "untrt-trt"#来访问特定比较的数据(all_pairs_airway合并后的[[“untrt-trt”]])
## ID AveExpr LogFC LogFC_sd edger_adj_p deseq_adj_p ## 1 ENSG00000120129 11.38754 -2.811094 0.1118097 4.444781e-38 6.013628e-44 ## 2 ENSG00000116584 11.02552 1.153092 0.1095189 1.508445e-16 9.643002e-42 ## 3 ENSG00000139289 10.83881 1.131120 0.1098113 1.166207e-13 2.233808e-24 ## 4 ENSG00000077684 10.46766 -1.066130 0.1135320 4.188089e-11 1.290408e-26 ## 5 ENSG00000211445 11.26943 -2.540661 0.1367032 1.906080e-16 1.665175e-21 ## 6 ENSG00000211445 13.09005 -3.598107 0.1163315 1.246261e-142.170616e-19 ## 1 4.189235e-05 1 1 1.0 3.0 4.189235e-05 ## 2 2.107158e-04 2 2 2.0 6.0 2.107158e-04 ## 3 5.341853e-04 5 5 3.5 13.5 5.341853e-04 8 3 3.5 14.5 5.341853e-04 ## 5 9.963537e-04 36 6.5 15.5 9.963537e-04 ## 6 9.963537e-04 4 9 6.5 19.5 9.963537e-04 ## 1 6.013628e-44 ## 2 9.643002e-42 ## 3 2.290408e -26 ## 5 1.665175e-21 ## 6 2.170616e-19

4.1注释DE结果

它是推荐使用GTF文件byt进行注释,该byt提供GTF文件到gtf_annotate参数的完整路径,并与tx_db结合使用。如果没有提供tx_db,而提供了gtf路径,则只执行基因符号注释。

目前tx_db选项只支持ENSEMBL注释。

向输出表中添加附加的注释信息通常是有用的。这可以通过为注释提供一个数据库来实现ensembl_annotate.注释需要是一个Genome Wide Annotation对象,例如:org.Mm.eg.db鼠标或org.Hs.eg.dbBioConductor公司为人类提供的产品。例如,要为鼠标注释安装数据库,请转到//www.anjoumacpherson.com/packages/org.Mm.eg.db按照说明做。确保在安装数据库包后,库是使用库(org.Mm.eg.db).运行时,“' select() '返回1:键和列之间的许多映射”将出现在命令行上。这是多个副本ID映射到annotation的结果。只报告第一个注释。看到multi_de_pairs ?其他文档。

以下是注释上述过滤后气道数据的示例:

#首先确保注释数据库已安装#库(org.Hs.eg.db)#库(EnsDb.Hsapiens.v86)#预加载的汇总文件不包含tx_db的元数据。如果你想提取染色体坐标,这是很重要的。可以通过使用所选的tx_db重新运行buildsummary来轻松更新。airway_filter < -buildSummarized总结了=airway_filter,tx_db =EnsDb.Hsapiens.v86,过滤器=
## buildsummaris_filter (summaris_airway_filter, tx_db = EnsDb.Hsapiens. txt)v86,:没有提供输出目录。se文件和sample_table不会被保存
#调用multi_de_pairs()# set ensembl_annotation参数为org.Hs.eg.dball_pairs_airway < -multi_de_pairs总结了=airway_filter,成对的=“孤”ruv_correct =ensembl_annotate =org.Hs.eg.db)#来访问特定比较的数据(all_pairs_airway合并后的[[“untrt-trt”]])
## ID AveExpr LogFC LogFC_sd edger_adj_p deseq_adj_p ## 275 ENSG00000120129 11.38754 -2.811094 0.1118097 4.444781e-38 6.013628e- 42 ## 395 ENSG00000116584 10.83852 1.153092 0.1095189 1.508445e-16 9.643002e-42 ## 395 ENSG00000139289 10.83881 1.131120 0.1098113 1.166207e-13 2.233808e-24 ## 90 ensg0000077684 10.46766 -1.066130 0.1135320 4.188089e-11 1.290408e-26 ## 149 ENSG00000103196 11.26943 -2.540661 0.1367032 1.906080e-16 1.665175e-21 ## 807 ENSG00000211445 13.09005 -3.598107 0.11633151.246261e-14 1 ## 245 4.189235e-05 1 1 1.0 3.0 2.107158e-04 2 2 2.0 6.0 2.107158e-04 ## 395 5.341853e-04 5 5 3.5 13.5 5.341853e-04 8 3 3.5 14.5 5.341853e-04 ## 149 9.963537e-04 36 6.5 15.5 9.963537e-04 ## 807 9.963537e-04 49 6.5 19.5 9.963537e-04 ## p_union genename ## 275 6.013628e-44双特异性磷酸酶1 ## 245 9.643002e-42 Rho/Rac鸟嘌呤核苷酸交换因子2 # # 395 2.233808 e-24 pleckstrin同源域家庭成员1 # 1.290408 # 90 e-26玉家人博士手指1 # 1.665175 # 149 e-21半胱氨酸丰富分泌蛋白质LCCL域包含2 # # 807 2.170616 e-19谷胱甘肽过氧化物酶3 # # # #符号kegg坐标链宽度275 DUSP1 04010 chr5:172768090 - 172771195 - 3106 # 05130 # 245 ARHGEF2 chr1:155946851 - 156007070 - 60220 # # 395 PHLDA1 < NA > chr12:76025447 - 76033932 - 8486 # # 90 JADE1 < NA > chr4:128809623 - 128875224 + 65602 # # 149 CRISPLD2 < NA >chr5:151020438-151028993 + 8556

现在将列出下列其他专栏:

  • genename-扩展基因名称(例如- l - focusidase 2)
  • 象征-基因符号(如FUCA2)
  • kegg- kegg路径标识符(例如00511)

如果包含用于构建总结实验的转录本数据库的元数据,则还将包括以下注释:

  • 坐标-染色体坐标(例如chr6:143494811-143511690)
  • -链转录开启(即+或-)
  • 宽度-以碱基对为单位的转录本宽度(bp)(转录本从开始到结束)(例如16880 bp)

4.2将表写入输出目录

multi_de_pairs提供在提供完整路径时自动将所有结果写入输出目录的选项。输出哪些结果取决于提供了哪些目录。的参数提供的完整路径output_voomoutput_edgeroutput_deseq而且output_combined将分别输出Voom, EdgeR, DEseq和合并的结果到所提供的目录。

5去除不需要的变异(RUV)

consensusDE还提供了通过RUVseq功能删除批处理效果的选项。consensusDE目前实现了RUVr,它使用EdgeR对第一次通过的广义线性模型(GLM)建模,并获得残差,以合并到summarizeexperimental对象中,以包含在DE分析的模型中。下面的例子使用RUV来识别这些残差。要查看模型中的残差,请参阅下面绘图函数中的电阻率部分。注意,如果ruv_correct = TRUE一条到a的路径plot_dir,将生成RUV校正前后的诊断图。残差也可以在总结的实验中访问,如下所示。它们出现在“W_1”列中。目前只确定了一个变异因素。

#调用multi_de_pairs()all_pairs_airway_ruv < -multi_de_pairs总结了=airway_filter,成对的=“孤”ruv_correct =真正的#访问总结实验(现在包括“W_1”栏下的残差)all_pairs_airway_ruv总结了@phenoData@数据
## SampleName cell dex albut Run avgLength实验## SRR1039508 GSM1275862 N61311 untrt untrt SRR1039509 GSM1275863 N61311 trt untrt SRR1039509 126 SRX384346 ## SRR1039512 GSM1275866 N052611 trt untrt SRR1039512 126 SRX384349 ## SRR1039513 GSM1275867 N052611 trt untrt SRR1039513 # SRR1039516 GSM1275870 N080611 trt untrt SRR1039516 # SRR1039517 GSM1275871 N080611 trt untrt SRR1039517 126 srx1039554 ## SRR1039517SRR1039508 SRS508568 SAMN02422669 untrt SRR1039508 -0.08312388 ## SRR1039509 SRS508567 SAMN02422675 trt SRR1039509 0.01853551 ## SRR1039512 SRS508571 SAMN02422670 trt SRR1039513 SRS508572 SAMN02422682 untrt SRR1039513 SRR1039516 0.55688461 ## SRR1039517 SRS508576 samn02422676 SAMN02422673SRR1039517 SRR1039517 0.60106294 ## SRR1039520 SRS508579 SAMN02422683 untrt SRR1039520 -0.29682660 ## SRR1039521 SRS508580 SAMN02422677 trt SRR1039521 -0.36905611
#查看结果,现在应用了RUV校正(all_pairs_airway_ruv合并后的[[“untrt-trt”]])
## ID AveExpr LogFC LogFC_sd edger_adj_p deseq_adj_p ## 1 ENSG00000120129 11.38755 -2.795845 0.1043348 2.563603e-52 2.374465e-75 ## # 2 ENSG00000103196 11.26944 -2.498026 0.1089966 1.176625e-20 7.070363e-35 ## # 3 ENSG00000116584 11.02551 1.153351 0.1094772 7.2333422e -19 1.343923e-30 ## 4 ENSG00000211445 13.09006 -3.531512 0.0952666 1.176625e-20 1.113829e-31 ## 5 ENSG00000077684 10.46767 -1.061481 0.1096889 2.006530e-12 7.017736e-35 ## 6 ENSG00000139289 10.83879 1.130942 0.1093725 2.334717e-153.319270e-20 ## # voom_adj_p edger_rank voom_rank rank_sum p_intersect ## 1 2.077071e-05 1.0 11.0 3.0 3.970362e-04 ## 3 2.121089e-04 4.0 5 2.0 11.0 2.970362e -04 ## 4 4.617250e-04 4.5 17.5 3.970362e-04 ## 5 3.970362e-04 11.0 2 4.5 17.5 3.970362e-04 ## 6 3.970362e-04 ## 6 7.070363e-35 ## 3 1.343923e- 31 ## 5 7.017736e-35 ## 6 3.319270e-20

6DE分析配对样品

multi_de_pairs支持DE配对样本。配对样本可以包括,例如,治疗前和治疗后观察到的同一患者。为了便于演示,我们假设每个未经处理和处理的样本是一对。

NB。配对目前不支持超过两个组的分析。如果有两个以上的组,考虑分别测试每个组及其对,或查看edgeR, limma/voom或DESeq2小插图,以建立具有阻塞因素的多变量模型。

首先,我们将更新总结的实验对象,以包括“pairs”列和集配对= "配对"multi_de_pairs

#为airway_filter汇总对象添加“pairs”列colData(airway_filter)对< -as.factorc“pair1”“pair1”“pair2”“pair2”“pair3”“pair3”“pair4”“pair4”))#以“成对”模式运行multi_de_pairsall_pairs_airway_paired < -multi_de_pairs总结了=airway_filter,成对的=“配对”ruv_correct =真正的(all_pairs_airway_paired合并后的[[“untrt-trt”]])
## 1 ENSG00000211445 13.090146 -3.591562 0.11143193 2.013996e-191 2.107187e-261 ## 2 ENSG00000120129 11.387754 -2.810740 0.11097119 9.093204e-136 7.801298e-140 ## 3 ENSG00000103196 11.269573 -2.492442 0.11071604 2.411102e-113 6.650710e-116 ## 4 ENSG00000253368 9.790702 -1.849633 0.11326685 3.576180e-67 9.160743e-57 ## 5 ENSG00000137672 9.129518 -1.807741 0.11314394 2.082487e-56 4.560821e-44 ## 6 ENSG00000180914 8.691937 -1.747506 0.091510282.131186e -11 1 1.0 1 3.0 1.191186e-11 ## 2 1.512098e-10 2 2.0 2 6.0 1.512098e-10 ## 3 3.620473e-10 3 3.0 3 9.0 3.620473e-10 ## # 4 1.047378e-08 4 4.0 4 12.0 1.047378e-08 ## # 6 7.778989e -08 8 10.5 7 25.5 7.777989e-08 ## # 1 2.107187e-261 ## 2 7.801298e-140 ## 3 6.650710e-116 ## 4 3.576180e-67 ## 5 2.082487e-56 ## 6 2.133250e-41

设计矩阵可以按以下方式检索(例如,从轰击模型拟合)

all_pairs_airway_paired安装[[1]]设计
# #拦截W_1 pair2 pair3 pair4 untrt # # SRR1039508 1 0 0 0 1 # # SRR1039509 1 0.24948639 -0.25062331 -0.26981902 0 0 0 0 # # SRR1039512 1 1 0 0 1 # # SRR1039513 1 0.59944990 0.27385504 - 1 0 0 0 # # SRR1039516 1 0 1 0 1 # # SRR1039517 1 0 1 0 0 # # SRR1039520 1 -0.06879627 -0.59899109 0.06543835 0 0 1 1 # # SRR1039521 1 0 0 1 0 # # attr(“转让”),# # [1]0 1 2 2 2 3 # # attr(“对比”)# # attr(“对比”)对# #美元[1]“contr.treatment”# # # # attr(“对比”)$ # #集团[1]“contr.treatment”

7正常化的选项

consensusDE目前实现了两种主要的规范化方法multi_de_pairs ().属性指定了这些属性norm_method参数,其中选项为:EDASeqall_defaults.根据参数说明,当all_defaults,这将使用默认的归一化方法DE, EDASeq的QC(通过控制EDASeq_method),以及edgeR“上分位数”,用于确定RUV残差(根据RUVSeq小插图)。然而,当EDASeq,这将使用EDASeq归一化和指定EDASeq_method贯穿始终,用于RUV, edgeR, DESeq2和voom/limma。使用EDASeq允许在整个过程中使用标准的正常化方法,而all_defaults,允许归一化方法的变化也被建模到最终合并的结果表。

8绘图函数

在进行DE分析时,可以生成一系列的图(目前为10个),并将其保存为。pdf文件,保存在提供给的plot目录中multi_de_pairs ()参数为:Plot_dir = "/path/to/save/pdfs/ ..看到multi_de_pairs ?为描述。

此外,10个地块中的每一个都可以使用diag_plots函数。看到diag_plots ?用于描述,它为10个不同的情节提供包装。接下来,我们将使用示例数据绘制这些数据。

8.1映射读取

绘制每个样本转录组对应的读数。x轴上的样本编号对应于构建的总结实验中的样本行号,可访问使用colData(气管).样品是根据他们的“群体”来着色的。

diag_plotsse_in =airway_filter,name =“气道实例数据”mapped_reads =真正的

8.2相对日志表达式

diag_plotsse_in =airway_filter,name =“气道实例数据”rle =真正的

8.3主成分分析

diag_plotsse_in =airway_filter,name =“气道实例数据”pca =真正的

8.4RUV残差

RUV模型的残差可以绘制如下:

diag_plotsse_in =all_pairs_airway总结,name =“气道实例数据”残差=真正的

8.5分层聚类

diag_plotsse_in =airway_filter,name =“气道实例数据”hclust =真正的

8.6密度分布

diag_plotsse_in =airway_filter,name =“气道实例数据”密度=真正的

8.7箱线图

diag_plotsse_in =airway_filter,name =“气道实例数据”箱线图=真正的

8.8马的阴谋

这将在给定适当结构的数据集的情况下执行MA绘图。这将绘制Log-fold变化(M)与平均表达式水平(A)的关系multi_de_pairs ()并且只绘制一个比较,用一个data.frame构造一个列表,列标记为“ID”,“AveExpr”和“Adj_PVal”是必需的。下面演示了一个使用合并数据的示例,需要将其放入一个列表中并适当地标记。注意,这是自动完成的multi_de_pairs ()

# 1。查看所有进行的比较的名字(all_pairs_airway合并)
##[1]“untrt-trt”
# 2。提取特定比较的感兴趣的数据框架比较< -all_pairs_airway合并后的[[“untrt-trt”]]
#除非在列表中,否则将不起作用,并将停止,产生错误。如。diag_plotsmerged_in =相比之下,name =“untrt-trt”马=真正的#错误信息:Merged_in不是一个列表。如果你只想用一个比较来绘图,将单个数据帧放入如下所示的列表中。my_list < -列表“名称”merged_in)
# 3。按照错误提示放入一个新列表中comparison_list < -列表“untrt-trt”比较)#这将不会工作,除非适当的列被标记#“ID”,“AveExpr”,“Adj_PVal”# 4。为绘图重新标记列#检查列名显示“Adj_PVal”列需要指定。colnames(comparison_list [[“untrt-trt”]])
##[1]“ID”“AveExpr”“LogFC”“LogFC_sd”“edger_adj_p”##[6]“deseq_adj_p”“voom_adj_p”“edger_rank”“deseq_rank”“voom_rank”##[11]“rank_sum”“p_intersect”“p_union”“genename”“symbol”##[16]“kegg”“坐标”“strand”“width”
#在这里,我们将用“Adj_PVal”重新标记“edger_adj_p”来使用这个p值,使用#“gsub”命令,如下所示(然而,我们也可以使用其他命令之一或# p_max列)colnames(comparison_list [[“untrt-trt”< -]])gsub“edger_adj_p”“Adj_PVal”colnames(comparison_list [[“untrt-trt”]]))#后标签colnames(comparison_list [[“untrt-trt”]])
##[1]“ID”“AveExpr”“LogFC”“LogFC_sd”“Adj_PVal”##[6]“deseq_adj_p”“voom_adj_p”“edger_rank”“deseq_rank”“voom_rank”##[11]“rank_sum”“p_intersect”“p_union”“genename”“symbol”##[16]“kegg”“cods”“strand”“width”
# 5。画马diag_plotsmerged_in =comparison_list,name =“untrt-trt”马=真正的

8.9火山

这个图是一个火山图,它比较了对数倍变化与变化-对数转换分数的显著性。如上所述的MA图部分,要独立使用multi_de_pairs ()并且只绘制一个比较,用一个data.frame构造一个列表,列标记为“ID”,“AveExpr”和“Adj_PVal”是必需的。

diag_plotsmerged_in =comparison_list,name =“untrt-trt”火山=真正的

8.10假定值分布

这是用于诊断分析的p值分布图。如上所述的MA图部分,要独立使用multi_de_pairs ()并且只绘制一个比较,用一个data.frame构造一个列表,列标记为“ID”,“AveExpr”和“Adj_PVal”是必需的。

diag_plotsmerged_in =comparison_list,name =“untrt-trt”p_dist =真正的

8.10.1关于绘图的一般注意事项

图例和标签可以使用关闭传说=假而且标签= TRUEdiag_plots ().看到diag_plots ?有关这些参数的详细信息。

9为每次比较访问额外的数据

在进行DE分析时,数据存储在可访问的简单列表对象中。下面是DE分析输出中可用的数据级别。我们使用all_pairs_airway以上分析的结果演示了如何定位这些表。

  • all_pairs_airway美元合并
    • 所执行比较的列表

除了包含DESeq2、Voom和EdgeR组合结果的列表外,还可以访问每种方法的完整结果,以及拟合表和执行的对比。

  • all_pairs_airway deseq美元(DEseq2结果列表)
  • 美元all_pairs_airway轰(boom结果列表)
  • 美元all_pairs_airway磨边机(edgeR结果列表)

在每个列表中,可以访问以下数据。每个对象是执行的所有比较的列表。

  • all_pairs_airway deseq short_results美元
    • 格式化结果。例如,要访问第一个表,请使用all_pairs_airway deseq short_results美元[[1]]
  • all_pairs_airway deseq full_results美元
    • 通常由成对比较输出的完整结果
  • all_pairs_airway deseq安装美元
    • 使表适合存取系数等。
  • all_pairs_airway deseq美元对比
    • 对比的表现

10引用使用consensusDE

在使用此软件包时,请引用以下共识和分析中使用的所有方法。

对于共识DE:

引用“consensusDE”
## ##在出版物中引用软件包“consensusDE”使用:## ## Waardenberg A(2022)。_consensusDE:使用多种算法的RNA-seq分析_。R包版本为1.17.0。## ## LaTeX用户的BibTeX条目是## ## @Manual{, ## title = {consensusDE:使用多种算法的RNA-seq分析},##作者= {Ashley J. Waardenberg}, ## year = {2022}, ## note = {R包版本1.17.0},##}
  • 当使用RUVseq时(也检查包参考建议)
    • D. Risso, J. Ngai, t.p. Speed和S. Dudoit(2014)。基于因子分析的RNA-seq数据规范化研究。生物技术学报,32(9),896-902
  • 使用DESeq2时(也检查包参考建议)
    • Love, M.I, Huber, W., Anders, S.使用DESeq2对RNA-seq数据的折叠变化和离散度的调节估计基因组生物学15(12):550 (2014)
  • 使用edgeR时(也检查包参考建议)
    • Robinson MD, McCarthy DJ和Smyth GK(2010)。edgeR:用于数字基因表达数据差异表达分析的Bioconductor包。生物信息学26,139-140
    • 麦卡西·DJ,陈勇,史密斯·GK(2012)。生物变异方面的多因素RNA-Seq实验差异表达分析。中国生物医学工程学报(自然科学版
  • 使用limma/voom时(同时检查包装参考建议)
    • Ritchie, m.e., Phipson, B., Wu, D., Hu, Y., Law, C.W., Shi, W.,和Smyth, G.K.(2015)。用于rna测序和微阵列研究的limma幂差表达分析。中国生物医学工程学报43(7),e47。