内容

1小插图版

这个描述是使用CoGAPS版本:

packageVersion (“CoGAPS”)
# # [1]“3.6.0”

2介绍

协调基因协会模式(CoGAPS)是一个集技术潜在的空间学习在基因表达数据。CoGAPS属于非负矩阵分解(NMF)类的算法。NMFs因式分解数据包含基因权重矩阵为两个相关矩阵,振幅(a)矩阵,矩阵和样本权重,模式(P)。每一列或一行的P定义了一组特性和在一起的特性定义了潜在的基因之间的空间和样本,分别。NMF、元素的值和P矩阵约束是大于或等于零。这个约束同时反映了基因表达数据和执行的本质非负的添加剂特性产生的特征尺寸,生成解决方案,在生理上直观的解释(Seung和李(1999))。

CoGAPS有两个扩展,允许它规模庞大的数据集,全基因组CoGAPS (GWCoGAPS)和单细胞CoGAPS (scCOGAPS)。这个包提供了一个统一的R界面为所有三种方法,平行,在c++高效的底层实现。

3安装CoGAPS

CoGAPS是bioconductor包的发布版本可以安装如下:

源(“//www.anjoumacpherson.com/biocLite.R”) biocLite (“CoGAPS”)

最新的版本CoGAPS可以直接从安装吗FertigLabGithub库:

# #方法1使用biocLite biocLite (“FertigLab / CoGAPS”、依赖= TRUE, build_vignettes = TRUE) # #使用devtools包devtools方法2::install_github (“FertigLab / CoGAPS”)

还有一个选项来安装的开发版本CoGAPS,而这个版本最新的实验特性,它不保证是稳定的。

# #方法1使用biocLite biocLite (“FertigLab / CoGAPS”ref =“开发”,依赖= TRUE, build_vignettes = TRUE) # #使用devtools包devtools方法2::install_github (“FertigLab / CoGAPS”ref =“开发”)

4方案概述

我们首先给出一个预排包的使用一个简单的特性,模拟数据集。在以后的部分我们提供两个示例工作流在真实的数据集。

4.1运行CoGAPS使用默认参数

唯一所需的参数CoGAPS数据集。这可以吗矩阵,data.frame,SummarizedExperiment,SingleCellExperiment或文件的路径(tsv,csv,mtx,gct)包含数据。

#数据加载数据(要点)#运行CoGAPS(低的迭代次数,因为这仅仅是一个例子)CoGAPS(要点。矩阵,nIterations = 1000)
# # # #这是CoGAPS版本3.6.0 # #运行标准CoGAPS要点。矩阵(1363个基因和9个样品)with parameters: ## ## -- Standard Parameters -- ## nPatterns 7 ## nIterations 1000 ## seed 439 ## sparseOptimization FALSE ## ## -- Sparsity Parameters -- ## alpha 0.01 ## maxGibbsMass 100
与1363年# # [1]“CogapsResult对象特性和9样品”# #[1]“7模式学习”

虽然CoGAPS定期运行输出状态信息。例如,25000年20000年,原子:2932 (80),ChiSq: 9728时间:00:00:29 / 00:01:19。这个消息告诉我们,CoGAPS迭代20000 25000这个阶段,和29秒估计已经过了1分19秒。它还告诉我们原子域的大小是算法的核心组件但目前可以忽略。最后,ChiSq价值告诉我们如何紧密和P矩阵重构原始数据。一般来说,我们希望这个值下降,但它并不是一个完美的测量的CoGAPS是找到数据中包含的生物过程。CoGAPS也打印一条消息说明目前阶段发生。该算法——有两个阶段平衡抽样

4.2设置参数

4.2.1模型参数

大部分时间我们在运行CoGAPS之前要设置一些参数。参数的管理CogapsParams对象。这个对象将存储CoGAPS运行所需的所有参数和提供了一个简单的接口,用于查看和设置参数值。

#创建新的参数对象参数< -新(CogapsParams) #查看所有参数参数
# #——标准参数——# # nPatterns 7 50000种子145 # # # # # # nIterations sparseOptimization假# # # #——稀疏参数α# # 0.01 # # maxGibbsMass 100
#获取一个特定参数的值getParam (params,“nPatterns”)
# # [1]7
#设置特定参数的值参数< - setParam (params,“nPatterns”, 3) getParam (params,“nPatterns”)
# # 3 [1]

一旦我们创建对象的参数我们可以通过它与我们的数据CoGAPS

#用模型参数指定运行CoGAPS CoGAPS(要点。矩阵,params, nIterations = 1000)
# # # #这是CoGAPS版本3.6.0 # #运行标准CoGAPS要点。矩阵(1363个基因和9个样品)with parameters: ## ## -- Standard Parameters -- ## nPatterns 3 ## nIterations 1000 ## seed 145 ## sparseOptimization FALSE ## ## -- Sparsity Parameters -- ## alpha 0.01 ## maxGibbsMass 100
与1363年# # [1]“CogapsResult对象特性和9样品”# #[1]“三学习”模式

4.2.2运行配置选项

CogapsParams类管理模型参数,即参数影响的结果。也有一些参数直接传递给CoGAPS控制显示运行的状态。

#用指定的输出频率运行CoGAPS CoGAPS(要点。矩阵,params, nIterations = 1000, outputFrequency = 250)
# # # #这是CoGAPS版本3.6.0 # #运行标准CoGAPS要点。矩阵(1363个基因和9个样品)with parameters: ## ## -- Standard Parameters -- ## nPatterns 3 ## nIterations 1000 ## seed 145 ## sparseOptimization FALSE ## ## -- Sparsity Parameters -- ## alpha 0.01 ## maxGibbsMass 100
与1363年# # [1]“CogapsResult对象特性和9样品”# #[1]“三学习”模式

还有其他几个参数直接传递CoGAPS覆盖在以后的章节。

4.3打破从CoGAPS返回对象

CoGAPS返回一个对象的类CogapsResult它继承自LinearEmbeddingMatrix(定义在SingleCellExperiment包)。CoGAPS商店的低维表示样品(P矩阵)sampleFactors槽的重量特性(矩阵)featureLoadings槽。CogapsResult还增加了自己的两个槽-factorStdDevloadingStdDev含有标准差在采样点为每个矩阵。

也有一些信息元数据槽等原始Chi-Sq统计参数和值。一般来说,元数据将取决于如何CoGAPS被放在第一位。包提供了这些函数查询元数据以安全的方式:

#运行CoGAPS结果< - CoGAPS(要点。矩阵,参数个数,messages=FALSE, nIterations=1000)
# # # #这是CoGAPS版本3.6.0 # #运行标准CoGAPS要点。矩阵(1363个基因和9个样品)
#得到平均ChiSq统计对所有样本getMeanChiSq(结果)
# # 4913.195 [1]
#获取版本号用于创建这个结果getVersion(结果)
# # [1]“3.6.0”
#获取原始参数用于创建这个结果getOriginalParameters(结果)
# #——标准参数——# # nPatterns 1000 # # # # nIterations种子145 # # # # # # sparseOptimization虚幻,稀疏参数α- # # 0.01 # # maxGibbsMass 100

将一个CogapsResult对象一个LinearEmbeddingMatrix使用

(因此,“LinearEmbeddingMatrix”)
# # # #类:LinearEmbeddingMatrix暗淡:9 3 # #元数据(16):meanChiSq chisq……参数版本# # rownames:零# # colnames:零# # factorData名称(0):

4.4可视化输出

CogapsResult对象可以转嫁给分析和绘图包中提供的功能。默认情况下,情节函数显示模式不同样品。(注意,我们通过nIterations直接参数,这是允许的任何参数CogapsParams类和总是优先于中给定的值参数个数)。

#存储结果结果< - CoGAPS(要点。矩阵,参数个数,nIterations=5000, messages=FALSE)
# # # #这是CoGAPS版本3.6.0 # #运行标准CoGAPS要点。矩阵(1363个基因和9个样品)
#情节CogapsResult对象回来CoGAPS情节(结果)

工作流的示例中,我们将探讨一些包中提供的分析功能。

4.5并行运行CoGAPS

非负矩阵分解算法通常需要较长的计算时间和CoGAPS也不例外。为了CoGAPS规模大小的数据集在实践中我们需要利用现代硬件和并行化算法。

4.5.1多线程并行化

最简单的方式并行运行CoGAPS是提供的nThreads参数CoGAPS。这允许底层算法上运行多个线程,对算法的数学没有影响即CoGAPS这仍然是标准。精确数量的线程使用取决于许多诸如硬件和数据大小。最好的方法是在不同的值,看看它如何影响估计时间。

CoGAPS(要点。矩阵,nIterations=10000, outputFrequency=5000, nThreads=1, seed=5)
# # # #这是CoGAPS版本3.6.0 # #运行标准CoGAPS要点。矩阵(1363个基因和9个样品)with parameters: ## ## -- Standard Parameters -- ## nPatterns 7 ## nIterations 10000 ## seed 5 ## sparseOptimization FALSE ## ## -- Sparsity Parameters -- ## alpha 0.01 ## maxGibbsMass 100
与1363年# # [1]“CogapsResult对象特性和9样品”# #[1]“7模式学习”
CoGAPS(要点。矩阵,nIterations=10000, outputFrequency=5000, nThreads=4, seed=5)
# # # #这是CoGAPS版本3.6.0 # #运行标准CoGAPS要点。矩阵(1363个基因和9个样品)with parameters: ## ## -- Standard Parameters -- ## nPatterns 7 ## nIterations 10000 ## seed 5 ## sparseOptimization FALSE ## ## -- Sparsity Parameters -- ## alpha 0.01 ## maxGibbsMass 100
与1363年# # [1]“CogapsResult对象特性和9样品”# #[1]“7模式学习”

注意这种方法依赖于CoGAPS被编译OpenMP的支持,使用buildReport检查。

猫(CoGAPS:: buildReport ())
用GCC v7.4编译的# # # # SIMD: AVX指示启用# #编译与OpenMP

4.5.2分布式CoGAPS (GWCoGAPS / scCoGAPS)

对于大数据集(大于几千个基因或样品)的多线程并行化是不够的。更高效的数据分解成子集,每个子集上执行CoGAPS并行,将结果返回缝合在一起来防止剥落。CoGAPS扩展,GWCOGAPS scCoGAPS,每个实现该方法的一个版本(Stein-O ' brien et al。(2017))。

为了使用这些扩展,需要一些额外的参数。nSets指定数量的数据集分解成子集。减少,明尼苏达州,maxNS控制匹配模式的子集的过程,一般不应该从违约。可以找到更多的信息关于这些参数在原始文件。这些参数需要设置不同的功能setParam因为他们彼此依赖。在这里我们只设置nSets(总是要求),但是我们可以选择通过其他参数。

参数< - setDistributedParams (params, nSets = 3)
# #设置分布式参数——如果你改变nPatterns再次调用这个

设置nSets需要平衡可用硬件和运行时对您的数据的大小。一般来说,nSets应该小于或等于/核心节点的数目是可用的。如果这是真的,那么您创建子集越多,越快CoGAPS将运行,然而,一些鲁棒性太小子集时可能会丢失。一般的经验法则是集nSets所以1000年和5000年之间,每个子集基因或细胞。我们会看到一个这样的例子在实际数据在接下来的两个部分。

一旦分布式参数已经设置我们可以称之为CoGAPS要么通过设置分布式参数或使用所提供的包装器函数。以下称是等价的:

#需要使用一个文件与分布式cogaps GISTCsvPath < -执行(“extdata /要点。csv", package="CoGAPS") # genome-wide CoGAPS GWCoGAPS(GISTCsvPath, params, messages=FALSE, nIterations=1000)
# #警告GWCoGAPS (params, GISTCsvPath消息= FALSE, nIterations # # = 1000): GWCoGAPS弃用,使用主要功能与# # CoGAPS论点:分布式=“基因组”
# # # #这是CoGAPS版本上运行全基因组CoGAPS 3.6.0 # # / tmp / RtmpN6QTBZ / Rinst9fd76a907fd CoGAPS / extdata /要点。csv(1363个基因和9个样品)
与1363年# # [1]“CogapsResult对象特性和9样品”# #[1]“2模式学习”
#全基因组CoGAPS CoGAPS (GISTCsvPath、参数、分布式=“基因组”,消息= FALSE, nIterations = 1000)
# # # #这是CoGAPS版本上运行全基因组CoGAPS 3.6.0 # # / tmp / RtmpN6QTBZ / Rinst9fd76a907fd CoGAPS / extdata /要点。csv(1363个基因和9个样品)
与1363年# # [1]“CogapsResult对象特性和9样品”# #[1]“2模式学习”
#单细胞CoGAPS scCoGAPS (params, GISTCsvPath消息= FALSE, transposeData = TRUE, nIterations = 1000)
# #警告scCoGAPS (params, GISTCsvPath消息= FALSE, transposeData # # = TRUE,: scCoGAPS弃用,使用# #的主要功能CoGAPS论点:分布式=“单细胞”
# # # #这是CoGAPS版本上运行单细胞CoGAPS 3.6.0 # # / tmp / RtmpN6QTBZ / Rinst9fd76a907fd CoGAPS / extdata /要点。csv(9基因和1363个样本)
与9 # # [1]“CogapsResult对象特性和1363个样本”# #[1]“三学习”模式
#单细胞CoGAPS CoGAPS (GISTCsvPath、参数、分布式=“单细胞”,消息= FALSE, transposeData = TRUE, nIterations = 1000)
# # # #这是CoGAPS版本上运行单细胞CoGAPS 3.6.0 # # / tmp / RtmpN6QTBZ / Rinst9fd76a907fd CoGAPS / extdata /要点。csv(9基因和1363个样本)
与9 # # [1]“CogapsResult对象特性和1363个样本”# #[1]“三学习”模式

管理的后台并行计算方案BiocParallel和有一个选项为用户越多,他们想要的后端。看到附加功能节以获取更多信息。

一般来说它是首选通过一个文件名GWCoGAPS/scCoGAPS因为否则整个数据集必须被复制到多个进程将慢下来并有可能引起一个内存不足的错误。我们会看到这样的例子在接下来的两个部分。

5附加功能的CoGAPS

5.1检查点系统-保存/加载CoGAPS运行

CoGAPS允许用户保存在运行他们的进展,并重新启动从最新的救了“关卡”。这个目的是如果中间的服务器崩溃的长远来看,从一开始就不需要重新启动。设置checkpointInterval参数保存检查站和通过文件名称checkpointInFile加载一个检查点。

如果(CoGAPS:: checkpointsEnabled()){#初始运行res1 < - CoGAPS(要点。矩阵,参数个数,checkpointInterval=100, checkpointOutFile="vignette_example.out", messages=FALSE) # assume the previous run crashes res2 <- CoGAPS(GIST.matrix, checkpointInFile="vignette_example.out", messages=FALSE) # check that they're equal all(res1@featureLoadings == res2@featureLoadings) all(res1@sampleFactors == res2@sampleFactors) }

5.2移调数据

如果您的数据是存储为样本x基因,CoGAPS让你通过transposeData = TRUE和将自动读取数据的转置得到所需的基因x样本配置。

5.3通过不确定性矩阵

除了提供数据,用户还可以指定一个不确定性测量的标准偏差数据矩阵中的每个条目。默认情况下,CoGAPS假定标准差矩阵是10%的数据矩阵。这是一个合理的使用启发式,但为特定类型的数据你可以提供更好的信息。

#运行CoGAPS使用自定义的不确定性数据(要点)结果< - CoGAPS(要点。矩阵,参数不确定性=要点。不确定性,信息= FALSE, nIterations = 1000)
# # # #这是CoGAPS版本3.6.0 # #运行标准CoGAPS要点。矩阵(1363个基因和9个样品)

5.4GWCoGAPS / scCoGAPS

5.4.1之前设置平行的后端

CoGAPS使用的分布式计算BiocParallel在底层管理并行化。用户选择指定后端应该是什么。默认情况下,它是MulticoreParam与相同数量的工人nSets。使用BPPARAM参数CoGAPS设置后端。看到的装饰图案BiocParallel更多信息的不同的选择后端。

#用串行端运行CoGAPS scCoGAPS (GISTCsvPath params, BPPARAM = BiocParallel:: SerialParam(),信息= FALSE, transposeData = TRUE, nIterations = 1000)
# #警告scCoGAPS (params, GISTCsvPath BPPARAM = # # BiocParallel:: SerialParam (): scCoGAPS弃用,使用主要功能与论点:# # CoGAPS分布式=“单细胞”
# # # #这是CoGAPS版本上运行单细胞CoGAPS 3.6.0 # # / tmp / RtmpN6QTBZ / Rinst9fd76a907fd CoGAPS / extdata /要点。csv(9基因和1363个样本)
与9 # # [1]“CogapsResult对象特性和1363个样本”# #[1]“三学习”模式

5.4.2方法构造子集的数据

的默认方法构造子集数据统一分手行(关口)的数据。还有另一种选择的用户提供了一个注释向量rownames (colnames)的数据,给出了权重注释中的每个类别向量。同等大小的子集然后由抽样所有行(关口)根据每个类别的重量。

#与权重庵野< -样品抽样(字母[1:5],大小= nrow (GIST.matrix),取代= TRUE) w < - c(1、1、2、2、1)名称(w) < -信[1:5]params < -新(“CogapsParams”)参数< setAnnotationWeights (params、注释=伊斯兰教纪元,重量= w)结果< - GWCoGAPS (params, GISTCsvPath消息= FALSE, nIterations = 1000)
# #警告GWCoGAPS (params, GISTCsvPath消息= FALSE, nIterations # # = 1000): GWCoGAPS弃用,使用主要功能与# # CoGAPS论点:分布式=“基因组”
# # # #这是CoGAPS版本上运行全基因组CoGAPS 3.6.0 # # / tmp / RtmpN6QTBZ / Rinst9fd76a907fd CoGAPS / extdata /要点。csv(1363个基因和9个样品)

最后,用户可以设置explicitSets列表的字符或数字向量表示名称或索引的数据应该放在每组,确保准备好了吗nSets在通过正确的值explicitSets

#运行cogaps与给定子集集< -列表(1:225、226:450 451:675,676:900)参数< -新(“CogapsParams”)参数< setDistributedParams (params, nSets =长度(集))
# #设置分布式参数——如果你改变nPatterns再次调用这个
结果< - GWCoGAPS (params, GISTCsvPath explicitSets =集,消息= FALSE, nIterations = 1000)
# #警告GWCoGAPS (params, GISTCsvPath explicitSets =集,消息# # = FALSE,: GWCoGAPS弃用,使用# #的主要功能CoGAPS论点:分布式=“基因组”
# # # #这是CoGAPS版本上运行全基因组CoGAPS 3.6.0 # # / tmp / RtmpN6QTBZ / Rinst9fd76a907fd CoGAPS / extdata /要点。csv(1363个基因和9个样品)

5.4.3额外的返回信息

GWCoGAPS或scCoGAPS运行时,一些额外的元数据返回与模式匹配的过程。这个过程是如何CoGAPS针的结果每个子集。

# GWCoGAPS运行(子集数据显示输出很小)参数< -新(“CogapsParams”)参数< setParam (params,“nPatterns”, 3)参数< - setDistributedParams (params, nSets = 2)
# #设置分布式参数——如果你改变nPatterns再次调用这个
结果< - GWCoGAPS (params, GISTCsvPath消息= FALSE, nIterations = 1000)
# #警告GWCoGAPS (params, GISTCsvPath消息= FALSE, nIterations # # = 1000): GWCoGAPS弃用,使用主要功能与# # CoGAPS论点:分布式=“基因组”
# # # #这是CoGAPS版本上运行全基因组CoGAPS 3.6.0 # # / tmp / RtmpN6QTBZ / Rinst9fd76a907fd CoGAPS / extdata /要点。csv(1363个基因和9个样品)
#获取无与伦比的模式从每个子集getUnmatchedPatterns(结果)
([1])# # # # Pattern_1 Pattern_2 Pattern_3 # # # # IM02 IM00 0.9067671 0.9997633 0.9868651 0.9235139 0.8792341 0.9838579 0.9372641 0.7518373 0.9568756 # # IM04 # # IM06 # IM09 0.9609523 0.5775024 0.9647725 0.9510983 0.6969431 0.9697102 # # # IM12 # IM18 0.9961178 0.2776369 0.9936132 0.9787686 0.4044566 0.9914942 # # # IM24 # IM48 0.9896217 0.1944398 0.9828941 0.9910366 0.1940815 0.9832200 # # # # # # # [[2]] Pattern_1 Pattern_2 Pattern_3 # # # # IM02 IM00 0.9999505 0.9895501 0.2160436 0.9452331 0.9934017 0.2751135 0.8715482 0.9727526 0.5144038 # # IM04 # # IM06 # IM09 0.7771053 0.9786184 0.7163785 0.8552769 0.9799111 0.5899298 # # # IM12 # IM18 0.7186645 0.9919239 0.8671477 0.7530221 0.9964013 0.7414936 # # # IM24 0.6481747 0.9919614 0.9979740 # # IM48 0.6559720 0.9907970 0.9054824
#获取集群模式设置的所有模式getClusteredPatterns(结果)
# # $ ' 1 ' # # 1.1 - 2.3 # # IM00 0.9067671 - 0.2160436 # # IM02 0.9235139 - 0.2751135 # # IM04 0.9372641 - 0.5144038 # # IM06 0.9510983 - 0.5899298 # # IM09 0.9609523 - 0.7163785 # # IM12 0.9787686 - 0.7414936 # # IM18 0.9961178 - 0.8671477 # # IM24 0.9910366 - 0.9979740 # # IM48 0.9896217 - 0.9054824 # # # # $ ' 2 ' # # 2.1 - 2.2 # # IM00 0.9997633 - 0.9999505 # # IM02 0.8792341 - 0.9452331 # # IM04 0.7518373 - 0.8715482 # # IM06 0.6969431 - 0.8552769 # # IM09 0.5775024 - 0.7771053 # # IM12 0.4044566 - 0.7530221 # # IM18 0.2776369 - 0.7186645 # # IM24 0.1940815 - 0.6481747 # # IM48 0.1944398 - 0.6559720 # # # # $ 3的1.2 - 1.3 # # # # IM00 0.9868651 - 0.9895501 # # IM02 0.9838579 - 0.9934017 # # IM04 0.9568756 - 0.9727526 # # IM06 0.9697102 - 0.9799111 # # IM09 0.9647725 - 0.9786184 # # IM12 0.9914942 - 0.9964013 # # IM18 0.9936132 - 0.9919239 # # IM24 0.9832200 - 0.9919614 # # IM48 0.9828941 - 0.9907970
#让每个模式的相关性集群意味着getCorrelationToMeanPattern(结果)
# # $ ' 1 ' # #[1]0.979 - 1.000 # # # # $ ' 2 ' # #[1]0.999 - 0.994 # # # # $ 3的# # 0.993 - 0.983 [1]
#得到子集的大小用酸式焦磷酸钠(getSubsets(结果),长度)
# # 681 682 [1]

5.4.4手动管道

CoGAPS允许自定义流程的模式匹配。如果你有一个结果对象从先前GWCoGAPS / scCoGAPS运行,每个子集的无与伦比的模式通过调用getUnmatchedPatterns。申请你喜欢的任何方法,只要结果是一个矩阵的行数等于样本的数量(基因)和列数等于模式的数量。然后通过矩阵fixedPatterns参数以及原始参数GWCoGAPS / scCoGAPS运行。

#初始运行结果< - GWCoGAPS (GISTCsvPath消息= FALSE, nIterations = 1000)
# #警告GWCoGAPS (GISTCsvPath消息= FALSE, nIterations = 1000): # # GWCoGAPS弃用,使用的主要功能CoGAPS论点:# #分布式=“基因组”
# # # #这是CoGAPS版本上运行全基因组CoGAPS 3.6.0 # # / tmp / RtmpN6QTBZ / Rinst9fd76a907fd CoGAPS / extdata /要点。csv(1363个基因和9个样品)
#定义匹配过程(先把矩阵从子集作为虚拟)consensusMatrix < - getUnmatchedPatterns(结果)[[1]]#运行自定义匹配模式矩阵参数< - CogapsParams()参数< - setFixedPatterns (params, consensusMatrix,“P”) GWCoGAPS (params, GISTCsvPath explicitSets = getSubsets(结果),nIterations = 1000)
# #警告GWCoGAPS (params, GISTCsvPath explicitSets = getSubsets(结果):# # GWCoGAPS弃用,使用的主要功能CoGAPS论点:# #分布式=“基因组”
# # # #这是CoGAPS版本上运行全基因组CoGAPS 3.6.0 # # / tmp / RtmpN6QTBZ / Rinst9fd76a907fd CoGAPS / extdata /要点。csv(1363个基因和9个样品)with parameters: ## ## -- Standard Parameters -- ## nPatterns 7 ## nIterations 1000 ## seed 90 ## sparseOptimization FALSE ## distributed genome-wide ## ## -- Sparsity Parameters -- ## alpha 0.01 ## maxGibbsMass 100 ## ## -- Distributed CoGAPS Parameters -- ## nSets 4 ## cut 7 ## minNS 2 ## maxNS 6 ## ## Creating subsets...using provided named subsets ## set sizes (min, mean, max): (340, 340.75, 343) ## Running Final Stage...
与1363年# # [1]“CogapsResult对象特性和9样品”# #[1]“7模式学习”

6sessionInfo ()

sessionInfo ()
# # R版本3.6.1(2019-07-05)# #平台:x86_64-pc-linux-gnu(64位)# #下运行:Ubuntu 18.04.3 LTS # # # #矩阵产品:默认# #布拉斯特区:/home/biocbuild/bbs - 3.10 - bioc / R / lib / libRblas。所以# # LAPACK: /home/biocbuild/bbs - 3.10 - bioc / R / lib / libRlapack。# # # #语言环境:# # [1]LC_CTYPE = en_US。utf - 8 LC_NUMERIC = C # #[3]而= en_US。utf - 8 LC_COLLATE = C # # [5] LC_MONETARY = en_US。utf - 8 LC_MESSAGES = en_US。utf - 8 # # [7] LC_PAPER = en_US。utf - 8 LC_NAME = C # # [9] LC_ADDRESS C = C LC_TELEPHONE = # # [11] LC_MEASUREMENT = en_US。utf - 8 LC_IDENTIFICATION = C附加基本包:# # # # # #[1]统计图形grDevices跑龙套数据集方法基础# # # #其他附加包:# # [1]BiocParallel_1.20.0 CoGAPS_3.6.0 BiocStyle_2.14.0 # # # #通过加载一个名称空间(而不是附加):# # [1]Rcpp_1.0.2 compiler_3.6.1 # # [3] RColorBrewer_1.1-2 BiocManager_1.30.9 # # [5] GenomeInfoDb_1.22.0 XVector_0.26.0 # # [7] bitops_1.0-6 tools_3.6.1 # # [9] zlibbioc_1.32.0 SingleCellExperiment_1.8.0 # # [11] digest_0.6.22 rhdf5_2.30.0 # # [13] evaluate_0.14 lattice_0.20-38 # # [15] rlang_0.4.1 Matrix_1.2-17 # # [17] DelayedArray_0.12.0 yaml_2.2.0 # # [19] parallel_3.6.1 xfun_0.10 # # [21] GenomeInfoDbData_1.2.2 stringr_1.4.0 # # [23] knitr_1.25 cluster_2.1.0 # # [25] caTools_1.17.1.2 gtools_3.8.1 # # [27] S4Vectors_0.24.0 IRanges_2.20.0 # # [29] stats4_3.6.1 grid_3.6.1 # # [31] Biobase_2.46.0 rmarkdown_1.16 # # [33] bookdown_0.14 gdata_2.18.0 # # [35] Rhdf5lib_1.8.0 magrittr_1.5 # # [37] gplots_3.0.1.1 htmltools_0.4.0 # # [39] matrixStats_0.55.0 BiocGenerics_0.32.0 # # [41] GenomicRanges_1.38.0 SummarizedExperiment_1.16.0 # # [43] KernSmooth_2.23-16 stringi_1.4.3 # # [45] rcurl_1.95 - 4.12

7援引CoGAPS

如果你使用CoGAPS包分析,请引用多数et al。(2010)

如果你使用基因集统计,请引用Ochs et al。(2009)

引用

多数时候,伊莱J。,Jie Ding, Alexander V. Favorov, Giovanni Parmigiani, and Michael F. Ochs. 2010. “CoGAPS: An R/C++ Package to Identify Patterns and Biological Process Activity in Transcriptomic Data.”生物信息学26日(21):2792 - 3。https://doi.org/10.1093/bioinformatics/btq503

Ochs迈克尔·F。,Lori Rink, Chi Tarn, Sarah Mburu, Takahiro Taguchi, Burton Eisenberg, and Andrew K. Godwin. 2009. “Detection of Treatment-Induced Changes in Signaling Pathways in Gastrointestinal Stromal Tumors Using Transcriptomic Data.”癌症研究69 (23):9125 - 32。https://doi.org/10.1158/0008 - 5472.可以- 09 - 1709

Seung,塞巴斯蒂安,丹尼尔·d·李。1999。“学习对象的部分非负矩阵分解。”自然401 (6755):788 - 91。https://doi.org/10.1038/44565

Stein-O ' brien,吉纳维芙L。,Jacob L. Carey, Wai S. Lee, Michael Considine, Alexander V. Favorov, Emily Flam, Theresa Guo, et al. 2017. “PatternMarkers & Gwcogaps for Novel Data-Driven Biomarkers via Whole Transcriptome Nmf.”生物信息学33 (12):1892 - 4。https://doi.org/10.1093/bioinformatics/btx058