# #设置,回声= FALSE,结果=“隐藏”,消息= FALSE -------------------- knitr: opts_chunk美元集(整洁= FALSE,缓存= TRUE, dev =“png”,消息= FALSE,错误= FALSE,警告= TRUE) # #库需要(“Biobase”)要求(NMF)需要(“cvxclustr ") ## ---- 安装、eval = FALSE -------------------------------------------- # 源(“//www.anjoumacpherson.com/biocLite.R”)# biocLite(“DASC ") ## ---- 消息= FALSE,结果= '隐藏',eval=TRUE--------------------------- library(DASC) data("esGolub") samples <- c(20,21,28,30) dat <- exprs(esGolub)[1:100,samples] pdat <- pData(esGolub)[samples,] ##使用nrun = 50或更多,以更好地收敛结果res <- DASC(edata = dat, pData = pdat, factor = pdat$Cell, method = 'ama', type = 3, lambda = 1, rank = 2:3, nrun = 5, annotation="esGolub Dataset") #consensusmap(res) #plot(res) ## ---- message=FALSE,eval = TRUE ------------------------------------------- ## 库set.seed(99999)库(DESeq2)图书馆(ggplot2)图书馆(pcaExplorer) # #数据集rawCounts < - < stanfordData rawCounts美元元数据- stanfordData $ # #元数据信息= FALSE, eval = TRUE ------------------------------------------- ## 使用一个较小的数据集idx <——(元数据组织美元% % c(“脂肪”、“肾上腺”、“乙状结肠”))rawCounts < - rawCounts [, idx] [idx < -元数据的元数据 ,] ## ---- 消息= FALSE,eval = TRUE ------------------------------------------- 头(rawCounts)头(元数据 ) ## ---- 消息= FALSE, eval = TRUE ------------------------------------------- ## 规范数据集使用DESeq2 dds < - DESeqDataSetFromMatrix (rawCounts、元数据设计= ~物种+组织)dds < - estimateSizeFactors (dds) dat < -计数(dds,规范化= TRUE) lognormalizedCounts < log2 (dat + 1 ) ## ---- 消息= FALSE, eval = TRUE ------------------------------------------- ## 使用行PCA的阴谋。DDS <- rlog(DDS) pcaplot(rld. rlog)dds, intgroup = c(“组织”、“物种”),ntop = 1000,图形文件= 1,pcY = 2 ) ## ---- 消息= FALSE, eval = TRUE ------------------------------------------- res < DASC (edata = dat pdata =元数据,因子=元数据组织,美元=“ama”方法,类型= 3,λ= 1,排名= 2:3,nrun = 10,注释= '斯坦福数据集 ') ## ---- 消息= FALSE, eval = TRUE ------------------------------------------- ## 共识情节consensusmap (res ) ## ---- 消息= FALSE,eval = TRUE ------------------------------------------- ## 剩余阴谋情节(res ) ## ---- 消息= FALSE, eval = TRUE ------------------------------------------- ## 批次——数据集6批次样品。clust <- data.frame(sample.name = colnames(lognormalizedCounts), clust = as.vector(predict(res$fit$ ' 2 ')), batch =元数据$seqBatch) ggplot(data = sample.name = colnames(lognormalizedCounts)clust aes (x = c (1:6), y = clust,颜色=因素(clust))) + geom_point(大小= 4)+ xlab(样品号)+ ylab(“集群数量 ") ## ---- 消息= FALSE ------------------------------------------------------ sessionInfo ()