在这里,我们提供了用于构造RangedSummarizedExperiment对象的裂变实验数据包。计数矩阵由该出版物的第一作者提供:
梁珊珊、道生K、韦氏C、李杨、康诺利Y、史密斯DL、韦金森CR、米勒CJ。一个全局非编码RNA系统调节裂变酵母蛋白水平,以应对压力.Nat Commun2014年5月23日;5:3947。PMID:24853205.地理:GSE56761.
以下摘自GEO系列:
“在0、15、30、60、120和180分钟用1M山梨醇处理后,裂变酵母野生型(WT)和atf21del菌株在渗透胁迫时间过程中的整体转录谱。在Applied Biosystems SOLiD 5500xl遗传分析仪系统上对生物三份进行了总RNA的链特异性单端测序。”
测序读数与裂变酵母基因组(PomBase数据库版本11)使用SHRiMP2校准器与默认参数进行校准。在每个样本的一个位点上,可以与基因组对齐的总reads数在750万到2010万之间。这些唯一映射的读段被用来识别明确的转录片段。与多个位点(通常是基因组中的副同源区域)对齐的Reads被丢弃。相邻的转录区最小峰高为2,彼此位于50个碱基内,合并得到广泛的S. pombe转录图谱。然后将这些区域相对于已知注释进行定位,并使用Bioconductor包annmap根据它们重叠的基因进行标记。”
下面的代码用于从GEO读取表型数据。
library("GEOquery") gse <- getGEO(filename="GSE56761_series_matrix.txt") pdata <- pdata (gse)[,grepl(" features ",names(pdata (gse)))]
的data.frame通过将长字符串替换为短字符串,并将分钟变量转换为具有正确顺序级别的因子来进行清理。
Names (pdata) <- c("strain","treatment","time"," replication ") pdataclean <- data.frame(strain=ifelse(grepl("wild type",pdata$strain),"wt","mut"), minute=sub("time \\(min\\): (.*)","\\1",pdata$time), replication =paste0("r",sub(" replication: "(.*)","\\1",pdata$ replication)), row.names=rownames(pdata)) pdataclean$id <- paste(pdataclean$strain,pdataclean$minute,pdataclean$ replication,sep="_") pdataclean$strain <- relevel(pdataclean$strain, "wt") pdataclean$minute <- factor(pdataclean$minute, levels=c("0","15","30","60","120","180"))
的行名和冒号RangedSummarizedExperiment经确认与基因注释及表型数据表相符。
load("GSE56761_count_data.Rdata") stopifnot(all.equal(rownames(reads.GSE56761), as.character(gene.annotations$pombase_id)) colnames(reads.GSE56761) <- tolower(colnames(reads.GSE56761)) stopifnot(all.equal(colnames(reads.GSE56761), pdataclean$id) colnames(reads.GSE56761) <- rownames(pdataclean) library(" summarize实验")coldata <- DataFrame(pdataclean)
利用基因注释表构建农庄对象。
基因<-基因。注释rowranges <- GRanges(seqnames=基因$染色体,ranges=IRanges(基因$start,基因$end), strand=基因$strand,基因[,6:7])mcols(rowranges)$symbol <- as.character(mcols(rowranges)$symbol) names(rowranges) <-基因$pombase_id
日志含义Pubmed ID生成MIAME目的描述实验。
library(" annotation ") metadata <- pmid2MIAME("24853205") metadata@url <- "http://www.ncbi.nlm.nih.gov/pubmed/24853205"
最后将各组成部分组合成一个RangedSummarizedExperiment并保存为RData文件。
裂变<- summarize实验(SimpleList(counts=reads.GSE56761), rowRanges= rowRanges, colData= colData, metadata=list(元数据))save(裂变,file="裂变. rdata ")