裂殖酵母时间进程

这里我们提供的代码用于contructRangedSummarizedExperiment对象的裂变实验数据方案。提供的计算矩阵的第一作者发表:

梁HS,道森K, Wirth C,李Y, Connolly Y,史密斯DL,威尔金森CR,米勒CJ。全球非编码RNA系统调节裂殖酵母蛋白质含量对压力的反应Nat Commun2014年5月23日,5:3947。PMID:24853205。地理:GSE56761

以下是引用从地理系列:

“全球转录的裂殖酵母野生型(WT)和atf21del菌株在一个渗透压力时间治疗1 m山梨糖醇(0),15岁,30岁,60岁,120和180分钟。Strand-specific单端测序的总RNA进行生物一式三份的应用生物系统公司固体5500 xl基因分析仪系统”。

“测序读对齐裂殖酵母基因组(PomBase数据库发布11)用SHRiMP2对准器默认参数。的读取总数可以对齐到基因组每样一个轨迹范围从7.5到20.1。这些独特的映射读取被用来确定明确的转录延伸。读取,对齐多个轨迹(通常paralogous地区基因组)被丢弃。相邻的明确的转录区域最小两个峰高和位于50基地的彼此相互融合,产生一个广泛的转录美国非洲酒的地图。这些区域被定位相对于已知的注释和标记基因(s)他们重叠使用annmap Bioconductor包。”

对象构造

下面的代码是用于读取从GEO表型数据。

库(GEOquery) gse < - getGEO(文件名=“GSE56761_series_matrix.txt”) pdata < - pdata (gse) [, grepl(“特点”,名称(pdata (gse))))

data.frame被更换清洗长与短的字符串,并将分变量与正确命令一个因素的水平。

名(pdata) < - c(“应变”,“治疗”,“时间”,“复制”)pdataclean < - data.frame(应变= ifelse (grepl(“野生型”,pdata应变美元),“wt”,“狗”),每分钟=子(“时间\ \ (min \ \): (. *)”,“\ \ 1”, pdata美元),复制= paste0 (“r”,子(“复制:(. *)”,“\ \ 1”,pdata复制美元)),row.names = rownames (pdata)) pdataclean $ id < -粘贴(pdataclean应变美元,pdataclean分钟,美元pdataclean复制美元,9 =“_”)pdataclean应变< - relevel美元(美元pdataclean应变,wt) pdataclean分钟< -美元因素(pdataclean分钟,美元水平= c (“0”,“15”,“30”,“60”,“120”,“180”))

rownames colnames的RangedSummarizedExperiment被证实与基因注释和表型数据表。

负载(GSE56761_count_data.Rdata) stopifnot (all.equal (rownames (reads.GSE56761) as.character (gene.annotations pombase_id美元)))colnames (reads.GSE56761) < -低(colnames (reads.GSE56761)) stopifnot (all.equal (colnames (reads.GSE56761) pdataclean $ id)) colnames (reads.GSE56761) < - rownames (pdataclean)图书馆(“SummarizedExperiment”) coldata < DataFrame (pdataclean)

表被用来构造一个基因注释农庄对象。

< -基因的基因。注释rowranges < -农庄(seqnames =基因染色体,美元范围= IRanges(基因开始,美元美元结束),链=基因链美元,基因[者])mcols (rowranges)美元符号< - as.character (mcols (rowranges) $符号)的名字(rowranges) < -基因pombase_id美元

Pubmed ID被用来生成一个MIAME描述了实验对象。

图书馆(“注释”)元数据< pmid2MIAME (“24853205”) metadata < -“http://www.ncbi.nlm.nih.gov/pubmed/24853205”

最后结合作为一个组成部分RangedSummarizedExperiment并保存为一个RData文件。

裂变< - SummarizedExperiment (SimpleList(数量= reads.GSE56761), rowRanges = rowRanges colData = colData,元数据=列表(元数据)保存(裂变、文件=“fission.RData”)