TSRchitect介绍

r·泰勒Raborn

2020-10-28

r·泰勒Raborn和Volker Brendel页

生物学系,印第安纳大学

2018年7月10日;2019年4月7日更新;2019年9月17日。

TSRchitect R包分析不同类型的高通量转录起始站点(TSS)分析数据集。TSRchitect处理TSS分析实验,可以包含单头或paired-end序列读取,如笼,横冲直撞,泥炭、STRIPE-seq等。TSRchitect是一个开源生物信息学计划旨在支持大规模、可再生的TSS分析数据在一个广泛的分析真核系统模型。

在我们开始之前,我们必须首先加载TSRchitect在我们的工作环境。

TSRchitect用户的指导是可用的;它通过几个证据充分TSRchitect使用不同的数据集的例子。

打开TSRchitect用户指南在您的机器上,输入以下:

开始

现在您已经加载TSRchitect,我们可以进行一个小示例。

首先,我们将创建一个tssObject使用loadTSSobj和导入我们的示例(在本文件extdata /)。在这样做,我们提供样品名称和识别我们的复制名称使用的论点sampleNames。我们用以下方式:

extdata。dir < -执行(“extdata / bamFiles”,包=“TSRchitect”)tssObjectExample < -loadTSSobj(experimentTitle =“小插图榜样”,inputDir =之类extdata.dir,n.cores =1,isPairedBAM =真正的,sampleNames =c(“sample1-rep1”,“sample1-rep2”,“sample2-rep1”,“sample2-rep2”),replicateIDs =c(1,1,2,2))#数据集1 - 2和3 - 4是复制
# #……loadTSSobj……
# # # #进口paired-end读(读)……
# # # #开始导入4 bam文件…
# # # #进口paired-end读取(去年读)…
# #。从4 bam对齐数据文件已经附加到tssObject。
# # - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -
# # # #名称和复制id被成功添加到tssObject。
# # - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -
# #。

请注意,TSRchitect允许输入也从bed-formatted文件。你可以用以下等价物:替换上面的线

extdata。dir < -执行("extdata/bedFiles", package="TSRchitect") tssObjectExample <- loadTSSobj(experimentTitle="Vignette Example", inputDir=extdata.dir, n.cores=1, isPairedBED=TRUE, sampleNames=c("sample1-rep1", "sample1-rep2","sample2-rep1", "sample2-rep2"), replicateIDs=c(1,1,2,2)) #datasets 1-2 and 3-4 are replicates

为了方便起见,loadTSSobj()也可能与论点sampleSheet =“ssfile”,ssfile要么是一样的文本文件或EXCEL电子表格(扩展xls或.xlsx)。在这两种情况下,第一行必须有标题ReplicateID文件示例和上述相同的信息在相应的列。如果有必要,你可以提供输入loadTSSobj ()组成本和轮回的文件,但请注意,将数据加载到tssObject总是添加本文件之前请全部文件和TSS集将相应的内部编号。

如果我们希望看到我们的新tssObject,我们只需输入它的名字在控制台上,点击返回,如下:

tssObjectExample

现在本文件导入,我们需要从BAM检索TSS记录和计算给定TSS丰富的每个标记。我们不选择并行运行这些并指定的设置n。cores = 1

tssObjectExample < -inputToTSS(experimentName =tssObjectExample)
# #……inputToTSS……
# # # # TSS开始输入数据转换……
# #检索数据从bam文件# 1…
# #从bam获取数据文件# 2…
# 3 # #从bam获取数据文件…
# 4 # #从bam获取数据文件…
# #。TSS 4单独的bam数据文件已经成功添加到tssObject # #。
# # - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -
# #。
tssObjectExample < -processTSS(experimentName =tssObjectExample,n.cores =1,tssSet =“所有”,writeTable =)
# #……processTSS……
# # # #……TSS表达式矩阵数据集1已成功添加到tssObject # #。
# # - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -
# # # #……TSS表达矩阵数据集2已成功添加到tssObject # #。
# # - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -
# # # #……TSS表达矩阵数据集3已成功添加到tssObject # #。
# # - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -
# # # #……TSS表达矩阵数据集4已成功添加到tssObject # #。
# # - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - # # # # - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -
# #。

现在,这是完成我们可以我们从tss tsr的进行鉴别。我们每一次我们进口的4个数据集通过指定tssSet =“所有”。

tssObjectExample < -determineTSR(experimentName =tssObjectExample,n.cores =1,tssSetType =“复制”,tssSet =“所有”,tagCountThreshold =25,clustDist =20.,writeTable =)
# #……determineTSR……
# #……detTSR……
# # - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -
# #。
# #……detTSR……
# # - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -
# #。
# #……detTSR……
# # - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -
# #。
# #……detTSR……
# # - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -
# #。
# # - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -
# #。

接下来我们合并复制数据(根据我们提供的信息loadTSSobj)和合并后的样品确定临时避难所。然后,我们使用addTagCountsToTSR量化的数字标签中找到每个4数据集。

tssObjectExample < -mergeSampleData(experimentName =tssObjectExample,n.cores =1,tagCountThreshold =1)
# #……mergeSampleData……
# # # #……TSS表达数据合并# #并添加到tssObject对象。
# # - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -
# #。
tssObjectExample < -determineTSR(experimentName =tssObjectExample,n.cores =1,tssSetType =“合并”,tssSet =“所有”,tagCountThreshold =25,clustDist =20.,writeTable =)
# #……determineTSR……
# #……detTSR……
# # - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -
# #。
# #……detTSR……
# # - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -
# #。
# #……detTSR……
# # - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -
# #。
# # - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -
# #。
tssObjectExample < -addTagCountsToTSR(experimentName =tssObjectExample,tsrSetType =“合并”,tsrSet =1,tagCountThreshold =25,writeTable =)
# #……addTagCountsToTSR……
# # # #合并后的TSR TSS数据集1集将TSRsetMerged-1写入文件。txt # #在您的工作目录。
# # - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -
# #。

既然我们已经确定了临时避难所determineTSR从所有的复制和合并数据集,我们可以选择单独的直接结果。为此,我们使用getTSRdata,一个tssObject访问器方法。

sample_1_1_tsrs < -getTSRdata(experimentName =tssObjectExample,slotType =“复制”,槽=1)打印(sample_1_1_tsrs)
# # seq开始结束链nTSSs nTAGs tsrPeak tsrWdth tsrTrq tsrSI # # 2 chr22 11974144 1.00 11974144 - 1 44 1 0.00 - 2.00 # # 3 chr22 11974187 141 - 3 11974199 0.47 1.32 - 0.48 # 13 # tsrMSI # # 1.00 # # 3至0.04点

我们可以看到两种截然不同的tsr从这个小示例数据集被确定。

最后,我们导入一个注释文件(包含Gencode注释记录),然后assocate这个注释与我们小组确定临时避难所。

gff3data。dir < -执行(“extdata”,包=“TSRchitect”)tssObjectExample < -importAnnotationExternal(experimentName =tssObjectExample,文件类型=“gff3”,annotFile =粘贴(gff3data.dir“gencode.v19.chr22.transcript.gff3”,9月=“/”))
# #……importAnnotationExternal……
# #。已经连着tssObject注释数据。
# # - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -
# #。
tssObjectExample < -addAnnotationToTSR(experimentName =tssObjectExample,tsrSetType =“合并”,tsrSet =1,upstreamDist =2000年,downstreamDist =500年,特点=“记录”,featureColumnID =“ID”,writeTable =)
# #……addAnnotationToTSR……
# # # #合并后的TSR TSS数据集1集将TSRsetMerged-1写入文件。txt # #在您的工作目录。
# #。GeneIDs一直与相邻的临时避难所。
# # - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -
# #。

在我们结束之前,我们选择保存tssObject .RData文件稍后返回:

保存(tssObjectExample文件=“tssObjectExample.RData”)

这结束了我们的小插图。请参见TSRchitect用户指南更广泛记录的例子。