感兴趣

阿里Oghabian

2022-11-07

本文件涉及下列主题:

利息简介

利息,即。内含子外显子保留估计器(Oghabianet al。(2018)),便于估计和比较多个样本的转录本拼接效率。特别是,它可以估计整个转录本的内含子保留水平或外显子-外显子连接水平。类似于Niemelä所使用的内含子保留分析et al。(2014),我们的方法通过计算已映射到基因内含子-外显子连接的RNAseq读的数量来估计内含子映射的读水平,此外,它还可以通过计算已映射到外显子的读或通过计算横跨内含子的读来估计外显子-外显子的连接水平。也可以将分析限制为仅映射到内含子-外显子或外显子-外显子连接的读取,并过滤完全映射到内含子/外显子的读取(参见junctionReadsOnly参数中的兴趣()而且interest.sequential ()功能)。然而,默认情况下,这种限制是不考虑的,即。也考虑了完全映射到内含子或外显子的读取。该包接受标准BAM文件作为输入,并生成以制表符分隔的文本文件SummarizedExperiment对象作为结果。为了提高性能和运行时间,每个BAM文件的处理可以划分为更小的进程,并分布在多个计算核心上运行。使用IntEREst函数还可以绘制和统计分析结果,以筛选内含子保留水平的分布,并比较U12型内含子和U2型内含子的保留水平。请注意,虽然我们主要使用这个包来比较12型内含子与U2型内含子的保留情况,但也可以对内含子的其他子类(由用户定义)进行比较u12NbIndex ()u12Index ()u12Boxplot ()u12BoxplotNb ()u12DensityPlot ()而且u12DensityPlotIntron ()在IntEREst中专门用于u12型内含子。图中显示了运行管道的示意图图1


**图1:IntEREst运行管道图"width=

图1:兴趣运行管道图


创建参考

第一步是建立一个参考,它将用于序列读取的摘要,以及下游分析(例如显著差异IR分析)。这可以由referencePrepare ()函数。所得到的参考数据帧包括基因内含子和外显子的坐标;它们可以从各种来源提取,例如UCSC, biomaRt或用户定义的文件(例如GFF3/GTF)。具有重叠基因组坐标的外显子可以折叠(如果collapseExons参数设置为真正的)以避免将任何被跳过的外显子映射到它们重叠的内含子上的读取。中显示了该过程的一个示例图2
**图2:**运行参考异构体a, b, c和d会导致基因a的外显子是所有异构体外显子崩溃的结果。"width=

图2:运行参考异构体a, b, c和d会导致带有外显子的基因a,这是所有异构体外显子崩溃的结果。


在这里,我们从手动构建的GFF3文件中构建了一个参考数据帧,其中包括基因RHBDD3的外显子坐标。

#安静地加载库suppressMessages(图书馆“利益”))#选择RHBDD3基因相关行“gene_name”]= =“RHBDD3”,)#提取外显子“int_ex”]= =“外显子”,)#构建GFF3文件cbind(tmpEx [,3.),“。”c(745)),“。”tmpEx (,6),“。”粘贴“ID =外显子”11),”;父母= ENST00000413811”9月="") )c(tmpEx [13.),“。”“信使rna”as.numeric最小值(tmpEx [,4))),as.numeric(马克斯(tmpEx [,5))),“。”, tmpEx [16),“。”“ID = ENST00000413811”)file.pathtempdir(),“tmpFolder”dir.create(outDir)normalizePath(outDir)粘贴(outDir“gffFile.gff”9月=“/”猫(“# # gff-version 3\ n文件=gff3File,附加=猫(粘贴粘贴(trDat崩溃=\ t),\ n9月=""),文件=gff3File,附加=真正的write.table(gff3File exonDatrow.names =col.names =9月=\ t报价=附加=真正的从“U12”数据中提取U12内含子信息$int_ex= =“基因内区”u12int_type= =“U12”,)#建筑参考#因为它仅基于一个基因(不具有替代剪接功能)如果将collapseExons设置为TRUE或FALSE,则没有区别referencePreparesourceBuild =“文件”filePath =gff3File,u12IntronsChr =u12Int (,“装备”),u12IntronsBeg =u12Int (,“开始”),u12IntronsEnd =u12Int (,“结束”),collapseExons =真正的fileFormat =“gff3”annotateGeneIds =
从文件中导入基因组特征作为GRanges对象…准备“元数据”数据帧…##创建TxDb对象…好吧
头(testRef)
# #杆开始结束链int_ex int_ex_num collapsed_transcripts_id # # 1 chr22 29655841 29656226 -外显子1 1 # # 2 chr22 29656227 29656314 - 2基因内区1 # # 3 chr22 29656315 29656602 -外显子3 1 # # 4 chr22 29656603 29656690 - 4基因内区1 # # 5 chr22 29656691 29656853 -外显子5 1 # # 6 chr22 29656854 29659823 - 6基因内区1 # # collapsed_transcripts int_type # # 1 ENST00000413811 < NA > # # 2 ENST00000413811 U2 # # 3 ENST00000413811 < NA > # # 4 ENST00000413811 U2 # # 5 ENST00000413811 < NA > # # 6 ENST00000413811 U2


注释U12型内含子

属性在引用中注释U12类型内含子是可能的annotateU12函数。U12型内含子(也称为小型内含子)是由U12剪接机制检测和剪接的,而大多数内含子(称为主型或U2型)是由U2剪接体剪接的。与U2型内含子的剪接位点不同,U2型内含子还具有进化保守剪接位点,因此可以通过将位置加权矩阵(PWM)映射到它们的剪接位点,并根据PWM测量它们的匹配分数来检测它们。下面的脚本重新标注了基因RHBDD2和YBX2的内含子。

#导入基因组::BSgenome.Hsapiens.UCSC.hg19行子集的索引u12gene_name%, %c“RHBDD2”“YBX2”用强U12供体位点、分支点标注U12内含子#和acceptor站点从包中的u12数据annotateU12pwmU12U2 =列表(pwmU12db [[1]] (,1117), pwmU12db [[2]],3.]] (,3840), pwmU12db [[4]] (,1117),5]] (,3840]),pwmSsIndex =列表indexDonU12 =1indexBpU12 =1indexAccU12 =3.indexDonU2 =1indexAccU2 =3.),referenceChr =u12(印第安纳州,“装备”),referenceBegin =u12(印第安纳州,“开始”),referenceEnd =u12(印第安纳州,“结束”),referenceIntronExon =u12(印第安纳州,“int_ex”),intronExon =“基因内区”matchWindowRelativeUpstreamPos =cNA-29NANANA),matchWindowRelativeDownstreamPos =cNA-9NANANA),minMatchScore =c代表粘贴80“%”9月=""),2),“40%”粘贴(80“%”9月=""),“40%”),refGenome =BSgenome.Hsapiens.UCSC.hg19,setNaAs =“U2”annotateU12Subtype =真正的
10 . ## ## u12 u2 ## 2
有多少U12和U2型内含子具有强的U12供体位点,是否有#受体位点(和u12型的分支点)?表格(annoU12 [,1])
10 . ## ## u12 u2 ## 2


内含子保留,内含子跨越和外显子-外显子结水平估计

原始计数和归一化内含子保留、内含子跨度和外显子-外显子连接水平可以使用RNAseq读摘要函数中的任何一个来估计,兴趣()而且interest.sequential ().的兴趣()函数更加健壮,因为它将.bam文件中的读取分布到多个计算核心上,并同时分析分布的数据。请注意,基因组中具有重复序列元件的区域可能会对所读序列的映射和保留分析产生偏差。如果希望从分析中排除这些区域,可以使用getRepeatTable ()我们没有发现重复的DNA元素,因此我们不经常使用这个函数。例如,如果您希望排除包含Alu元件的基因组中的坐标,则可以使用repeatsTableToFilter= getRepeatTable(repFamilyFil= "Alu")参数设置。此外,只考虑映射到内含子-外显子或外显子-外显子连接集的读取junctionReadsOnly = TRUE,但我们建议设置junctionReadsOnly =误当测量内含子保留水平(即。方法= IntRet)及设定junctionReadsOnly = TRUE当测量外显子-外显子结水平时。的参数junctionReadsOnly不适用于内含子跨越级别估计模式(即。方法= IntSpan ')。

兴趣()而且interest.sequential ()读摘要函数写输出文本文件,另外它们可以返回一个summarizedExperiment对象为他们分析的每个样本。正如下面的测试脚本所示,我们通常阻止单独的运行返回任何对象(通过设置returnObj = FALSE);相反,在对所有样本运行分析后,我们生成一个单一样本summarizedExperiment对象,该对象包括所有分析样本的结果。从输出文本文件构建这样的对象readInterestResults ()函数可以使用。在下面的脚本中,使用了来自一个突变ZRSR2的MDS样本的bam文件,其中仅包括映射到RHBDD3基因的所有读取。我们进行了3次分析,结果是映射到RHBDD3基因内含子的读取数、横跨RHBDD3基因内含子的读取数以及映射到RHBDD3基因外显子的连接读取数。最后一个SummarizedExperiment对象,其中包括读取计数以及内含子和外显子的坐标和注释。可以在多个.bam文件上运行相同的分析以获得SummarizedExperiment对象,其中包括所有已分析的.bam文件的结果。

#创建临时目录来存储结果file.pathtempdir(),“interestFolder”dir.create(outDir)normalizePath(outDir)#加载合适的bam文件执行“extdata”“small_test_SRR1691637_ZRSR2Mut_RHBDD3.bam”包=“利益”mustWork =真正的#选择RHBDD3基因的参考基因“gene_name”]= =“RHBDD3”,)内含子保留分析#读取映射到内部内含子被考虑,因此# junctionReadsOnly为FALSE感兴趣bamFileYieldSize =10000junctionReadsOnly =bamFile =bamF会长,isPaired =真正的isPairedDuplicate =isSingleReadDuplicate =NA参考=裁判,referenceGeneNames =裁判(,“ens_gene_id”),referenceIntronExon =裁判(,“int_ex”),repeatsTableToFilter =c(),输出文件=粘贴(outDir“intRetRes.tsv”,9月=“/”),日志文件=粘贴(outDir“log.txt”,9月=“/”),方法=“IntRet”clusterNo =1returnObj =scaleLength =真正的scaleFragment =真正的
    
readInterestResultsresultFiles =粘贴(outDir“intRetRes.tsv”,9月=“/”),sampleNames =“small_test_SRR1691637_ZRSR2Mut_RHBDD3”sampleAnnotation =data.frame类型=“ZRSR2mut”test_ctrl =“测试”),commonColumns =1ncol(ref),freqCol =ncol(ref)+1scaledRetentionCol =ncol(ref)+2scaleLength =真正的scaleFragment =真正的重新调节=真正的geneIdCol =“ens_gene_id”
## ##读取文件1 / 1:/tmp/RtmpfBYzup/interestFolder/intRetRes.tsv
## ##读取文件1 / 1:/tmp/RtmpfBYzup/interestFolder/intSpanRes.tsv
## ##读取文件1 / 1:/tmp/RtmpfBYzup/interestFolder/exExRes.tsv
# # # # small_test_SRR1691637_ZRSR2Mut_RHBDD3[1] 0 # # 11 # #[2][3] 0 # # 11 # #[4][5] 0 # # 180年[6]
# # # # small_test_SRR1691637_ZRSR2Mut_RHBDD3 [1] 0 # # 39 # # [2] [3] 0 25 # # # # [4] [5] 0 # # 5 [6]
# # small_test_SRR1691637_ZRSR2Mut_RHBDD3 # # 39 # # [1] [2] 0 # # [3] 64 # # [4] 0 # # 23 # # [5] [6] 0


利用测试数据mdsChr22Obj

作为一个演示,我们在16个.bam文件上运行了IntEREst管道,每个文件都包含映射到22号染色体上的U12基因(即至少有一个U12型内含子的基因)的reads。这些bam文件是Madan等人发表的骨髓样本RNAseq数据映射的结果。(2015)人类基因组(hg19)。研究样本从16个个体中提取;其中8例诊断为骨髓增生异常综合征(MDS),具有ZRSR2突变,4例诊断为MDS,但缺乏突变(称为ZRSR2野生型MDS样本),4例为健康个体。

这些数据可以通过GEO访问,登录号为GSE63816,我们运行这些脚本来映射RNAseq数据、修改bam文件、提取映射到chr22中U12基因的读数据并构建mdsChr22ObjmdsChr22ExObj而且mdsChr22RefIntRetSpObj对象在脚本的文件夹感兴趣包(请参阅固定在文件夹中文件以获取更多信息)。你可以在R中使用这个脚本获得它的完整路径:执行(“脚本”,“固定”,包=“利益”)

mdsChr22Obj对象是summarizedExperiment对象,包括关于位于22号染色体上的U12基因内含子映射读数水平的信息,在所有16个MDS样本中。的mdsChr22ExObj对象包含外显子-外显子结映射读取的级别mdsChr22RefIntRetSpObj包括跨越内含子的读取级别。每个对象包括两个分析:计数和缩放留存。两者都可以使用同名函数访问:数量()而且scaledRetention ().前者(counts)返回一个数据帧,其中包括每个样本中每个内含子/外显子的读取计数,后者(scaledRetention)返回一个具有相似维度的数据帧,其中包括FPKM标准化读取计数。结果对象还包括可以使用的内含子/外显子和示例注释rowData ()而且colData ()功能。


# # # # SRR1691633 SRR1691634 SRR1691635 SRR1691636 SRR1691637 SRR1691638[1] 0 0 0 0 0 0 # #[2] 1 2 1 1 1 1 # #[3] 0 0 0 0 0 0 # #[4] 21 35 45 44 22 21 # #[5] 0 0 0 0 0 0 # #(6日)63 98 128 86 67 98 # # SRR1691639 SRR1691640 SRR1691641 SRR1691642 SRR1691643 SRR1691644 # #[1] 0 0 0 0 0 0 # #[2] 0 2 1 3 2 2 # #[3] 0 0 0 0 0 0 # # 89年[4]27日20 40 28 30 # # [5]0 0 0 0 0 0 # # [6]84 33 161 90 24 49 # # SRR1691645 SRR1691646 SRR1691647 SRR1691648 # # [1] 0 0 0 0 # # [2] 3 1 6 1 # # [3] 0 0 0 0## [4,] 14 14 71 14 ## [5,] 0 0 0 0 ## [6,] 35 33 112 37
## srr1691633 srr1691634 srr1691635 srr1691636 srr1691637 srr1691638 ## [1,] 0.000 0.000 0.000 0.000 0.00 0.000 ## [2,] 4675.344 9547.815 2617.253 2708.442 7832.08 3481.506 ## [3,] 0.000 0.000 0.000 0.000 0.00 0.000 0.00 0.000 ## [4,] 8125.426 13827.871 9747.011 9862.463 14259.79 6050.618 ## [5,] 0.000 0.000 0.000 0.000 0.000 0.00 0.000 0.00 0.000 ## [6,] 30339.572 48189.833 34507.300 23992.376 54051.44 35143.788 ## srr1691639 srr1691640 srr1691641 srr1691642 srr1691643 srr1691644 ## [1,] 0.000 0.00 0.000 0.00 0.00 0.00 0.00 ##[2,)0.00018404.00 3353.724 18382.35 25100.40 19113.15 ## [3,] 0.000 0.00 0.000 0.00 0.00 0.00 ## [4,] 8336.627 15230.90 24701.912 20283.98 29081.84 23726.67 ## [5,] 0.000 0.00 0.000 0.00 0.00 0.00 ## [6,] 32281.073 31278.91 55617.122 56803.84 31025.39 48234.04 ## SRR1691645 SRR1691646 SRR1691647 SRR1691648 ## [1,] 0.00 0.00 0.00 0.00 ## [2,] 37202.38 15318.63 36507.01 22353.36 ## [3,] 0.00 0.00 0.00 0.00 ## [4,] 14367.82 17748.48 35751.69 25899.07 ## [5,] 0.00 0.00 0.00 0.00 ## [6,] 44706.72 52070.18 70193.73 85192.21
# # DataFrame 6行十列# #杆开始结束链int_ex int_ex_num # # <人物> <整数> <整数> <人物> <人物> <整数> # # 1 chr22 17618410 17619247 *外显子1 # # 2 chr22 17619248 17619439 *内含子2 # # 3 chr22 17619440 17619628 *外显子3 # # 4 chr22 17619629 17619628 *基因内区4 # # 5 chr22 17621949 17622123 *外显子5 # # 6 chr22 17622124 17623987 *基因内区6 # # collapsed_transcripts_id collapsed_transcripts collapsed_gene_id intron_type # # <整数> <人物>  ## 1 21037 uc002zmi.4,uc011agh…100130717,27440 NA ## 2 21037 uc002zmi.4,uc011agh…100130717,27440 U2 ## 3 21037 uc002zmi.4,uc011agh…100130717,27440 NA ## 4 21037 uc002zmi.4,uc011agh…100130717,27440 U2 ## 5 21037 uc002zmi.4,uc011agh…100130717,27440 NA ## 6 21037 uc002zmi.4,uc011agh…100130717, 27440 U2
##数据帧与6行3列## resultFiles类型test_ctrl ## <字符> <因子> <因子> ## SRR1691633 ./SRR1691633_ZRSR2Mu..zrsr2必须测试## SRR1691634 ./SRR1691634_ZRSR2Mu..zrsr2必须测试## SRR1691635 ./SRR1691635_ZRSR2Mu..zrsr2必须测试## SRR1691636 ./SRR1691636_ZRSR2Mu..zrsr2必须测试## SRR1691637 ./SRR1691637_ZRSR2Mu..zrsr2必须测试## SRR1691638 ./SRR1691638_ZRSR2Mu..ZRSR2mut测试


这是可能的图()目的是检查内含子保留水平的分布。下面的脚本绘制了三种样本类型中所有内含子的平均保留情况:ZRSR2突变MDS、ZRSR2野生型MDS和健康的MDS。的lowerPlot = TRUE而且upperPlot = TRUE参数Settings确保网格的上三角形和下三角形都被绘制出来。


**图3:**绘制位于22号染色体的基因内含子保留水平($log_e$缩放保留)的分布。样本类型ZRSR2突变型、ZRSR2野生型和健康型的平均值。"><p class=图3:绘制用户留存水平的分布图(\ (log_e \)位于22号染色体上的基因内含子的比例保留。样本类型ZRSR2突变型、ZRSR2野生型和健康型的平均值。


下面的脚本绘制了三种样本类型中U12内含子的平均保留情况:ZRSR2突变MDS, ZRSR2 MDS野生型和健康型。默认情况下,网格的上三角形只被绘制(lowerPlot = FALSE).

**图4:**绘制位于22号染色体的基因内含子保留水平($log_e$缩放保留)的分布。样本类型ZRSR2突变型、ZRSR2野生型和健康型的平均值。"><p class=图4:绘制用户留存水平的分布图(\ (log_e \)位于22号染色体上的基因内含子的比例保留。样本类型ZRSR2突变型、ZRSR2野生型和健康型的平均值。


比较不同样品中的内含子保留水平

IntEREst还提供了各种工具来比较不同样本中内含子或外显子结水平的保留水平。最初,我们提取显著较高和较低保留的内含子使用exactTestInterest ()函数,它使用准确的()函数从刨边机包,即对两组负二项计数之间差异的精确检验。请注意,exactTestInterest ()只比较一对样本类型(例如test vs ctrl)。


## DataFrame 16行3列## resultFiles类型test_ctrl ## <字符> <因子> <因子> ## SRR1691633 ./SRR1691633_ZRSR2Mu..zrsr2必须测试## SRR1691634 ./SRR1691634_ZRSR2Mu..zrsr2必须测试## SRR1691635 ./SRR1691635_ZRSR2Mu..zrsr2必须测试## SRR1691636 ./SRR1691636_ZRSR2Mu..zrsr2必须测试## SRR1691637 ./SRR1691637_ZRSR2Mu..ZRSR2mut测试## ... ... ... ...## SRR1691644 ./SRR1691644_WT/inte..SRR1691645 ./SRR1691645_Normal/..健康ctrl ## SRR1691646 ./SRR1691646_Normal/..健康ctrl ## SRR1691647 ./SRR1691647_Normal/.. HEALTHY ctrl ## SRR1691648 ./SRR1691648_Normal/.. HEALTHY ctrl
## [1]
## [1] 50
## [1] 1.827676


如之前的分析所示,在ZRSR2突变的样本中,约50%的u12型内含子(Chr22上的基因)被显著保留(即稳定),而同样的比较表明,只有约1%的u2型内含子被显著保留。对于更复杂的实验,例如比较基于用户定义的设计矩阵的样本,从其他微分表达式分析函数刨边机包,如线性模型(GLM)函数,也在IntEREst中实现;glmInterest ()进行GLM似然比检验,qlfInterest ()进行拟似然f检验,且treatInterest ()对内含子/外显子的保留水平进行折叠变化阈值测试。基于DESeq2和DEXSeq的函数(deseqInterest ()而且DEXSeqIntEREst ())也可在套装内提供。使用QLF刨边机以下命令可用于提取所有样本类型(ZRSR2突变型、ZRSR2野生型和健康型)中保留水平显著不同的内含子/外显子的数据。

##数据帧5行5列## chr开始结束链int_ex ## <字符> <整数> <整数> <字符> <字符> ## 1 chr22 17626008 17629337 *内含子## 2 chr22 17629451 17630431 *内含子## 3 chr22 17630636 17640015 *内含子## 4 chr22 19493005 19494908 +内含子## 5 chr22 19495041 19495288 +内含子

接下来,为了更好地说明所研究样本中不同类型内含子保留水平的差异,我们首先使用bopxplot ()方法来说明所有u12型和u2型内含子在各种样本类型中的保留水平,然后我们使用u12BoxplotNb ()函数来比较U12内含子的保留与其上游和下游的u2型内含子。


**图5:** U12内含子与U2内含子保留水平的箱线图,对具有相似注释的样本进行汇总*即* ZRSR2突变型,ZRSR2野生型,或健康型。"><p class=图5:U12内含子与U2内含子保留水平的箱形图,对具有相似注释的样本进行汇总即。ZRSR2突变型,ZRSR2野生型,或健康型。


**图6:**所有样本中U12内含子保留水平与上游和下游U2内含子保留水平的箱线图。"><p class=图6:所有样本中U12内含子保留水平与上游和下游U2内含子保留水平的箱图。


箱形图清楚地显示了与所有U2内含子相比,u12型内含子的保留增加(图5),特别是与位于u12型内含子上游或下游的u2型内含子相比(图6).同样清楚的是,与其他研究样本相比,ZRSR2突变样本中u12型内含子保留水平的升高加剧了。为了更好地说明有u12型内含子的转录本与没有u12型内含子的转录本相比的稳定性,我们绘制了u12型内含子保留的日志折叠变化密度(ZRSR2突变vs .其他样本),并将其与随机选择的u2型内含子以及u12型内含子上游或下游的u2型内含子的日志折叠变化值进行比较。


图7:u12型内含子、随机U2型内含子和U2内含子(上/下/上下)流的对数折叠变化密度图。"><p class=图7:u12型内含子、随机U2型内含子和U2内含子(上/下/上下)流的对数折叠变化密度图。

## [1] 0
## [1] 1.008306


图7(并在图后计算),当比较ZRSR2突变样本与其他样本时,对于所有u2型内含子,最频繁的对数折叠变化(中位数)为~0,而u12型内含子的这一值明显更高(~1.01)。也可以进行统计检验,看看u12型内含子(ZRSR2突变样本与其他样本相比)的log fold-变化是否显著高于u2型内含子的log fold-变化。为此,我们使用jonckheere.test ()函数,即Jonckheere-Terpstra有序备择假设检验,从Clinfun包中。


#运行Jockheere Terpstra的趋势测试图书馆(clinfun)jonckheere.test(奥德lfcRes选择=“增加”nperm =1000
   

我们推荐的差异内含子保留分析管道

在构建测试脚本中描述的引用之后以上,我们建议跑步兴趣()(或interest.sequential ())两次:一次是指未折叠的外显子,另一次是指方法= " IntSpan "设置(其结果是插入子跨越对象)。然后是关于坍缩外显子和方法= " IntRet "参数设置。下一步,使用applyOverlap(query, subject, type="within", replaceValues=TRUE, FUN=sum)将包含折叠外显子的引用映射到包含未折叠外显子的引用,并相应地将读取计数级别相加(其结果是内含子映射对象)。Cbind这两个对象,并继续如下所示的例子,以检测显著差异保留的内含子。

## DESeqDataSet中的警告(se, design = design, ignoreRank): ## design公式中的一些变量是字符,转换为因子
## ## u12 u12 / u2 u2 ## 9 0 14
## ## u12 u12 / u2 u2 ## 50.000000 3.655352

注意这两个SummarizedExperiment上述对象(即mdsChr22Obj而且mdsChr22ExObj)是在“IntRet”和“IntSpan”模式下对外显子折叠引用运行interest()的结果。顾名思义,这两个对象仅限于含有chr22上基因的U12内含子。所描述的管道,分析了内含子映射读取相对于在研究条件下横跨内含子读取的变化,同时排除了映射到重叠研究内含子区域的外显子的读取。

参考文献

Madan, V., D. Kanojia, Li J., R.冈本,A. Sato-Otsubo, A. Kohlmann, M. Sanada,等。2015。“u12型内含子的异常剪接是ZRSR2突变骨髓增生异常综合征的标志。”Nat Commun6: 6042。

Niemelä, E. H., A. Oghabian, R. H. Staals, D. Greco, G. J. Pruijn和M. J. Frilander. 2014。“外泌体对未剪接的u12型内含子转录本的核处理的全球分析。”核酸测定。42(11): 7358-69。

奥加比安,A. D.格列柯,M. J.弗里兰德,2018。兴趣:内含子-外显子保留估计器。BMC生物信息学19(1): 130。