检查1.28.0
RNA的生命周期由三个主要步骤组成,即转录和早熟RNA的加工(\ (P \))和成熟的(\ \(米)).控制这些步骤的动力学速率定义了每个转录本的动力学(\ (k_ {1} \)分别为合成、加工和降解),它们在转录调节中的作用往往被低估。要完全理解RNA生命周期的速率对早熟和成熟RNA的影响,需要数学和/或计算机技能来解决相应的微分方程组:
\[开始\{方程}{情商:modelsystem} \ \标签左\{{数组}{l l} \ \开始点P {} = k_1 - k_2 \ \ cdot \, P \ \ \点{M} = k_2 \ \ cdot \, P - k_3 \ \ cdot \, M \结束数组{}\正确。结束\{方程}\]
这个微分方程组是由检查当经切数据和(可能)新合成的RNA可用时,估计RNA生命周期的速率。检查目的是通过对RNA动力学速率的时间行为进行建模,以评估每个基因的动力学。
的建模过程的输出进行可视化和交互检查,为了便于理解RNA动力学速率对早产儿和成熟RNA动力学的影响,我们开发了图形用户界面(GUI)。具体来说,GUI允许:
重要的是,我们开发了两个包装器函数(inspectFromBAM而且inspectFromPCR,请参阅检查更多细节的小插图),它简化了小说的生成检查数据集,并在GUI中上传。
GUI分布在检查包,并从以下命令行操作开始:
库(检查)runINSPEcTGUI ()
GUI分为4个部分(图1)。1):
在启动时,软件加载一个预定义的检查对象,其中包含10个基因,可用于探索软件功能。该对象可以被任意对象替换检查之前以“rds”格式保存的数据集(“选择检查文件”,无花果。2).基因的一部分检查对象根据它们的规则类进行划分。这是由一个字符串编码,其中字母表示被调节的RNA生命周期的步骤(' s '表示合成,' p '表示处理,' d '表示降解)。例如:“p”表示基因只受其加工速率的调节,“sd”表示基因的合成和降解速率的调节。当没有费率被确定为受管制时,相应的类别被命名为“no-reg”。一旦通过“选择类”选择了一个调控类,就可以从“选择基因”中出现的列表中选择特定的基因(图。2).实验剖面可能会被平滑,以减少与这类数据相关的噪声(图“选择输入”中的“平滑实验数据”)。2).但默认选择原始实验数据(图“选择输入”中“原始实验数据”)。2).“选择输入”中的“用户定义”模式将在章节中介绍4.
对于选定的基因,过早和成熟RNA水平的实验量化(从RNA-seq数据估计)与他们的标准偏差一起绘制(图。3.).如果已经对新生RNA进行了分析,合成速率也被认为是实验数据的一部分(因为它直接来自新生RNA分析),并以其标准偏差绘制。否则,合成速率是从总RNA-seq数据推断出来的,缺乏标准偏差。调查结果检查在合成、pre-RNA、加工、成熟RNA和降解面板中,用连续线绘制建模图(图2)。3.),并可以PDF(图像)或TSV(表格)格式下载。在绘图面板下面,可视化选项允许:
与建模相对应的最小化状态在GUI的第3部分中报告(图2)。4).特别是,与拟合优度统计量相关的p值和赤池信息准则表明了模型解释实验观测的能力。这两个指标都因模型的复杂性而受到惩罚,这意味着它们衡量的是其性能和简单性之间的权衡,并且它们可用于比较具有不同复杂性的模型。模型的复杂性取决于描述RNA生命周期动力学速率的函数形式:常数速率的复杂性为1,s型为4,脉冲为6,即它们参数的数量。在实践中,当两个模型都能很好地解释数据时,选择较简单的一个(拟合统计量的p值较低,AIC较低)。此外,拟合优度p值用于评估所考虑的模型是否充分解释实验数据(例如p<0.05)。最后,报告最小化状态,即最小化是否收敛到局部最小值。可以使用Nelder Mead方法(NM,用于从检查)或准牛顿BFGS方法(点击“优化-运行”)。
建模参数可以直接“手工”修改。事实上,对于RNA生命周期的每一个动力学速率,描述所选功能形式的参数在GUI的右侧提供(图2)。5).常数速率由一个参数描述,该参数对应于整个时间过程中的速率值。相反,可变速率可以用sigmoid函数或脉冲函数来描述。Sigmoids是s形函数,由四个参数描述:起始水平、最终水平、起始水平和最终水平之间的过渡时间以及响应的斜率。脉冲函数允许更复杂的行为,有两个额外的参数,描述时间和第二个转变的水平,可能编码钟形反应。可以为每个费率设置起始和最终级别的滑块范围(“设置最小值”和“设置最大值”),使费率级别设置具有充分的灵活性。在启动时,这些范围被设置为覆盖示例数据集的所有参数的范围。每次加载新的数据集时,范围都会相应更新。
用户可以测试与所选方案不同的调节方案检查,通过调优每个函数参数,或通过更改分配给一个或多个速率的函数形式。在后一种情况下,新的参数设置可以手工定义,或通过最小化数据误差(3.3).值得注意的是,在导数框架内,变量函数形式在运动速率之间是相同的。因此,可以将sigmoid(或脉冲)与常数组合,而不能将sigmoid(或脉冲)与常数组合。每当模型被修改时,它的图和最小化状态都会被更新。
按钮“Conf.Int.”,图面板下方。2)决定模型率的95%置信区间。该过程的运行时间根据分析框架、时间点的数量和模型的复杂性而不同。分析框架取决于的设置检查在生成加载的数据集时。一般来说,置信区间的量化在导数框架中更快,而在综合框架中更慢(在最坏的情况下,最多几分钟)。然后使用置信区间来评估每个速率的可变性,测试原假设,即速率剖面可以由常数模型拟合。测试p值被报告到相应速率的y轴标签中。模型的每一次变化都需要重新计算置信区间,因此,特别是在综合框架中,建议在模型确定时计算置信区间。
前几节解释的程序主要是指与实验数据的相互作用。尽管如此,该软件的设计也可以独立于实验来检验假设。这可以通过在“选择输入”中选择“用户定义(无输入)”来轻松实现。2).在这种模式下,既不表示行数据,也不表示平滑的实验数据,也不表示最小化状态。因此,用户可以自由地设置每个RNA动力学速率的功能形式(和相应的参数),直接评估对早熟和成熟RNA动力学的影响。在接下来的小节中,我们将报告一些案例研究,以举例说明RNA动力学速率在早熟和成熟RNA动力学定义中的作用。
动力学速率的组合决定了成熟和早熟RNA物种的丰度。具体来说,合成速率和加工速率之间的比率决定了早熟的RNA水平,合成速率和降解速率之间的比率决定了成熟的RNA水平。当没有扰动发生时,这种长期存在的状态称为稳态。(设置速率为:合成=常数{10};处理=常数{20};退化=常数{2})
因此,稳态早熟RNA水平独立于降解速率,并且(更重要但更不直观)稳态成熟RNA水平独立于加工速率。
如上所述,稳态成熟RNA水平与处理速率无关。尽管如此,加工动力学的扰动导致成熟RNA水平的短暂变化。相反,它对过早的RNA水平产生持久的影响。(设置速率为:合成=常数{10};Processing = sigmoidal{5,20,8,1};退化=常数{2})
值得注意的是,降解速率的降低降低了成熟RNA扰动的幅度。(设置退化=常数{0.5})
合成速率的调制决定了早熟和成熟rna的类似调制(与未处理的条件相比,在倍数变化方面)。(设置速率为:synthesis = sigmoidal{10,20,8,1};处理=常数{20};退化=常数{2})
值得注意的是,合成调制和早熟RNA响应之间的时间差与处理速率成反比(设置处理=常数{10})。按照同样的逻辑,早熟rna和成熟rna响应的时间差与降解率成反比(设降解=常数{0.5})。
当合成和降解速率在同一方向调节时,它们对成熟RNA水平的作用相反,只在过早RNA水平上留下转录调节的痕迹(在酵母热休克反应中观察到类似的反应)。(设置速率为:synthesis = sigmoidal{10,20,8,1};处理=常数{20};退化= s形{0.25,0.5,8,1})。相反,合成和降解的相反调控强化了成熟RNA的调控。(Set degradation = sigmoidal{0.5,0.25,8,1})
sessionInfo ()
## R版本4.2.1(2022-06-23)##平台:x86_64-pc-linux-gnu(64位)##运行在Ubuntu 20.04.5 LTS ## ##矩阵产品:默认## BLAS: /home/biocbuild/bbs-3.16-bioc/R/lib/libRblas。/home/biocbuild/bbs-3.16-bioc/R/lib/libRlapack。所以## ## locale: ## [1] LC_CTYPE=en_US。UTF-8 LC_NUMERIC= c# # [3] LC_TIME=en_GB LC_COLLATE= c# # [5] LC_MONETARY=en_US。utf - 8 LC_MESSAGES = en_US。UTF-8 ## [7] LC_PAPER=en_US。UTF-8 LC_NAME= c# # [9] LC_ADDRESS=C lc_phone = c# # [11] LC_MEASUREMENT=en_US。UTF-8 LC_IDENTIFICATION=C ## ##附加的基本包:## [1]stats4 stats graphics grDevices utils datasets methods ##[8]基础## ##其他附加包:## [8] INSPEcT_1.28.0 ## [9] BiocParallel_1.32.0 ## [10] BiocGenerics_0.44.0 ## [12] BiocStyle_2.26.0 ## ##通过命名空间加载(并且没有附加):# # # # [1] colorspace_2.0-3 rjson_0.2.21 [3] ellipsis_0.3.2 XVector_0.38.0 # # [5] bit64_4.0.5 fansi_1.0.3 # # [7] xml2_1.3.3 codetools_0.2-18 # # [9] splines_4.2.1 rootSolve_1.8.2.3 # # [11] cachem_1.0.6 geneplotter_1.76.0 # # [13] knitr_1.40 jsonlite_1.8.3 # # [15] pROC_1.18.0 Rsamtools_2.14.0 # # [17] annotate_1.76.0 dbplyr_2.2.1 # # [19] png_0.1-7 shiny_1.7.3 # # [21] BiocManager_1.30.19 compiler_4.2.1 # # [23] httr_1.4.4 assertthat_0.2.1 # # [25] Matrix_1.5-1 fastmap_1.1.0 # # [27] cli_3.4.1 later_1.3.0## [29] htmltools_0.5.3 prettyunits_1.1.1 ## [31] tools_4.2.1 gtable_0.3.1 ## [33] glue_1.6.2 GenomeInfoDbData_1.2.9 ## [35] dplyr_1.0.10 rappdirs_0.3.3 ## [37] Rcpp_1.0.9 jquerylib_0.1.4 ## [39] vctrs_0.5.0 Biostrings_2.66.0 ## [41] gdata_2.18.0.1 rtracklayer_1.58.0 ## [43] xfun_0.34 stringr_1.4.1 ## [45] mime_0.12 lifecycle_1.0.3 ## [47] restfulr_0.0.15 gtools_3.9.3 ## [49] XML_3.99-0.12 zlibbioc_1.44.0 ## [51] MASS_7.3-58.1 scales_1.2.1 ## [53] hms_1.1.2 promises_1.2.0.1 ## [55] MatrixGenerics_1.10.0 parallel_4.2.1 ## [57] SummarizedExperiment_1.28.0 RColorBrewer_1.1-3 ## [59] yaml_2.3.6 curl_4.3.3 ## [61] memoise_2.0.1 ggplot2_3.3.6 ## [63] sass_0.4.2 biomaRt_2.54.0 ## [65] stringi_1.7.8 RSQLite_2.2.18 ## [67] highr_0.9 genefilter_1.80.0 ## [69] BiocIO_1.8.0 filelock_1.0.2 ## [71] rlang_1.0.6 pkgconfig_2.0.3 ## [73] matrixStats_0.62.0 bitops_1.0-7 ## [75] evaluate_0.17 lattice_0.20-45 ## [77] GenomicAlignments_1.34.0 bit_4.0.4 ## [79] tidyselect_1.2.0 deSolve_1.34 ## [81] plyr_1.8.7 magrittr_2.0.3 ## [83] bookdown_0.29 DESeq2_1.38.0 ## [85] R6_2.5.1 magick_2.7.3 ## [87] generics_0.1.3 DelayedArray_0.24.0 ## [89] DBI_1.1.3 pillar_1.8.1 ## [91] survival_3.4-0 KEGGREST_1.38.0 ## [93] RCurl_1.98-1.9 tibble_3.1.8 ## [95] plgem_1.70.0 crayon_1.5.2 ## [97] KernSmooth_2.23-20 utf8_1.2.2 ## [99] BiocFileCache_2.6.0 rmarkdown_2.17 ## [101] progress_1.2.2 locfit_1.5-9.6 ## [103] grid_4.2.1 blob_1.2.3 ## [105] digest_0.6.30 xtable_1.8-4 ## [107] httpuv_1.6.6 munsell_0.5.0 ## [109] bslib_0.4.0