1背景介绍

基因表达受转录因子(TF)与基因组DNA结合的调控。然而,许多结合位点位于远端调控区,如增强子,与基因相距数百个碱基。这些调控区域可以通过染色质环相互作用与调控基因的启动子发生物理上的相互作用。这些环相互作用可以通过染色质构象捕获技术(如Hi-C或ChIA-PET)在全基因组范围内测量(Rao et al. 2014;Tang et al. 2015).尽管对基因组的三维组织有许多令人兴奋的见解,但这些实验方法不仅复杂和广泛,而且分辨率有限,只能用于有限数量的细胞类型和条件。相比之下,tf的结合位点可以通过ChIP-seq实验以高分辨率检测到全基因组,并且在许多细胞类型和条件下可用于数百个tf。然而,经典的ChIP-seq分析只给出了目标tf的直接结合位点(ChIP-seq峰),将它们与没有染色质环信息的调控基因关联起来并非易事。因此,我们提供了一种仅从基因组序列特征和ChIP-seq数据预测染色质相互作用的计算方法。预测的环路相互作用可用于将TF结合位点(ChIP-seq峰)或增强子与调控基因相关联,从而提高基因水平的功能下游分析。

在这个小插图中,我们将展示如何使用R包sevenC通过仅使用来自单一实验的ChIP-seq数据来预测CTCF基序之间的染色质环相互作用。此外,我们还展示了如何使用自定义数据训练预测模型。

有关sevenC方法的更详细解释以及预测性能分析可在相关的预印本中获得(Ibn-Salem and Andrade-Navarro 2018)

2安装

安装sevenC包,开始R,输入:

# BiocManager::install("sevenC")

3.预测染色质环相互作用

3.1基本用法示例

在这里,我们将展示如何使用sevenC使用默认选项来预测人类22号染色体上CTCF基序位置之间的染色质循环相互作用。作为输入,我们只使用CTCF基序位置和一个来自人类GM12878细胞STAT1 ChIP-seq实验的bigWig文件(Dunham et al. 2012)

3.1.1获取母题对

在人类基因组motifs <- motif.hg19.CTCF. library(sevenC) # load中提供了CTCF基序。get motifs pairs gi <- preparerecispairs (motifs)

3.1.2添加ChIP-seq数据并计算相关性

bigWig file bigWigFile <- system. txt文件(“extdata”、“gm12878_stat1.chr22_1 - 30000000。bigWig", package = "sevenC")# add ChIP-seq coverage and compute correaltion at motif pairs gi <- addCor(gi, bigWigFile)

3.1.3预测循环

#预测所有motif对之间的循环交互

3.2更详细的使用示例

在这里,我们更详细地展示了循环预测过程的每个步骤。同样,我们希望在人类GM12878细胞中使用STAT1的ChIP-seq预测22号染色体上CTCF基序位置之间的染色质环相互作用。

3.2.1之上准备CTCF motif对

首先,我们需要准备CTCF基序对作为染色质环相互作用的候选锚点。我们利用人类22号染色体上的CTCF基序命中sevenC包中。一般来说,任何CTCF图案都可以使用,如果提供农庄.为了使用motif相似度分数作为预测特征,motif数据应该包含-log10转换的p值描述每个主题的重要性。在这里,我们使用从JASPAR基因组浏览器跟踪提供的CTCF基序位点(Khan et al. 2018).的objedtmotif.hg19.CTCF.chr22r BiocStyle:: Biocpkg(“sevenC”)在22号染色体上包含CTCF基序位置。有关主题数据集的更多信息,请参见motif.hg19.CTCF ?

library(sevenC) #加载提供的CTCF motifs motifs <- motifs .hg19.CTCF.chr22

CTCF motif表示为农庄对象的r BiocStyle:: Biocpkg(“GenomicRanges”)包中。22号染色体上有917个CTCF基序。基因组组装为hg19。一个名为分数显示主题匹配相似度为-log10假定值转换。

3.2.2在motif位点添加ChIP-seq信号

为了预测循环,我们需要所有基序位点的ChIP-seq信号。因此,我们读取了一个带有ChIP-seq信号的bigWig文件示例。

的一部分提供了一个仅包含22号染色体子集数据的示例文件sevenC包中。完整的文件可以从ENCODE下载(Dunham et al. 2012)在这里.该文件包含了基因组中每个位置ChIP-seq信号与输入控制的对数倍变化。

bigWig file bigWigFile <- system. txt文件(“extdata”、“gm12878_stat1.chr22_1 - 30000000。bigWig", package = "sevenC")

我们使用该函数将ChIP-seq信号添加到1000 bp窗口中的所有motif中addCovToGR ()如下。

# read ChIP-seq coverage motifs <- addCovToGR(motifs, bigWigFile)

添加一个新的元数据列图案举行一次NumericList带有ChIP-seq信号的每个motif位置。

图案美元芯片
##长度为917的数字列表## [["chr22"]] 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0…1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 ## [["chr22"]] 1 1 1 1 1 1 0 0 0 0 0 0 0 0 0 0 0 0 0…1 1 22 22 22 22 22 2 ## [["chr22"]] 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0…0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 ## [["chr22"]] 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0…1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 ## [["chr22"]] 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0…0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 ## [["chr22"]] 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0…0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 ## [["chr22"]] 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0…0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 ## [["chr22"]] 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0…0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 ## [["chr22"]] 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0…0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 # #[[“chr22”]]1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1… 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 ## ... ## <907 more elements>

请注意,在Windows系统上,目前不支持读取bigWig文件。看到帮助(rtracklayer:: import.bw)获取更多信息。Windows上的用户需要在motif位点周围获得ChIP-seq信号NumierList对象。一个NumericListl与芯片信号计数周围的每个主题列表可以添加Motifs $chip <- l

3.2.3构建成对的主题作为候选交互

现在,我们构建了一个包含1mb内所有CTCF motif对的数据集,并标注了距离、motif方向和motif评分。

gi <- prepareispairs (motifs, maxDist = 10^6
与26076年# # StrictGInteractions对象交互和5元数据列:# # seqnames1 ranges1 seqnames2 ranges2 | # # < Rle > < IRanges > < Rle > < IRanges > | # # [1] chr22 16186188 - 16186206——chr22 16186206 - 16186188 | # # [2] chr22 16186188 - 16186206——chr22 16186206 - 16186188 | # # [3] chr22 16186188 - 16186206——chr22 16186206 - 16186188 | # # [4] chr22 16186188 - 16186206——chr22 16186206 - 16186188 | # # [5] chr22 16186188 - 16186206——chr22 16186206 - 16186188  | ## ... ... ... ... ... ... .# # [26072] chr22 51110780 - 51110798——chr22 51110798 - 51110780 | # # [26073] chr22 51110780 - 51110798——chr22 51110798 - 51110780 | # # [26074] chr22 51130130 - 51130148——chr22 51130148 - 51130130 | # # [26075] chr22 51130130 - 51130148——chr22 51130148 - 51130130 | # # [26076] chr22 51160028 - 51160046——chr22 51160046 - 51160028 | # # dist strandOrientation score_1 score_2 score_min # # <整数> <人物> <数字> <数字> <数字> # #[1]19119 6.05 5.72 5.72 # #[2]52360年6.05 - 5.925.92 # #[3] 53000 6.05 5.90 5.90 # #[4] 53639年6.05 5.92 5.92 # #[5]61058年6.05 5.92 5.92  ## ... ... ... ... ... ...##[26072] 49248反向6.21 5.64 5.64 ##[26074]29898反向6.33 5.64 5.64 ##[26075]41954反向6.33 5.90 5.90 ##[26076]12056反向5.64 5.90 5.64 ## ------- ##区域:917个范围和2个元数据列## seqinfo: hg19基因组的93个序列(1个循环)

这个函数prepareCisPairs ()返回一个GInteractoin对象的r BiocStyle:: Biocpkg(“InteractonSet”)包装,代表所有的主题对在规定的距离内。的元数据列GInteractoin对象保持bp (经销)、母题的朝向(strandOrientation),而主题分数为-log10的主题击中p值(score_1score_2,score_min).注意,这个函数prepareCisPairs ()是三个单独函数的包装器,分别执行每个步骤并允许更多选项。首先,getCisPairs ()用于构建GInteractoin对象。比addStrandCombination ()添加图案对的四种可能的链组合。最后,addMotifScore ()为每对添加最小母题分数。这些基因组特征后来被用作预测变量。

3.3计算motif对上的ChIP-seq相似度

现在,我们计算所有基序对的ChIP-seq信号的相似度,作为基序中心周围位置的信号的相关性。因此,对于两个基序,相应的ChIP-seq信号向量被添加到图案,均采用Pearson相关比较。两个基序上ChIP-seq信号的高相关性表明两个基序上的ChIP-seq覆盖剖面相似。反过来,这是通过染色质环的物理相互作用的特征,其中ChIP信号在与motif中心距离相似的两侧被发现(Ibn-Salem and Andrade-Navarro 2018).相关系数作为额外的元数据列添加到胃肠道

#添加ChIP-seq覆盖并计算motif对的相关性gi <- addCovCor(gi)

3.4预测循环

现在我们可以在逻辑回归模型中从ChIP-seq相关性和其他基因组特征中预测染色质环。实现了predLoops ()函数。

loops <- predLoops(gi)循环
## StrictGInteractions对象,包含607个交互和7个元数据列:# # seqnames1 ranges1 seqnames2 ranges2 | dist # # < Rle > < IRanges > < Rle > < IRanges > | <整数> # # [1]chr22 16186188 - 16186206——chr22 16186206 - 16186188 | 53000 # # [2] chr22 16205307 - 16205325——chr22 16205325 - 16205307 | 204479 # # [3] chr22 16238548 - 16238566——chr22 16238566 - 16238548 | 171238 # # [4] chr22 17398482 - 17398500——chr22 17398500 - 17398482 | 140780 # # [5] chr22 17398482 - 17398500——chr22 17398500 - 17398482 | 254368年  ## ... ... ... ... ... ... . ...# # [603] chr22 26756542 - 26756560——chr22 26756560 - 26756542 | 284880 # # [604] chr22 26763796 - 26763814——chr22 26763814 - 26763796 | 277626 # # [605] chr22 28123236 - 28123254——chr22 28123254 - 28123236 | 98092 # # [606] chr22 29225543 - 29225561——chr22 29225561 - 29225543 | 211304 # # [607] chr22 29436847 - 29436865——chr22 29436865 - 29436847 | 204851 # # strandOrientation score_1 score_2 score_min cor_chip pred # # <人物> <数字> <数字> <数字> <数字> <数字> 6.05 - 5.90 # # [1]5.90 0.885073 0.193089 ##[2]收敛5.72 5.79 5.72 0.415731 0.162644 ##[3]收敛5.92 5.79 5.79 0.675000 0.301512 ##[4]收敛6.48 6.89 6.48 0.790284 0.550519 ##[5]收敛6.48 8.49 6.48 0.221485 0.172598 ## ... ... ... ... ... ... ...##[603]反向8.27 7.93 7.93 0.349559 0.225008 ##[604]反向8.59 7.93 7.93 0.739380 0.423643 ##[606]反向6.73 6.33 6.33 0.928965 0.245978 ##[607]反向6.33 7.27 6.33 0.909619 0.242532 ## ------- ##区域:917个范围和2个元数据列## seqinfo:来自hg19基因组的93个序列(1个循环)

predLoops ()函数返回预计将相互作用的主题对的子集。交互作用用ChIP-seq相关性标注在列中cor_chip.列pred根据逻辑回归模型得出预测的交互概率。

注意,在没有指定进一步选项的情况下,函数predLoops ()通过使用来自Hi-C和ChIA-PET的实验染色质环进行验证,使用了针对多个转录因子ChIP-seq数据集优化的默认模型(Ibn-Salem and Andrade-Navarro 2018).方法指定自定义特性公式参数提供自定义参数贝塔论点。此外,每默认predLoops ()函数只报告达到最小预测分数阈值的循环交互。方法修改所报告循环的百分比截止论点。

4预测染色质环的下游分析

4.1连接区域集

预测的循环表示为GInteraction因此,可以很容易地使用函数进行下游分析r BiocStyle:: Biocpkg(“InteractonSet”)包中。例如,连接两组区域(如ChIP-seq峰值和基因)可以使用linkOverlaps函数。看到装饰图案InteractonSet包获取有关使用的详细信息和示例GInteraction对象。

4.2将预测的循环写入输出文件

因为循环交互被存储为GInteraction对象,它们可以导出为BEDPE使用函数的文件GenomicInteractions包中。这些文件可用于基因组浏览器或果汁盒工具。

library(GenomicInteractions) # export到输出文件导出。loop_interactions bedpe(循环。”, score = "pred")

5使用自定义数据的训练预测模型

在这里,我们展示如何使用sevenC建立并训练用于循环预测的逻辑回归模型。

5.1准备motif对并添加ChIP-seq数据

首先,我们需要构建成对的motif作为候选,并添加如上所示的ChIP-seq数据。

# load提供的CTCF motifs motifs <- motifs .hg19.CTCF. #ChIP-seq覆盖文件bigWigFile <- system. ch22 #使用示例文件(“extdata”、“gm12878_stat1.chr22_1 - 30000000。bigWig", package = "sevenC")# add ChIP-seq coverage motifs <- addCovToGR(motifs, bigWigFile) # build motif pairs gi <- prepareCisPairs(motifs, maxDist = 10^6) # add correaltion of ChIP-signal gi <- addCovCor(gi)

5.2已知循环的训练预测器

我们需要利用染色质相互作用的实验数据来标记真正的环相互作用。在这里,我们使用来自人类GM12878细胞高分辨率Hi-C实验的循环(Rao et al. 2014).提供了一个在染色体22上具有循环的示例文件sevenC包装和功能parseLoopsRao ()以Rao等人提供的格式读取循环,并返回一个GInteraction对象。

#解析已知循环file("extdata", "GM12878_HiCCUPS.chr22_1-30000000.loop.txt", package = "sevenC") knownLoops <- parseLoopsRao(knownLoopFile)

我们可以向主题对添加一个新的元数据列胃肠道,表示使用函数在实验数据中对是否相互作用addInteractionSupport ()

#添加已知循环gi <- addInteractionSupport(gi, knownLoops)

实验支持作为因子随水平增加“循环”而且“没有循环”作为元数据列循环.属性可以修改列名colname论点。

5.3训练逻辑回归模型

我们可以用R函数全球语言监测机构()拟合logistic回归模型,其中循环列为因变量,ChIP-seq相关性、距离和链向为预测因子。

fit <- glm(公式= loop ~ cor_chip + dist + strandOrientation, data = mcols(gi), family = binomial()))

5.4使用自定义模型预测循环

现在,我们可以使用这个模型来添加预测的循环概率。

#添加预测循环gi <- predLoops(gi, formula = loop ~ cor_chip + dist + strandOrientation, betas = coef(fit), cutoff = NULL)

在这里,我们必须使用与上面模型拟合步骤中相同的公式作为参数。的贝塔参数取逻辑回归模型的系数。最后,论证cutoff = NULL确保不进行过滤,并报告所有输入候选项。将预测分数作为新的元数据列添加到胃肠道

胃肠道
与26076年# # StrictGInteractions对象交互和8元数据列:# # seqnames1 ranges1 seqnames2 ranges2 | # # < Rle > < IRanges > < Rle > < IRanges > | # # [1] chr22 16186188 - 16186206——chr22 16186206 - 16186188 | # # [2] chr22 16186188 - 16186206——chr22 16186206 - 16186188 | # # [3] chr22 16186188 - 16186206——chr22 16186206 - 16186188 | # # [4] chr22 16186188 - 16186206——chr22 16186206 - 16186188 | # # [5] chr22 16186188 - 16186206——chr22 16186206 - 16186188  | ## ... ... ... ... ... ... .# # [26072] chr22 51110780 - 51110798——chr22 51110798 - 51110780 | # # [26073] chr22 51110780 - 51110798——chr22 51110798 - 51110780 | # # [26074] chr22 51130130 - 51130148——chr22 51130148 - 51130130 | # # [26075] chr22 51130130 - 51130148——chr22 51130148 - 51130130 | # # [26076] chr22 51160028 - 51160046——chr22 51160046 - 51160028 | # # dist strandOrientation score_1 score_2 score_min cor_chip # # <整数> <人物> <数字> <数字> <数字> <数字> # # [1]19119 6.05 5.72 5.72 0.339540 # #[2] 52360 forward 6.05 5.92 5.92 -0.104692 ## [3] 53000 forward 6.05 5.90 5.90 0.885073 ## [4] 53639 forward 6.05 5.92 5.92 -0.170961 ## [5] 61058 forward 6.05 5.92 5.92 -0.104692 ## ... ... ... ... ... ... ...##[26072] 49248反向6.21 5.64 5.64 NA ##[26074] 29898反向6.33 5.64 5.64 NA ##[26075] 41954反向6.33 5.90 5.90 NA ##[26076] 12056反向5.64 5.90 5.64 NA ##[1]无循环0.002077368 ##[2]无循环0.000422511 ##[3]无循环0.000335909 ##[5]无循环0.000414237 ## ... ... ...[26072]无环NA ##[26073]无环NA ##[26074]无环NA ##[26075]无环NA ##[26076]无环NA ## ------- ##区域:917个范围和2个元数据列## seqinfo: hg19基因组93个序列(1个循环)

作为一个非常简单的验证,我们现在可以使用箱线图比较循环和非循环motif对的预测分数。

箱线图(gi$pred ~ gi$loop, ylab =“预测的交互概率”)

该图显示,对于真正循环的母题对,预测得分更高。然而,这是一种不充分的预测性能评估,因为预测评分是在与训练数据相同的数据上进行评估的。7C论文描述了使用交叉验证和不同单元类型对预测性能进行更详细的评估(Ibn-Salem and Andrade-Navarro 2018)

5.5会话信息

sessionInfo ()
## R版本4.2.1(2022-06-23)##平台:x86_64-pc-linux-gnu(64位)##运行在Ubuntu 20.04.5 LTS ## ##矩阵产品:默认## BLAS: /home/biocbuild/bbs-3.16-bioc/R/lib/libRblas。/home/biocbuild/bbs-3.16-bioc/R/lib/libRlapack。所以## ## locale: ## [1] LC_CTYPE=en_US。UTF-8 LC_NUMERIC= c# # [3] LC_TIME=en_GB LC_COLLATE= c# # [5] LC_MONETARY=en_US。utf - 8 LC_MESSAGES = en_US。UTF-8 ## [7] LC_PAPER=en_US。UTF-8 LC_NAME= c# # [9] LC_ADDRESS=C lc_phone = c# # [11] LC_MEASUREMENT=en_US。UTF-8 LC_IDENTIFICATION=C ## ##附加的基本包:## [1]stats4 stats graphics grDevices utils datasets methods ##[8]基础## ##其他附加包:[1] genome interactions_1.32.0 sevenC_1.18.0 SummarizedExperiment_1.28.0 ## [5] Biobase_2.58.0 MatrixGenerics_1.10.0 ## [9] GenomeInfoDb_1.34.0 IRanges_2.32.0 ## [11] S4Vectors_0.36.0 BiocGenerics_0.44.0 ## [13] BiocStyle_2.26.0 ## ##通过命名空间加载(并且没有附加):[1] colorspace_2.0-3 rjson_0.2.21 deldir_1. 6 ## [4] ellipsis_0.3.2 htmlTable_2.4.1 biovizBase_1.46.0 ## [7] XVector_0.38.0 base64enc_0.1-3 dichromat_2.0-0.1 ## [10] rstudioapi_0.14 bit64_4.0.5 AnnotationDbi_1.60.0 ## [13] fansi_1.0.3 xml2_1.3.3 codetools_0.2-18 ## [19] Formula_1.2-4 jsonlite_1.8.3 Rsamtools_2.14.0 ## [22] cluster_2.1.4 dbplyr_2.2.1 png_0.1-7 ## [28] httr_1.4.4backports_1.4.1 lazyeval_0.2.2 ## [31] assertthat_1.2.1 Matrix_1.5-1 fastmap_1.1.0 ## [34] cli_3.4.1 htmltools_0.5.3 prettyunits_1.1.1 ## [37] tools_4.2.1 igraph_1.3.5 gtable_0.3.1 ## [40] glue_1.6.2 GenomeInfoDbData_1.2.9 dplyr_1.0.10 ## [43] rappdirs_0.3.3 Rcpp_1.0.9 jquerylib_0.1.4 ## [46] vctrs_0.5.0 Biostrings_2.66.0 rtracklayer_1.58.0 ## [49] xfun_0.34 string_1 .4.1 lifecycle_1.0.3 ## [52] ensembldb_2.22.0 restfulr_0.15 XML_3.99-0.12 ## [55] zlibbioc_1.44.0 scales_1.2.1 vroom_1.6.0 ## #[58] BSgenome_1.66.0 VariantAnnotation_1.44.0 ProtGenerics_1.30.0 ## [61] hms_1.1.2 parallel_1 .2.1 AnnotationFilter_1.22.0 ## [64] RColorBrewer_1.1-3 yaml_2.3.6 curl_4.3.3 ## [67] gridextra_1 . 2.3 memoise_2.0.1 ggplot2_3.3.6 ## [70] sass_0.4.2 rpart_4.1.19 biomaRt_2.54.0 ## [73] latticeExtra_0.6-30 stringi_1.7.8 RSQLite_2.2.18 ## [76] highr_0.9 BiocIO_1.8.0 checkmate_2.1.0 ##[79]基因组features_1 .50.0 filelock_1.0.2 boot_1.3-28 ## [85]bitops_1.0-7 archive_1.1.5 evaluate_0.17 ## [88] lattice_0.20-45 purrr_0.3.5 htmlwidgets_1.5.4 ## [91] GenomicAlignments_1.34.0 bit_4.0.4 tidyselect_1.2.0 ## [94] magrittr_2.0.3 bookdown_0.29 R6_2.5.1 ## [97] magick_2.7.3 generics_0.1.3 Hmisc_4.7-1 ## [100] DelayedArray_0.24.0 DBI_1.1.3 pillar_1.8.1 ## [103] foreign_0.8-83幸存者3.4-0 KEGGREST_1.38.0 ## [106] RCurl_1.98-1.9 nnet_7.3-18 tibble_1 .1.8 ## [109] crayon_1.5.2 interp_1.1-3 utf8_1.2.2 ## [112] BiocFileCache_2.6.0 tzdb_0.3.0 rmarkdown_2.17 ## [115] jpeg_0.1-9 progress_1.2.2 grid_4.2.1 ## [118] data.table_1.14.4 blob_1.2.3 digest_0.6.30 ## [121] munsell_0.5.0 Gviz_1.42.0 bslib_0.4.0

参考文献

Dunham, Ian, Anshul Kundaje, Shelley F Aldred, Patrick J Collins, Carrie a Davis, Francis Doyle, Charles B Epstein等,2012。人类基因组中DNA元素的完整百科全书。自然489(7414): 57-74。https://doi.org/10.1038/nature11247

伊本·塞勒姆,乔纳斯和米格尔·a·安德拉德·纳瓦罗。2018.CTCF基序中ChIP-seq相关的计算染色体构象捕获。bioRxiv二月,257584。https://doi.org/10.1101/257584

Khan, Aziz, Oriol Fornes, Arnaud Stigliani, Marius Gheorghe, Jaime A Castro-Mondragon, Robin van der Lee, Adrien Bessy等,2018。“JASPAR 2018:转录因子结合谱的开放获取数据库及其web框架的更新。”核酸研究46 (d1): d260-d266。https://doi.org/10.1093/nar/gkx1126

Rao, Suhas S P, Miriam H Huntley, Neva C Durand, Elena K Stamenova, Ivan D Bochkov, James T Robinson, Adrian L Sanborn,等。2014。“千碱基分辨率的人类基因组3D地图揭示了染色质循环的原理。”细胞159(7): 1665-80。https://doi.org/10.1016/j.cell.2014.11.021

唐仲辉,罗俊红,李兴旺,郑美珍,朱菊芬,Przemyslaw Szalaj, Pawel Trzaskoma,等。2015。“ctcf介导的人类3D基因组结构揭示了转录的染色质拓扑结构。”细胞, 1卷。https://doi.org/10.1016/j.cell.2015.11.024