内容

1背景

Crispr / Cas9是一种双组分基因组工程工具:

RNA设计指南涉及到

  1. 定义目标范围
  2. 改变他们根据Crispr / Cas9应用程序
  3. 发现20个核苷酸gRNA间距器
    • 匹配目标序列(链),紧随其后的是一个NGG”帕姆”
    • 最小脱靶(mis)匹配
    • 最大的目标效率

2Multicrispr

Multicrispr aism gRNA设计方案是:

为目标得分Doench2014或Doench2016方法可以使用(Doench2016是当前标准,看到如Haeussler et al ., 2016)。非目标分析领结(快)以及vcountPDict(精确的)可以使用。下图给出了如何使用multicrispr的概述,下面的后续部分讨论细节。

2.1安装

安装multicrispr很简单:

#从BioC install.packages (“BiocManager”) BiocManager::安装(version =“重击”)BiocManager::从gitlab:安装(“multicrispr”) # # < url -“https://gitlab.gwdg.de/loosolab/software/multicrispr.git”#遥控器::install_git (url,回购= BiocManager::存储库())

Doench et al。(2016)的python包方位目标效率预测使用他们的方法可以很容易地安装和使用网状激活:

#安装一次#网状::conda_create (azienv, python = 2.7) #网状::conda_install (“azienv”、“方位”,pip = TRUE) #网状::conda_install (‘azienv’,‘scikit-learn = = 0.17.1’, pip = TRUE) #然后激活网状::use_condaenv (“azienv”)

Bowtie-indexed基因组快速offtarget分析可以安装使用index_genome。两个基因组中使用的例子,mm10 hg38,函数从我们的数据服务器下载预构建索引,允许快速勘探(集下载= FALSE重新建立索引):

index_genome BSgenome.Mmusculus.UCSC.mm10:: BSgenome.Mmusculus.UCSC.mm10 index_genome (BSgenome.Hsapiens.UCSC.hg38:: BSgenome.Hsapiens.UCSC。hg38)

2.2定义目标

bed_to_granges(基于)床上坐标文件转换成(基于)农庄。
一个例子是加载1974转录因子的结合位点SRF:

需要(magrittr)要求(multicrispr) bedfile < -执行(“extdata / SRF。床”,包= ' multicrispr”) targets0 < - bed_to_granges (bedfile基因组=“mm10”)

genes_to_grangesgenefile_to_grangesentrez /运用基因标识符转换成农庄组织使用txdb基因模型。一个负载的例子的一个小子集1974 SRF结合位点:

entrezfile < -执行(“extdata / SRF。entrez’,包= ' multicrispr”) txdb < - TxDb.Mmusculus.UCSC.mm10.knownGene:: TxDb.Mmusculus.UCSC.mm10。knownGene无形(genefile_to_granges (entrezfile txdb,补= TRUE))

char_to_granges使用一个基于坐标向量指定农庄。
它可以使用如定义第一个SRF结合位点明确:

bsgenome < - BSgenome.Mmusculus.UCSC.mm10:: BSgenome.Mmusculus.UCSC。mm10 plot_intervals (char_to_granges (c (srf1 = chr13:119991554 - 119991569: +), bsgenome))

2.3变换

第二步,最初的目标可能需要转换。的函数up_flank上游侧翼(目标),down_flank(下游侧翼),double_flank(双侧翼)和扩展可以根据需要更新目标范围。

#旁边看不见(up_flank (targets0, -200,(1) #下侧面看不见(down_flank (targets0, 200)) #双侧面看不见(double_flank (targets0 -200, 1 + 1, + 200)) #扩展目标< -扩展(情节targets0, -22, 22日= TRUE)

2.4找到间隔器,计算非标靶,分数目标

find_spacers发现N20间距器(其次是NGG pam网站),计数的非标靶,成绩目标。它还可视化结果并返回它们作为一个农庄对象与非目标数量和目标的效率。

逆电流器< - find_spacers(目标,bsgenome补充= FALSE,不匹配= 0,subtract_targets = TRUE)

2.5返回/写

结果作为一个农庄对象返回。它们可以写入文件write_ranges
它们可以被转换为一个数据。表gr2dt,如下所示

str (gr2dt(衬垫),vec.len = 2) # #类的数据。表”和“data.frame”: 6616奥林匹克广播服务公司。15变量:# # $ seqnames:系数w / 66水平“chr1”,“chr2”. .:1 1 1 1 1…# # $开始:int 4712619 4712620 4712627 4712620 4712619…# # $结束:int 4712638 4712639 4712646 4712639 4712638…# # $宽度:int 20 20 20 20 20…w / 3 # # $链:因素水平“+”,“-”,“*”:2 2 2 2 2…# # $名称:科“SRF_MA0083.3”“SRF_MA0083.3”…# # $得分:num 10.5 - 10.5…# # $ targetname:为了“chr1:4712628 - 4712643:”“chr1:4712628 - 4712643:”……# # $ targetstart: int 4712628 4712628 4712628 4712628 4712628… ## $ targetend : int 4712643 4712643 4712643 4712643 4712643 ... ## $ crisprname : chr "chr1:4712628-4712643:-_5" "chr1:4712628-4712643:-_4" ... ## $ crisprspacer: chr "ATATAAGGGCATTGGAAGAA" "AATATAAGGGCATTGGAAGA" ... ## $ crisprpam : chr "GGG" "AGG" ... ## $ Doench2014 : num 0.16491 0.00721 ... ## $ names : chr "chr1:4712628-4712643:-_5" "chr1:4712628-4712643:-_4" ... ## - attr(*, ".internal.selfref")=

引用

Anzalone前任所长A.V.伦道夫,P.B.戴维斯分校jr et al .搜索替换基因组编辑没有DNA双链断裂或捐赠。大自然576年,149 - 157 (2019)。https://doi.org/10.1038/s41586 - 019 - 1711 - 4

Doench詹,Hartenian E,格雷厄姆•DB Tothova Z,对冲基金,史密斯,我Sullender M,艾伯特提单,泽维尔RJ,根德,设计合理的高活性sgRNAs CRISPR-Cas9-mediated基因失活生物科技Nat》2014年1262 - 1267。

Doench詹、副食N, Sullender M,对冲基金,Vaimberg电子战,多诺万KF,史密斯,我Tothova Z, Wilen C,果园R,优化sgRNA设计活动,最大限度地减少非目标效应生物科技CRISPR-Cas9 Nat》2016 184 - 191

Haeussler M, Schonig K,埃克特H, Eschstruth, Mianne J, Renaud jb, Schneider-Maunoury年代,Shkumatava, Teboul L,肯特J,非目标和目标,评价评分算法和融入指南选择工具CRISPOR RNA基因组医学杂志2016年148年