2Multicrispr

Multicrispr aism gRNA设计方案是:

完成:定义/转换目标,发现间隔器,分析/非标靶
性能:天平向成千上万的目标(数据。表后端)
直观:函数式编程设计和直观的可视化
可互操作的:acceping和返回一个农庄

为目标得分Doench2014或Doench2016方法可以使用(Doench2016是当前标准,看到如Haeussler et al ., 2016)。非目标分析领结(快)以及vcountPDict(精确的)可以使用。下图给出了如何使用multicrispr的概述,下面的后续部分讨论细节。

2.1安装

安装multicrispr很简单:

#从BioC install.packages (“BiocManager”) BiocManager::安装(version =“重击”)BiocManager::从gitlab:安装(“multicrispr”) # # < url -“https://gitlab.gwdg.de/loosolab/software/multicrispr.git”#遥控器::install_git (url,回购= BiocManager::存储库())

Doench et al。(2016)的python包方位目标效率预测使用他们的方法可以很容易地安装和使用网状激活:

#安装一次#网状::conda_create (azienv, python = 2.7) #网状::conda_install (“azienv”、“方位”,pip = TRUE) #网状::conda_install (‘azienv’,‘scikit-learn = = 0.17.1’, pip = TRUE) #然后激活网状::use_condaenv (“azienv”)

Bowtie-indexed基因组快速offtarget分析可以安装使用index_genome。两个基因组中使用的例子,mm10 hg38,函数从我们的数据服务器下载预构建索引,允许快速勘探(集下载= FALSE重新建立索引):

index_genome BSgenome.Mmusculus.UCSC.mm10:: BSgenome.Mmusculus.UCSC.mm10 index_genome (BSgenome.Hsapiens.UCSC.hg38:: BSgenome.Hsapiens.UCSC。hg38)

2.2定义目标

bed_to_granges(基于)床上坐标文件转换成(基于)农庄。
一个例子是加载1974转录因子的结合位点SRF:

需要(magrittr)要求(multicrispr) bedfile < -执行(“extdata / SRF。床”,包= ' multicrispr”) targets0 < - bed_to_granges (bedfile基因组=“mm10”)

genes_to_granges和genefile_to_grangesentrez /运用基因标识符转换成农庄组织使用txdb基因模型。一个负载的例子的一个小子集1974 SRF结合位点:

entrezfile < -执行(“extdata / SRF。entrez’,包= ' multicrispr”) txdb < - TxDb.Mmusculus.UCSC.mm10.knownGene:: TxDb.Mmusculus.UCSC.mm10。knownGene无形(genefile_to_granges (entrezfile txdb,补= TRUE))

char_to_granges使用一个基于坐标向量指定农庄。
它可以使用如定义第一个SRF结合位点明确:

bsgenome < - BSgenome.Mmusculus.UCSC.mm10:: BSgenome.Mmusculus.UCSC。mm10 plot_intervals (char_to_granges (c (srf1 = chr13:119991554 - 119991569: +), bsgenome))

2.3变换

第二步,最初的目标可能需要转换。的函数up_flank上游侧翼(目标),down_flank(下游侧翼),double_flank(双侧翼)和扩展可以根据需要更新目标范围。

#旁边看不见(up_flank (targets0, -200,(1) #下侧面看不见(down_flank (targets0, 200)) #双侧面看不见(double_flank (targets0 -200, 1 + 1, + 200)) #扩展目标< -扩展(情节targets0, -22, 22日= TRUE)

2.4找到间隔器,计算非标靶,分数目标

find_spacers发现N20间距器(其次是NGG pam网站),计数的非标靶,成绩目标。它还可视化结果并返回它们作为一个农庄对象与非目标数量和目标的效率。

逆电流器< - find_spacers(目标,bsgenome补充= FALSE,不匹配= 0,subtract_targets = TRUE)

2.5返回/写

结果作为一个农庄对象返回。它们可以写入文件write_ranges
它们可以被转换为一个数据。表gr2dt,如下所示

str (gr2dt(衬垫),vec.len = 2) # #类的数据。表”和“data.frame”: 6616奥林匹克广播服务公司。15变量:# # $ seqnames:系数w / 66水平“chr1”,“chr2”. .:1 1 1 1 1…# # $开始:int 4712619 4712620 4712627 4712620 4712619…# # $结束:int 4712638 4712639 4712646 4712639 4712638…# # $宽度:int 20 20 20 20 20…w / 3 # # $链:因素水平“+”,“-”,“*”:2 2 2 2 2…# # $名称:科“SRF_MA0083.3”“SRF_MA0083.3”…# # $得分:num 10.5 - 10.5…# # $ targetname:为了“chr1:4712628 - 4712643:”“chr1:4712628 - 4712643:”……# # $ targetstart: int 4712628 4712628 4712628 4712628 4712628… ## $ targetend : int 4712643 4712643 4712643 4712643 4712643 ... ## $ crisprname : chr "chr1:4712628-4712643:-_5" "chr1:4712628-4712643:-_4" ... ## $ crisprspacer: chr "ATATAAGGGCATTGGAAGAA" "AATATAAGGGCATTGGAAGA" ... ## $ crisprpam : chr "GGG" "AGG" ... ## $ Doench2014 : num 0.16491 0.00721 ... ## $ names : chr "chr1:4712628-4712643:-_5" "chr1:4712628-4712643:-_4" ... ## - attr(*, ".internal.selfref")=

Crispr / Cas9 gRNA设计

2020-10-27

内容

1背景