Compare 2 Sequences为两个输入序列或两组序列生成所有可能的引导rna (gRNAs),并对另一个序列中的潜在脱靶进行评分。
两个输入文件包含要搜索潜在grna的两个序列。Compare 2 Sequences为两个输入序列的每个gRNA分配相对裂解分数,便于识别专门针对两个输入序列之一的gRNA,并便于识别针对两个输入序列的gRNA。
它返回一个包含两个序列中所有潜在grna的数据帧。此外,一个以制表符分隔的文件scoresFor2InputSequences.xls也保存在outputDir中,按scoreDiff降序排序。输出的gRNAs以fasta或genbank格式成对配置,并带有限制性内切酶切割位点。
脱靶分析是通过自动调用findgRNAs, filtergRNAs, searchHits, buildFeatureVectorForScoring, getOfftargetScore, filterOfftarget,计算gRNA切割效率并生成报告,为CRISPR-Cas9系统设计靶向特异性指引rna (target-specific guide RNAs, gRNAs)。
该程序为输入序列寻找潜在的gRNA,为每个gRNA搜索和评分脱靶位点,并检索脱靶位点侧翼的基因组序列。然后判断脱靶位点是否在基因的关键区域(如外显子),输出脱靶细节,包括错配位置、裂解分数、topN脱靶切割分数的grna。
输出目录中生成四个以tab分隔的文件:OfftargetAnalysis.xls(脱靶的详细信息)、summary .xls (gRNAs的摘要)、REcutDetails.xls(每个gRNA的限制性内切酶切割位点)和pairedgRNAs.xls(潜在的配对gRNAs)。
GUIDE-seq分析工作流包括获取唯一插入位点(切割位点的代理)、估计插入位点的位置(即峰值)、合并正链和负链估计的插入位点以及对插入位点周围扩展区域进行脱靶搜索的函数。
该方法依赖于错误的nhej介导的DNA修复,在cas9诱导的基因组断点处捕获共引入的钝端双链寡核苷酸(dsodn)。在Cas9诱导的dsb中,GUIDE-seq dsodn显示高插入频率(高达测量到的插入率的50% (Tsai et al., 2015),从而标记这些位点进行选择性扩增和随后的深度测序。该方法相当敏感,可以检测到>0.1% indel频率的脱靶位点,dsODN插入的频率似乎与每个位点cas9诱导病变的频率相关(Tsai et al., 2015)。该方法已成功用于评估Cas9及其变体(true - sgrnas (Tsai et al., 2015)或PAM变体(kleinstver et al., 2015)的精确度。鉴于其良好的性能,GUIDE-seq可能成为核酸酶领域脱靶分析的标准。虽然GUIDE-seq方法易于使用,但迄今为止还没有生物信息学工具发布给社区来支持这些数据的分析。
为了方便GUIDE-seq数据集的分析,我们开发了GUIDEseq包,包括每个唯一分子标识符(UMI)保留一个reads,过滤缺乏整合寡核苷酸序列(dsodn)的reads,识别峰位置(解理位点)和高度,合并正链和负链的解理位点,以及对输入gRNA进行目标和脱靶搜索。该分析利用我们的ChIPpeakAnno包(Zhu et al., 2010)来合并正链和负链的裂解位点,利用CRISPRseek包(Zhu et al., 2014)来定义任何已识别的脱靶位点与引导序列的同源性和Cas9 PAM特异性。
CRISPRSeek的用户界面允许控制offTargetAnalysis和compare2Sequences,允许您根据您的数据文件更改预设默认值。
首先,选择您想要做的分析,脱靶分析,比较2个序列,或GUIDE-seq分析。之后,使用文件上传器上传您的文件。如果您没有任何文件要上传,则将在分析中使用默认的演示文件。默认的输出目录是一个临时目录。
接下来,在主面板和高级设置面板中相应地更改submission面板下的默认设置。单击“提交”继续分析,或单击“重置所有字段默认值”重置所有更改的设置。
分析完成后,您可以通过点击左下角的“下载”按钮,并选择您想要保存的位置,以zip文件的形式下载输出数据。
在Data Table面板下,完成对数据的分析后,将提供示例数据表。对于脱靶分析,示例数据表用于“RE Cut Details”输出。对于比较2个序列,显示的数据表是“Scores For 2 Input sequences”输出文件。最后,对于GUIDE-seq,输出数据表是来自“gRNA Peaks”输出文件的数据。
允许上传的最大文件大小为1gb。更大的值将不被应用程序接受。如果没有上传文件,则使用演示文件进行分析。添加大文件可能需要一段时间来上传和分析。请参考屏幕顶部的提示符,该提示符将告诉您文件是否仍在被分析,或者分析是否已经完成。