内容

1概述

“间隔词投影(sWeeP)”是一种相对表示生物序列的方法,它通过扫描序列和生成索引来创建一个高维向量,然后将其投影到一个更小的随机定向标准正交基中。该函数适用于在序列之间进行高质量的比较,允许由于传统技术的计算限制而无法进行分析。该方法可在扫描(PIERRI, 2019)。该工具有它的主要速度增益在康斯坦奇加工时间。响应时间与输入数量成线性增长,而在其他方法中,响应时间呈指数增长。

1.1功能

这个包有两个函数:orthBase,它生成一个选定大小的标准正交矩阵;sWeeP,一个应用sWeeP方法的函数

2快速启动

orthBase函数可以创建任意大小的准标准正交矩阵。在这里,它用于创建一个矩阵来投影sWeeP方法,因此它必须有160.000行和需要投影的列的大小。

- base (160000,10)

exdna.fasdataset包含一个由三个字符串组成的列表,该列表模拟了仅用于演示目的的DNA序列。

路径<- system. Path。file(package = "rSWeeP", "extdata", "exdna.fas")

然后应用sWeeP方法并返回一个矩阵,该矩阵表示用矢量方法比较的序列。然后就可以在系统发生树中看到图形

return <- sWeeP(path,baseMatrix) distcia <- dist(return, method=" euclidean") tree <- hclust(distcia, method="ward.D") plot(tree, hang = -1, cex = 1)

3.会话信息

## R正在开发中(不稳定)(2022-10-25 r83175) ##平台:x86_64-pc-linux-gnu(64位)##运行在Ubuntu 22.04.1 LTS ## ##矩阵产品:默认## BLAS: /home/biocbuild/bbs-3.17-bioc/R/lib/libRblas。so ## LAPACK: /usr/lib/x86_64-linux-gnu/ LAPACK /liblapack.so.3.10.0 ## ## locale: ## [1] LC_CTYPE=en_US。UTF-8 LC_NUMERIC= c# # [3] LC_TIME=en_GB LC_COLLATE= c# # [5] LC_MONETARY=en_US。utf - 8 LC_MESSAGES = en_US。UTF-8 ## [7] LC_PAPER=en_US。UTF-8 LC_NAME= c# # [9] LC_ADDRESS=C lc_phone = c# # [11] LC_MEASUREMENT=en_US。UTF-8 LC_IDENTIFICATION=C ## ##附加的基本包:## [1]stats graphics grDevices utils datasets methods基础## ##其他附加包:## [1]rSWeeP_1.11.0 BiocStyle_2.27.0 ## ##通过命名空间加载(且未附加):[13] htmltools_0.5.3 pracma_2.4.2 stats4_4.3.0 ## bbbsass_0.4.2 rmarkdown_2.17 evaluate_0.17 ## [19] jquerylib_0.1.4 bitops_1.0-7 fastmap_1.1.0 ## [22] GenomeInfoDb_1.35.0 IRanges_2.33.0 yaml_2.3.6 ## [25] bookdown_0.29 BiocManager_1.30.19 string_1 .4.1 ## [28] compiler_4.3.0 Rcpp_1.0.9 XVector_0.39.0 ## [10] S4Vectors_0.37.0 RCurl_1.98-1.9 Biostrings_2.67.0 ## [10] sass_0.4.2 rmarkdown_2.17[31] digest_0.6.30 R6_2.5.1 GenomeInfoDbData_1.2.9 ## [34] magrittr_2.0.3 bslib_0.4.0 tools_4.3.0 ## [37] zlibbioc_1.45.0 BiocGenerics_0.45.0 cachem_1.0.6

4参考文献