GenProSeq

DOI:10.18129 / B9.bioc.GenProSeq

用深度生成模型生成蛋白质序列

Bioconductor版本:发行版(3.16)

蛋白质工程的生成建模是解决合成生物学、医学和材料科学中的基本问题的关键。机器学习使我们能够在各种规模上生成有用的蛋白质序列。生成式模型是一种机器学习方法,它试图对数据的分布进行建模,允许生成与模型训练的属性相似的新样本。蛋白质的生成模型可以学习生物学上有意义的表示,有助于各种下游任务。此外,他们可以学习生成以前没有观察到的蛋白质序列,并为满足所需标准的蛋白质序列分配更高的概率。在这个包中,常见的蛋白质序列深度生成模型,如变分自编码器(VAE),生成对抗网络(GAN)和自回归模型是可用的。在VAE和GAN中,Word2vec用于嵌入。变压器编码器应用于蛋白质序列的自回归模型。

作者:Jung Dongmin [cre, aut]

维护者:Dongmin Jung

引文(从R内,输入引用(“GenProSeq”)):

安装

要安装这个包,启动R(版本“4.2”)并输入:

如果(!require("BiocManager", quiet = TRUE)) install.packages("BiocManager")

对于R的旧版本,请参考相应的Bioconductor释放

文档

要查看系统中安装的此包版本的文档,请启动R并输入:

browseVignettes(“GenProSeq”)

超文本标记语言 R脚本 GenProSeq
PDF 参考手册
文本 新闻

细节

biocViews 蛋白质组学软件
版本 1.2.0
在Bioconductor BioC 3.15 (R-4.2)(0.5年)
许可证 艺术- 2.0
取决于 kerasmclust, r (>= 4.2)
进口 tensorflowword2vecDeepPINCSttgseaCatEncoders网状,统计数据
链接
建议 knitrtestthatrmarkdown
SystemRequirements
增强了
URL
全靠我
进口我
建议我
链接到我
构建报告

包档案

遵循bob 体育网址 在R会话中使用此包的说明。

源包 GenProSeq_1.2.0.tar.gz
Windows二进制 GenProSeq_1.2.0.zip
macOS二进制文件(x86_64) GenProSeq_1.2.0.tgz
macOS二进制文件(arm64)
源库 git克隆https://git.bioconductor.org/packages/GenProSeq
源存储库(开发人员访问) git克隆git@git.bioconductor.org:packages/GenProSeq
包短Url //www.anjoumacpherson.com/packages/GenProSeq/
软件包下载报告 下载数据

文档»

Bioconductor

R/凹口包和文档

支持»

请细阅发布指南.将有关Bioconductor的问题发送到以下位置之一:

  • 支持网站-询问有关Bioconductor封装的问题
  • 正常词 邮件列表——供包开发人员使用bob电竞体育官网