使用辅助函数makeOrgPackageFromNCBI()和makeOrgPackage()制作有机体包是一个简单的过程。如果您的包在NCBI上可用,并具有可识别的NCBI Taxonomy ID,则可以尝试makeOrgPackageFromNCBI()。但是,即使失败了,第二个更通用的makeOrgPackage()函数将允许您仅使用data.frames of data创建数据库包。
makeOrgPackageFromNCBI()函数将使用几个不同的参数来帮助声明谁制作了这个包以及它是为什么物种制作的。但最重要的参数是tax_id参数。这一论点被用于从NCBI中搜索与该物种相关的基因记录。因此,在调用此函数时,为该参数选择正确的NCBI分类ID非常重要。您可以在NCBIs网站上查找有关taconomy ID的信息。下面是一个调用此函数为zebrafinch制作包的示例。
library(AnnotationForge) makeOrgPackageFromNCBI(version = "0.1", author = "Some One ", maintainer = "Some One ", outputDir = ".", tax_id = "59729", genus = "Taeniopygia", species = "guttata")
有时你可能在NCBI找不到你需要的东西,最常见的原因是他们可能没有足够的关于你感兴趣的生物的数据。但通常其他资源会有注释数据,您希望将这些数据放入一个有机包中。当这种情况发生时,您可以使用更通用的makeOrgPackage()函数。这个函数需要更多参数,但它不依赖NCBI来运行。然而,我们仍然要求您为元数据提供一个税务ID(即使我们不使用它来从NCBI查找数据)。许多其他参数也与makeOrgPackageFromNCBI()函数相同。但是一个关键的区别是这个函数的第一个参数是(…)。对于该参数,我们希望您提供与data.frames of data对应的命名参数。每个已命名的参数将成为结果数据库中的一个表名,每个字段名(对于data.frames)将成为数据库的字段名以及columns()和keytypes()方法查找的名称。除了任何由goTable参数命名的表(下文将详细介绍)之外,对于可以放入data.frame的数据类型没有太多限制。 But one rule you must follow is that the 1st collumn of each data.frame has to correspond to a central gene ID and be labeled “GID”.
最后,goTable方法也是新的。当其中一个data.frames包含GO信息时,该参数表示。如果你选择使用这个参数,makeOrgPackage()将对你的GO数据进行后处理:1)删除太新的id; 2)创建第二个表来表示select方法的GOALL、EVIDENCEALL和ONTOLOGYALL字段等。然而,要使用goTable参数,必须严格遵守数据约定。这样的data.frame必须只有三列,这些必须对应于基因id, GO id和证据代码。这些列也必须命名为“GID”,“GO”和“EVIDENCE”下面是一个例子,它将一个示例文件解析为三个data.frame,并使用了goTable参数。
##为Zebra Finch data.frames制作一个生物包:finchFile <- system.file("extdata","finch_info.txt", package="AnnotationForge") Finch <- read.table(finchFile,sep="\t") ##现在准备一些data.frames fSym <- Finch [,c(2,3,9)] fSym <- fSym[fSym[,2]!="-",] fSym <- fSym[fSym[,3]!=“-”)colnames (fSym) < - c(“GID”、“象征”、“GENENAME”)fChr < -芬奇[c(2、7)]fChr < - fChr [fChr [2] !="-",] colnames(fChr) <- c("GID","CHROMOSOME") finchGOFile <- system.file("extdata","GO_finch.txt", package="AnnotationForge") fGO <- read.table(finchGOFile,sep="\t") fGO <- fGO[fGO[,2]!="",] fGO <- fGO[fGO[,3]!="",] colnames(fGO) <- c("GID","GO","EVIDENCE") ##然后调用函数makeOrgPackage(gene_info=fSym,染色体=fChr, GO =fGO, version="0.1", maintainer="Some One ", author="Some One ", outputDir =" .", tax_id="59729", genus="Taeniopygia", species="guttata", goTable=" GO") ##然后调用install。根据返回值install.packages("./org.Tguttata.eg.db", repos=NULL)