AHEnsDbs 1.0.13
作者:约翰Rainer
最后修改:2017-09-28 04:47:24
编译:2020年2月11日11:52:04星期二
EnsDb
数据库AnnotationHub
的AHEnsDbs
包提供的元数据EnsDb
SQLite数据库AnnotationHub。首先我们负载/更新AnnotationHub
资源。
库(AnnotationHub)啊< - AnnotationHub ()
接下来,我们列出所有EnsDb
条目从AnnotationHub
。
查询(啊,“EnsDb”)
与1321条记录# # # # # AnnotationHub snapshotDate (): 2020-01-28 # # # $ dataprovider:运用# # # $物种:智人,Xiphophorus maculatus,非洲爪蟾蜍tropicalis,骆马……# # # # # # $ rdataclass: EnsDb额外mcols (): taxonomyid,基因组,描述,# # # coordinate_1_based,维护者,rdatadateadded, preparerclass,标签,# # # rdatapath, sourceurl, sourcetype # # #检索记录,例如,对象[[“AH53185”]]的# # # # # #标题AH53185 |运用87 EnsDb安乐有害无益的# # AH53186 |运用87 EnsDb Ailuropoda Melanoleuca # # AH53187 |运用87 EnsDb阿斯蒂阿纳克斯Mexicanus # # AH53188 |运用87 EnsDb Anas Platyrhynchos # # AH53189 |运用87 EnsDb牛# #……# # AH75113 |运用98 EnsDb Vulpes Vulpes # # AH75114 |运用98 EnsDb Xiphophorus couchianus # # AH75115 |运用98 EnsDb Xiphophorus maculatus # # AH75116 |运用98 EnsDb非洲爪蟾蜍tropicalis # # AH75117 |运用98 EnsDb Zonotrichia albicollis
我们获取EnsDb
对于物种Ciona Intestinalis并运用释放87。
qr < -查询(啊,c (“EnsDb”、“intestinalis”,“87”))教育局< - qr [[1]]
1 # #下载资源
1 # #检索资源
# #从缓存加载
# #要求(“ensembldb”)
这个物种的基因定义我们可以简单地调用。
基因(教育局)
与17153年# #农庄对象范围和7元数据列:# # seqnames范围链| gene_id # # < Rle > < IRanges > < Rle > | <人物> # # ENSCING00000017842 1 1636 - 1902 + | ENSCING00000017842 # # ENSCING00000016550 1 4219 - 20394 | ENSCING00000016550 # # ENSCING00000016539 1 23518 - 34155 + | ENSCING00000016539 # # ENSCING00000002700 1 37108 - 60412 | ENSCING00000002700 # # ENSCING00000002712 1 62406 - 66903 | ENSCING00000002712 # #………………# # ENSCING00000025225 MT 11275 - 11335 + | ENSCING00000025225 # # ENSCING00000025226 MT 11337 - 12899 + | ENSCING00000025226 # # ENSCING00000025227 MT 12910 - 12973 + | ENSCING00000025227 # # ENSCING00000025228 MT 12990 - 14724 + | ENSCING00000025228 # # ENSCING00000025229 MT 14725 - 14790 + | ENSCING00000025229 # # gene_name gene_biotype seq_coord_system # # <人物> <人物> <人物> # # ENSCING00000017842 misc_RNA染色体# # ENSCING00000016550 protein_coding染色体# # ENSCING00000016539 protein_coding染色体# # ENSCING00000002700 protein_coding染色体# # ENSCING00000002712 protein_coding染色体# #……# # # # ENSCING00000025225 Mt_tRNA染色体ENSCING00000025226 COI protein_coding染色体# # ENSCING00000025227 Mt_tRNA染色体# # ENSCING00000025228 NADH5 protein_coding染色体# # ENSCING00000025229 Mt_tRNA染色体# # # # <人物>描述零# # # # ENSCING00000017842 ENSCING00000016550空零# # # # ENSCING00000016539 ENSCING00000002700空零# # # # ENSCING00000002712……零# # # # ENSCING00000025225 ENSCING00000025226细胞色素氧化酶亚基我(线粒体)[来源:RefSeq肽;Acc NP_758778):零# # # # ENSCING00000025227 ENSCING00000025228 NADH脱氢酶亚基5(线粒体)[来源:RefSeq肽;Acc NP_758779):零# # # # ENSCING00000025229象征entrezid # # <人物> <列表> # # # # ENSCING00000016550 ENSCING00000017842 NA NA # # # # ENSCING00000002700 ENSCING00000016539 NA NA # # ENSCING00000002712 100181294 # #………# # ENSCING00000025225 NA # # 806118 # # ENSCING00000025226 COI ENSCING00000025227 NA # # ENSCING00000025228 NADH5 806127 # # ENSCING00000025229 NA # # - - - - - - - # # seqinfo: 763年从KH基因组序列
本节描述(半)自动创建的方法ensembldb
EnsDb
SQLite注释数据库使用Perl运用API和运用的MySQL数据库转储。
EnsDb
SQLite数据库创建数据库,我们按顺序从运用本地下载和安装MySQL数据库转储和查询本地数据库提取这些注释将被插入到最后SQLite数据库。虽然有可能直接查询运用数据库使用Perl API,这已经被证明是慢,经常失败由于访问短缺或超时。
下面我们加载ensembldb
方案和generate-EnsDbs.R脚本的脚本文件夹中。
库(ensembldb)可控硅/ generate-EnsDbs < -执行(“脚本。R”、包= " ensembldb源(scr)”)
我们下一个使用createEnsDbForSpecies
函数。这个函数查询首先运用ftp服务器列表所有物种一定运用释放。默认情况下它会处理所有物种,首先下载MySQL数据库转储,安装到一个本地MySQL服务器,随后,从使用功能ensembldb
包和运用Perl API, exctracting所有注释从SQLite datababse和存储它。默认本地MySQL数据库将删除(设置参数dropDb = FALSE
不删除数据库)。
重要的参数设置功能:+ftp_folder
:默认情况下,主要运用ftp服务器将查询(ftp://ftp.ensembl.org/pub),另外,还Ensemblgenomes数据库可以查询。建立如。EnsDb
所有植物利用的年代ftp://ftp.ensemblgenomes.org/pub/release-34/plants/mysql。如果这个参数是定义指向的目录可以找到所有MySQL数据库转储。+ens_version
(如:运用版本。87年
)。+用户
:用户名当地的MySQL数据库。+主机
:本地MySQL数据库的主机名(例如“localhost”
)。+通过
:本地MySQL数据库的密码。
下面我们创建所有EnsDb
数据库运用87年释放。请注意,我们必须匹配这个版本已经安装了Perl运用API。
createEnsDbForSpecies (ens_version = 87,用户=“someuser”=“localhost”,通过=“somepass”)
SQLite数据库,每一个物种,将存储在当前工作目录中。