RCy3 2.10.2
这个描述将向您展示如何映射或转换从一个数据库标识符(例如,运用)到另一个(e。g, Entrez基因)。这是一种常见的数据分析要求。Cytoscape的上下文中,例如标识符映射需要在您想要导入数据覆盖网络上但是你没有匹配的钥匙。下面有三个不同的例子,突出不同的教训,可能适用于你的用例。
如果(!“RCy3”% % installed.packages ()) {install.packages (“BiocManager”) BiocManager::安装(“RCy3”)}图书馆(RCy3)
的全部意义RCy3与Cytoscape连接。您需要安装并启动Cytoscape:
cytoscapePing ()
当计划导入数据时,您需要考虑的键列在您的网络数据和表数据。总是建议你使用适当的标识符作为键(例如,从数据库运用和Uniprot-TrEMBL)。依靠传统的符号和名称不标准,容易出错。
让我们从样品开始Cytoscape提供的网络。
警告:加载一个会话文件将丢弃你的当前会话。省第一,如果你有你想保持网络或数据。使用saveSession (“path_to_file”)。
openSession() #关闭当前会话(不保存),打开一个会话文件示例
现在,您应该看到一个网络与超过300个节点。如果你看看节点表,你会发现有适当的标识符的名字列,像“YDL194W”。这些是酵母的Ensembl-supported id。
你需要知道一些事情关于你的网络来运行这个函数,例如,物种和启动(或源)标识符类型。这通常不是一个问题,但是这个例子强调了一个独特的情况下,为一个特定的物种(即运用ID类型。、酵母)有一个特定的格式(例如,YDL194W),而不是更典型ENSXXXG00001232格式。
所以,有了这些知识,您可以运行下面的功能:
映射。关口< - mapTableColumn(“名字”,“酵母”、“运用”、“Entrez基因”)
我们要求Cytoscape看看的名字列酵母运用相应的id,然后提供一个新的列Entrez基因id。如果你回顾节点表,你会发现新列(一直到正确的)。就是这样!
返回值是一个数据帧的所有运用之间的映射和Entrez基因被发现在您的网络情况下,您希望这些细节:
映射。关口[1:3]#前三个条目
注意:返回数据帧的行名称节点从Cytoscape suid。这些都是方便的,如果你想自己加载映射(见最后一个例子)。
下一个示例,您需要从内部应用程序访问数据库的字符串的字符串Cytoscape: *安装应用程序从字符串https://apps.cytoscape.org/apps/stringapp
#中可用Cytoscape 3.7.0以上installApp (“STRINGapp”)
现在我们可以导入蛋白质相互作用网络的大量的注释字符串与一个简单的数据库commandsGET函数,如下:
字符串。cmd = '字符串查询疾病=“乳腺癌”物种截止= 0.9 =“智人”限制= 150 commandsGET (string.cmd) #有关字符串命令的更多信息:# commandsHelp(字符串)# commandsHelp(疾病查询字符串)
查看节点表,你就会看到显示名称和标识符。特别是,规范的名称似乎持有Uniprot-TrEMBL id列。好,我们可以用!
说我们在运用基因数据集的标识符。然后我们要执行这个映射:
映射。关口< - mapTableColumn (“stringdb::规范名称”,“人类”,“Uniprot-TrEMBL”,“运用”)
滚动到正确的节点表中,你会看到一个新列与运用id。这个例子强调了一个有用的翻译从蛋白质基因标识符(反之亦然),但也是一个谨慎注意的假设当翻译。例如,一个典型的基因编码对于许多蛋白质,所以你可能会有多对一映射的结果。
时不时地,你会遇到一个情况下,在您的网络标识符的混合类型。这是一个罕见的场景,但是这是解决问题的一种方法。
首先,你需要WikiPathways应用访问WikiPathways数据库。WikiPathways的途径是策划一个社区的感兴趣的研究人员和公民科学家。因此,在一些情况下,作者可能使用不同来源的标识符。他们是有效的id,就不是所有来自同一来源。WikiPathways应用的未来版本将提供pre-mapped列一个ID类型。但与此同时(和其他相关的用例),这个例子强调了如何处理混合标识符类型的来源。
#中可用Cytoscape 3.7.0以上installApp (“WikiPathways”)
现在我们可以从WikiPathways导入一个细胞凋亡途径。要么从web站点(https://wikipathways.org),或者从网络搜索工具在Cytoscape GUI或rWikiPathways包,我们可以确定WP254的途径。
wp。cmd = ' wikipathways import-as-pathway id =“WP254”commandsGET (wp.cmd) #有关wikipathways命令的更多信息:# commandsHelp (wikipathways) # commandsHelp (“wikipathways import-as-pathway”)
带看XrefId列,你会看到一个标识符的类型。下一篇专栏文章,XrefDatasource每种类型,方便的名字的来源。忽略了代谢产物对于这个示例,我们只有运用和Entrez基因来处理。
说我们想要一个只有运用id列。最简单的方法是简单地覆盖所有non-Ensembl id,即。在这种情况下,Entrez基因id。让我们先收集映射:
映射。关口< - mapTableColumn (“XrefId”、“人类”,“Entrez基因”、“运用”)
接下来,我们想要删除
only.mapped。关口< - mapped.cols [complete.cases (mapped.cols),“运用”,放弃= FALSE) colnames (only.mapped.cols) < - XrefId loadTableData (only.mapped.cols table.key。列=“SUID”)
完成了!看到更新的XrefId列Cytoscape运用id。
注意:您需要更新XrefDatasource *列,或者简单地记下忽略它。*
这个标识符映射函数是为了处理大多数常见的ID映射问题。然而,它有限制。
mapTableColumn ?
如果你需要一个ID映射解决方案物种或ID类型不是由这个工具,或者如果你想连接到替代资源的映射,然后查看BridgeDb应用:http://apps.cytoscape.org/apps/bridgedb。
#中可用Cytoscape 3.7.0以上installApp (“BridgeDb”)
然后浏览可用的函数commandsHelp (“bridgedb”)