内容

1介绍

在许多应用程序中我们想要了解一个特定的药物与蛋白质信号网络通过其目标。

库(dplyr)库(ggplot2)图书馆(OmnipathR)图书馆(igraph)库(ggraph)

2预置OmniPath数据库

我们查询蛋白质相互作用的网络服务OmniPath [1, 2]https://omnipathdb.org/使用OmnipathR包:

#下载蛋白质-蛋白质之间的关系互动= import_omnipath_interactions () % > % as_tibble() #皈依igraph对象:OPI_g = interaction_graph(交互=交互)

3查询药物靶点

直接的药物靶点,我们将使用DrugBank[3]通过访问数据库dbparser包中。请注意,以下几chuncks代码不是评估。DrugBank要求注册访问数据,因此我们要求读者在DrugBank注册和下载数据在这里

下一个代码块是用来处理DrugBank数据集。

图书馆(dbparser)图书馆(XML) # #解析数据从XML并将其保存到内存get_xml_db_rows (“. .path-to-DrugBank / database.xml”) # #药物数据装载药物< - parse_drug() % > %选择(primary_key、名称)药物< -重命名(药物、drug_name =名字)# #负载药物目标数据drug_targets < - parse_drug_targets() % > %选择(id、名称、生物parent_key) % > %重命名(target_name =名字)# #多肽数据加载drug_peptides < - parse_drug_targets_polypeptides() % > %选择(id、名称、general_function specific_function, gene_name, parent_id) % > %重命名(target_name =名字,gene_id = id) 3 #加入数据集drug_targets_full < - inner_join (drug_targets, drug_peptides = c (“id”=“parent_id”,“target_name”)) % > % inner_join(药物、= c (“parent_key”=“primary_key”)) % > %选择(-other_keys)

我们声明的名字感兴趣的药物。

drug_names = c (“Valproat”=“丙戊酸”、“双氯芬酸”=“双氯芬酸”、“扑热息痛”=“对乙酰氨基酚”,“Ciproflaxin”=“环丙沙星”、“呋喃妥英”=“呋喃妥英”、“Tolcapone”、“用药”,“Troglitazone”、“奈法唑酮”、“酮康唑”,“奥美拉唑”,“苯妥英”、“胺碘酮”、“顺铂”、“环孢菌素”=“环孢霉素”,“维拉帕米”,“丁螺环酮”、“褪黑素”,“防治”=“乙酰半胱氨酸”,“维生素c”=“抗坏血酸”,“法莫替丁”、“万古霉素”)
drug_target_data_sample < - drug_targets_full % > %过滤器(生物= =“人类”,drug_name % % drug_names)

我们只使用一个数据库的小样本:

drug_targets < - OmnipathR::: drug_target_data_sample % > %过滤器(生物= =“人类”,drug_name % % drug_names)

3.1质量控制

在Omnipath检查哪些药物靶点

drug_targets < - drug_targets % > %选择(-target_name有机体)% > %变异(in_OP = gene_id % % c(交互)美元)#不是所有药物靶点在相机会打印(所有(drug_targets in_OP美元))。
# #[1]假
#但是每个药物至少有一个目标相机会drug_targets % > % group_by (drug_name) % > %总结(任何(in_OP))
# # #一个宠物猫:19×2 # # drug_name的任何(in_OP) # # <空空的> < lgl > # # 1对乙酰氨基酚真# # 2乙酰半胱氨酸真# # 3胺碘酮对# # 4抗坏血酸对# # 5咪唑硫嘌呤真正的# # 6丁螺环酮对# # 7环丙沙星错# # 8顺铂真正的# # 9双氯芬酸真的# # 10法莫替丁真的# # 11酮康唑对# # 12褪黑激素真的# # 13奈法唑酮真的# # 14奥美拉唑对# # 15苯妥英真# # 16 Tolcapone假# # 17 Troglitazone真正的# # 18丙戊酸真# # 19维拉帕米真

4下游信号节点

我们想调查的影响药物在某些选定的蛋白质。例如,测量这些蛋白质的活性药物扰动。我们将构建一个网络从药物靶点这些选定的节点。

首先我们声明感兴趣的蛋白质(POI):

POI =宠物猫(蛋白质= c (“NFE2L2”、“HMOX1”,“TP53”、“CDKN1A”、“BTG2”、“NFKB1”、“ICAM1”、“HSPA5”、“ATF4”、“DDIT3”、“XBP1”))

4.1质量控制

检查哪些POI Omnipath

POI < - POI % > %变异蛋白质(in_OP = % %交互target_genesymbol美元)#所有POI Omnipath打印(所有(POI in_OP美元))
# # [1]

5构建网络之间的药物靶点和POI

首先,我们发现药物靶标和POIs之间的路径。为了这种简单我们关注药物靶点的药物,顺铂

节点的路径由一组:

source_nodes < - drug_targets % > %过滤器(in_OP drug_name = =“顺铂)% > %拉(gene_name) target_nodes < - POI % > %过滤器(in_OP) % > %拉(蛋白质)collected_path_nodes =()列表(在1:i_source长度(source_nodes)){路径< - shortest_paths (OPI_g,从= source_nodes [[i_source]], = target_nodes,输出= vpath) path_nodes < -拉普(路径vpath美元,名)% > % unlist() % >() %独特collected_path_nodes [[i_source]] < - path_nodes} collected_path_nodes < - unlist (collected_path_nodes) % > %独特的()

直接的药物靶点,POIs和中间通路成员产生网络。

cisplatin_nodes < - c (source_nodes、target_nodes collected_path_nodes) % >() %独特cisplatin_network < - induced_subgraph(图= OPI_g视频= cisplatin_nodes)

我们标注的节点网络和阴谋。

V (cisplatin_network) $ node_type = ifelse (V (cisplatin_network)名字% % source_nodes美元,“直接药物目标”,ifelse (V (cisplatin_network)名字% % target_nodes美元,“芋泥”、“中间节点”))ggraph (cisplatin_network布局=“lgl”,面积= vcount (cisplatin_network) ^ 2.3, repulserad = vcount (cisplatin_network) ^ 1.2, coolexp = 1.1) + geom_edge_link (aes (start_cap = label_rect (node1.name) end_cap = label_rect (node2.name)),箭头表示箭头(长度=单元(4毫米)),edge_width = 5, edge_alpha = 2) + geom_node_point () + geom_node_label (aes(标签=名称、颜色= node_type)) + scale_color_discrete(指导= guide_legend (title =“节点类型”))+ theme_bw () + xlab (" ") + ylab (" ") + ggtitle(“顺铂诱导网络”)

上述网络代表顺铂如何影响POIs的一种方式。例如可以过滤掉边缘基于边缘fo资源报告数量或基于论文提到的数量。然而,这已经由以前的pypath教程。

6确认

上述管道受到的巢穴Turei可用在这里

7引用

Valdeolivas Turei [1] D, L古尔,N Palacio-Escat伊万诺娃阿伽柏,D modo T Korcsmaros和J Saez-Rodriguez(2020)整合内部和胞间信号知识多细胞组学分析。bioRxiv2020.08.03.221242

[2]D Turei T Korcsmaros和J Saez-Rodriguez (2016) OmniPath:方针、网关literature-curated信号通路资源。自然方法13 (12)

[3]Wishart DS, Feunang码,郭AC,瞧EJ, Marcu,格兰特JR Sajed T,约翰逊D,李C, Sayeeda Z, Assempour N, Iynkkaran我,刘Y, Maciejewski,盖尔N,威尔逊,下巴L,卡明斯R, Le D,彩球,诺克斯C,威尔逊m . DrugBank 5.0: 2018年DrugBank主要更新数据库。核酸Res。2017年11月8日。doi: 10.1093 / nar / gkx1037。

会话信息

# # R版本4.1.2(2021-11-01)# #平台:x86_64-pc-linux-gnu(64位)# #下运行:Ubuntu 20.04.3 LTS # # # #矩阵产品:默认# #布拉斯特区:/home/biocbuild/bbs - 3.14 - bioc / R / lib / libRblas。所以# # LAPACK: /home/biocbuild/bbs - 3.14 - bioc / R / lib / libRlapack。# # # #语言环境:# # [1]LC_CTYPE = en_US。utf - 8 LC_NUMERIC = C而= en_GB # # [4] LC_COLLATE = C LC_MONETARY = en_US。utf - 8 LC_MESSAGES = en_US。utf - 8 # # [7] LC_PAPER = en_US。utf - 8 LC_NAME C = C LC_ADDRESS = # # [10] LC_TELEPHONE = C LC_MEASUREMENT = en_US。utf - 8 LC_IDENTIFICATION = C附加基本包:# # # # # #[1]统计图形grDevices跑龙套数据集方法基础# # # #其他附加包:# # [1]ggraph_2.0.5 igraph_1.2.11 ggplot2_3.3.5 dplyr_1.0.8 OmnipathR_3.2.8 BiocStyle_2.22.0 # # # #通过加载一个名称空间(而不是附加):# # [1]ggrepel_0.9.1 Rcpp_1.0.8 tidyr_1.2.0 prettyunits_1.1.1 assertthat_0.2.1 # # [6] digest_0.6.29 utf8_1.2.2 ggforce_0.3.3 R6_2.5.1 cellranger_1.1.0 # # [11] backports_1.4.1 evaluate_0.15 highr_0.9 httr_1.4.2 pillar_1.7.0 # # [16] rlang_1.0.1 progress_1.2.2 curl_4.3.2 readxl_1.3.1 jquerylib_0.1.4 # # [21] magick_2.7.3 checkmate_2.0.0 rmarkdown_2.11 labeling_0.4.2 readr_2.1.2 # # [26] stringr_1.4.0 polyclip_1.10-0 bit_4.0.4 munsell_0.5.0 compiler_4.1.2 # # [31] xfun_0.29 pkgconfig_2.0.3 htmltools_0.5.2 tidyselect_1.1.2 gridExtra_2.3 # # [36] tibble_3.1.6 bookdown_0.24 graphlayouts_0.8.0 viridisLite_0.4.0 fansi_1.0.2 # # [41] crayon_1.5.0 tzdb_0.2.0 withr_2.4.3 later_1.3.0 MASS_7.3-55 # # [46] rappdirs_0.3.3 grid_4.1.2 jsonlite_1.8.0 gtable_0.3.0 lifecycle_1.0.1 # # [51] DBI_1.1.2 magrittr_2.0.2 scales_1.1.1 cli_3.2.0 stringi_1.7.6 # # [56] vroom_1.5.7 farver_2.1.0 viridis_0.6.2 xml2_1.3.3 logger_0.2.2 # # [61] bslib_0.3.1 ellipsis_0.3.2 generics_0.1.2 vctrs_0.3.8 tools_4.1.2 # # [66] bit64_4.0.5 glue_1.6.1 tweenr_1.0.2 purrr_0.3.4 hms_1.1.1 # # [71] parallel_4.1.2 fastmap_1.1.0 yaml_2.3.5 colorspace_2.0-3 BiocManager_1.30.16 # # [76] tidygraph_1.2.0 knitr_1.37 sass_0.4.0