的所有功能的详细示例getDataset
方法。
正如在介绍性小插图中所解释的,数据集必须从ImmuneSpaceConnection
对象。我们必须首先实例化一个或多个感兴趣的研究的连接。在整个小插图中,我们将使用两个连接,一个连接到单个研究,一个连接到所有可用的数据。
现在连接已经实例化,我们可以开始从它们中下载,但我们需要弄清楚在我们选择的研究中哪些数据集是可用的。打印连接将在其他信息中列出可用的数据集。的listDatasets
方法将只显示我们正在查找的信息。
##数据集## cohort_membership ##人口统计## elisa ## elispot ## fcs_analyzed_result ## fcs_sample_files ## gene_expression_files # ha# pcr ##表达矩阵## SDY269_PBMC_TIV_Geo ## SDY269_PBMC_LAIV_Geo
# # # #数据集cohort_membership # #人口有关酶联免疫斑点# # fcs_analyzed_result # # # elisa # # # fcs_control_files # # fcs_sample_files海# # hla_typing # # # gene_expression_files # # # mbaa # # neut_ab_titer # # pcr # #矩阵表达式# # SDY1086_PBMC_GroupB_Geo # # SDY1086_PBMC_GroupA_Geo # # SDY1267_PBMC_RRR_Geo # # SDY1267_PBMC_ARR_Geo # # SDY1412_WholeBlood_EPC002_geo # # SDY1256_WholeBlood_EPIC001_geo # # SDY80_PBMC_Cohort2_geo # # SDY299_WholeBlood_HEPISLAV # # SDY180_WholeBlood_Grp2Saline_Geo # #SDY180_WholeBlood_Grp2Pneunomax23_Geo # # SDY180_WholeBlood_Grp2Fluzone_Geo # # SDY180_WholeBlood_Grp1Saline_Geo # # SDY180_WholeBlood_Grp1Pneunomax23_Geo # # SDY180_WholeBlood_Grp1Fluzone_Geo # # SDY1325_WholeBlood_LowIntraMuscularPS_geo # # SDY1294_PBMC_ChineseCohort_Geo # # SDY1119_PBMC_oldHealthy_Geo # # SDY1119_PBMC_oldT2D_Geo # # SDY1119_PBMC_youngT2D_Geo # # SDY1119_PBMC_youngHealthy_Geo # # SDY1289_WholeBlood_MontrealCohort_Geo # # SDY1289_WholeBlood_LausanneCohort_Geo # # SDY1324_PBMC_nonBCGvacc # #SDY1324_PBMC_LatentTB # # SDY1324_PBMC_BCGvacc # # SDY89_WholeBlood_EnergixB # # SDY1370_Bcell_lc16m8_geo # # SDY1370_Bcell_dryvax_geo # # SDY1370_Tcell_lc16m8_geo # # SDY1370_Tcell_dryvax_geo # # SDY1370_PBMC_lc16m8_geo # # SDY1370_PBMC_dryvax_geo # # SDY1368_WholeBlood_Twin_Geo # # SDY1368_WholeBlood_NonTwin_Geo # # SDY67_PBMC_HealthyAdults # # SDY1328_WholeBlood_HealthyAdults_geo # # SDY224_PBMC_TIV2010_ImmPort # # SDY888_PBMC_UninfectedEndemicArea_Geo # # SDY888_PBMC_UninfectedNonEndemicArea_Geo # #SDY888_PBMC_InfectedEndemicArea_Geo # # SDY28_PBMC_Dryvax # # SDY34_PBMC_TIV # # SDY34_PBMC_Controls # # SDY305_Other_IDTIV_Geo # # SDY305_Other_TIV_Geo # # SDY112_Other_GroupC # # SDY112_Other_GroupB # # SDY112_Other_GroupA # # SDY315_Other_GroupC_Geo # # SDY315_Other_GroupB_Geo # # SDY315_Other_GroupA_Geo # # SDY406_Other_ILI_Geo # # SDY113_Other_IDTIV_Geo # # SDY113_Other_LAIV_Geo # # SDY113_Other_TIV_Geo # # SDY144_Other_TIV_Geo # # SDY690_PBMC_Energixb # # SDY690_WholeBlood_Energixb # # SDY597_Other_InVitro# # # # # # SDY522_Other_LAIV SDY387_WholeBlood_NCH2010 SDY372_WholeBlood_JDM2012 # # SDY368_WholeBlood_NCH2013 # # SDY364_WholeBlood_NCH2012 # # SDY312_Other_GroupC # # SDY312_Other_GroupB # # SDY312_Other_GroupA # # SDY301_Other_AIRFV # # SDY296_WholeBlood_AIRFV # # SDY667_WholeBlood_PSORPPP # # SDY212_WholeBlood_Older_Geo # # SDY212_WholeBlood_Young_Geo # # SDY212_PBMC_Older_Geo # # SDY212_PBMC_Young_geo # # SDY270_PBMC_TIVGroup_Geo # # SDY1373_WholeBlood_highDose_Geo # # SDY1373_WholeBlood_lowDose_Geo # #SDY1364_PBMC_IntraDermal_Geo # # SDY1364_PBMC_IntraMuscular_Geo # # SDY1325_WholeBlood_IntramuscularCRM_Geo # # SDY1325_WholeBlood_IntramuscularPS_Geo # # SDY1325_WholeBlood_SubcutaneousPS_Geo # # SDY1291_PBMC_HealthyHIVUninfected_Geo # # SDY1293_PBMC_Vaccinated_geo # # SDY1293_PBMC_Control_Geo # # SDY1276_WholeBlood_Validation_Geo # # SDY1276_WholeBlood_Discovery_Geo # # SDY1264_PBMC_Trial2_Geo # # SDY1264_PBMC_Trial1_Geo # # SDY1260_PBMC_MCV4_Geo # # SDY1260_PBMC_MPSV4_Geo # # SDY984_PBMC_Elderly_Geo # #SDY984_PBMC_Young_Geo # # SDY61_PBMC_TIVGrp # # SDY56_PBMC_Older # # SDY56_PBMC_Young # # SDY63_PBMC_Young_Geo # # SDY63_PBMC_Older_Geo # # SDY404_PBMC_Young_Geo # # SDY404_PBMC_Older_Geo # # SDY400_PBMC_Older_Geo # # SDY400_PBMC_Young_Geo # # SDY269_PBMC_TIV_Geo # # SDY269_PBMC_LAIV_Geo # # SDY300_dendriticCell_dcMonoFlu2011 # # SDY300_otherCell_dcMonoFlu2011 # # SDY162_Macrophage_VLplus # # SDY162_PBMC_VLplus # # SDY162_Macrophage_VLminus # # SDY162_PBMC_VLminus
自然地,所有
包含免疫空间上所有可用的数据集,因为它结合了所有可用的研究。另外,在创建连接对象时使用verbose = TRUE
,一个电话getDataset
方法使用无效数据集名称将返回有效数据集的列表。
调用getDataset
返回在ImmuneSpace上显示的选定数据集。
# # participant_id age_reported性别种族群体# # 1:SUB112829.269 26男白LAIV集团2008 # # 2:SUB112829.269 26岁男性白人LAIV集团2008 # # 3:SUB112829.269 26岁男性白人LAIV集团2008 # # 4:SUB112829.269 26岁男性白人LAIV集团2008 # # 5:SUB112829.269 26岁男性白人LAIV集团2008 # # 6:SUB112829.269 26岁男性白人LAIV集团2008 # # study_time_collected study_time_collected_unit病毒# # 1:0天/南达科他州/ 06/2007 # # 2:0天/乌拉圭/ 716/2007 # # 3:0天B/佛罗里达/2006年4月## 4:28天A/南达科他州/2007年6月## 5:28天A/乌拉圭/716/2007 ## 6:28天B/佛罗里达/2006年4月## value_preferred ## 1: 40 ## 2: 40 ## 3: 20 ## 4: 40 ## 5: 40 ## 6: 40
由于一些数据集(如流式细胞术结果)可能包含大量的行,该方法返回data.table
对象来提高性能。这对于多学科的联系尤为重要。
数据集可以在下载前进行筛选。过滤器应该使用Rlabkey
的makeFilter
函数。
每个过滤器由三个部分组成:*列名或列标签*操作符*用分号分隔的值或值数组
图书馆(Rlabkey)#参与者年龄在30岁以下young_filter < -makeFilter(c(“age_reported”,“LESS_THAN”,30.))#列出两个参与者的具体名单pid_filter < -makeFilter(c(“participantid”,“在”,“SUB112841.269; SUB112834.269”))
有关可用操作符的列表,请参见? Rlabkey:: makeFilter
.
年龄在30岁以下的SDY269研究参与者的# HAI数据hai_young < -sdy269$getDataset(“海”,colFilter =young_filter)30岁以下参与者名单demo_young < -所有$getDataset(“人口”,colFilter =young_filter)#两名参与者的ELISPOT检测结果mbaa_pid2 < -所有$getDataset(有关酶联免疫斑点””,colFilter =pid_filter)
注意,过滤是在下载之前完成的。方法进行筛选时,速度更快colfFilter
参数的值小于返回表的值。
ImmuneSpace上的任何数据集网格都提供了在“默认”和“满”之间切换视图的可能性。Default视图包含与用户直接相关的信息。样本描述和结果与基本人口统计相结合。然而,这不是数据在数据库中的组织方式。“Full”视图是数据存储时的一种表示ImmPort.存取列用于连接操作的底层。它们将有助于开发人员和用户编写报告,以显示在免bob电竞体育官网疫空间的研究。
ImmuneSpace上数据集网格按钮栏的屏幕截图。
的original_view
参数决定下载哪个视图。如果设置为真正的
,返回' Full '视图。
[1] "participant_id" "arm_accession" "biosample_accession" "expsample_accession" ## [5] "experiment_accession" "study_accession" ## [7] "study_time_collected" "study_time_collected_unit" ##[9] "病毒" "value_reported" ## [11] "value_preferred" "unit_reported" ## [13] "unit_preferred" ## [13] "unit_preferred"
有关其他信息,请参阅“使用表格数据”视频教程。
正如介绍指南中所解释的那样,ImmuneSpaceConnection
类是一个R6
类。这意味着它的对象具有通过引用访问的字段。因此,可以在不复制整个对象的情况下修改它们。ImmuneSpaceR使用这个特性来存储下载的数据集和表达式矩阵。后续调用getDataset
同样的输入会更快。
看到? R6:: R6Class
参阅有关R6类系统的更多信息。
方法可以查看当前缓存的数据缓存
字段。这并不打算用于数据操作,在这里显示只是为了解释缓存的内容。
## [1] "GE_matrices" " a686d76d73f361f98814f8a7177a3b4 " ## [3] "b1fc871b0317b0835fcd962f804ca1e8" "eca5f7a1d74ad1de545fd45b773f8f68"
不同的视图分别保存。
## [1] "GE_matrices" " a686d76d73f361f98814f8a7177a3b0835fcd962f804ca1e8 " "eca5f7a1d74ad1de545fd45b773f8f68" "ef3cb0b3940dde6bf773a36e93651cc4"
由于过滤器和过滤器组合的数量是无限的,我们不缓存过滤后的数据集。
如果由于任何原因需要重新下载特定数据集,则重新加载
参数将清除特定的缓存getDataset
再次打电话下载表格。
最后,可以清除每个缓存的数据集(和表达式矩阵)。
##[1]“GE_matrices”
再一次,缓存
字段不应手动修改。如果有疑问,只需重新加载数据集。
## R版本3.6.2(2019-12-12)##平台:x86_64-pc-linux-gnu(64位)##运行在:Ubuntu 18.04.3 LTS ## ##矩阵产品:默认## BLAS: /home/biocbuild/bbs-3.10-bioc/R/lib/libRblas。所以## LAPACK: /home/biocbuild/bbs-3.10-bioc/R/lib/libRlapack。所以## ## locale: ## [1] LC_CTYPE=en_US。UTF-8 LC_NUMERIC= c# # [3] LC_TIME=en_US。UTF-8 LC_COLLATE= c# # [5] LC_MONETARY=en_US。utf - 8 LC_MESSAGES = en_US。UTF-8 ## [7] LC_PAPER=en_US。UTF-8 LC_NAME= c# # [9] LC_ADDRESS=C lc_phone = c# # [11] LC_MEASUREMENT=en_US。UTF-8 LC_IDENTIFICATION=C ## ##附加的基本包:## [1]stats graphics grDevices utils datasets methods base ## ##其他附加包:## [1]Rlabkey_2.3.3 jsonlite_1.6 httr_1.4.1 ## [4] ImmuneSpaceR_1.14.1 rmarkdown_2.0 knitr_1.26 ## ##通过命名空间加载(且未附加):## [1] Biobase_2.46.0 viridis_0.5.1 tidyr_1.0.0 ## [4] viridisLite_0.3.0 foreach_1. 8.1 gtools_3.8.1 ## [7] RcppParallel_4.4.4 assertthat_0.2.1 stats4_3.6.2 ## [10] latticeExtra_0.6-29 flowWorkspace_3.34.1 yaml_2.2.0 ## [13] pillar_1.4.3 backports_1.1.5 lattice_0.20-38 ## [19] colorspace_1.3.1 digest_0.6.23 RColorBrewer_1.1-2 ## [22] htmltools_0.4.0 pkgconfig_2.0.3 pheatmap_1.0.12 ## [25] zlibbioc_1.32.0 purrr_0.3.3 flowCore_1.52.1 ## [28][37] hexbin_1.28.0 lazyeval_0.2.2 magrittr_1. 1.5 ## [40] crayon_1.3.4 IDPmisc_1.1.19 heatmaply_1.0.0 ## [46] graph_1.64.0 registry_0.5-1 tools_3.6.2 ## [49] data.table_1.12.8 ncdfFlow_2.32.0 lifecycle_0.1.0 ## [52] matrixStats_0.55.0 string_1 .4.0 plotly_4.9.1 ## [55] munsell_0.5.0 cluster_2.1.0compiler_3.6.2 ## [58] caTools_1.17.1.4 rlang_0.4.2 grid_3.6.2 ## [61] iterators_1.0.12 htmlwidgets_1.5.1 labeling_0.3 ## [64] bitops_1.0-6 codetools_0.2-16 gtable_0.3.0 ## [67] curl_4.3 reshape2_1.4.3 TSP_1.1-7 ## [70] R6_2.4.1 seriation_1.2-8 gridExtra_2.3 ## [73] dplyr_0.8.3 zeallot_0.1.0 KernSmooth_2.23-16 ## [76] dendextend_1.13.2 Rgraphviz_2.30.0 stringi_1.4.5 ## [82] png_0.1-7 gclus_1.3.2 tidyselect_0.2.5 ##