分子的扰动程度可以量化转录组数据样本的异质性。的mdp
获取数据包含至少两个类(控制和测试)和分配一个分数所有样品基于摄动相比,他们是如何控制。基因微扰计算分数为每个基因在每个类。该算法是基于分子距离健康首次实现Pankla et al . 2009。它扩展了该算法通过添加选项使用修改后的z分数计算z分数(使用平均绝对偏差),改变z分数归零阈值,观察基因是最为不安的在测试与控制类。
表达和把数据加载并运行:
库(mdp)数据(example_data) #表达式有基因名字行数据(example_pheno) #把数据需要一个样本列mdp和类。结果< - mdp (data = example_data pdata = example_pheno control_lab =“基线”)# >计算Z分数计算基因分数# # > >计算样本分数# # > >显示异常值样本印刷
示例的分数可以访问sample_scores
mdp的结果。
sample_scores_list < - mdp。结果$ sample_scores #选择样本分数计算使用摄动基因sample_scores < - sample_scores_list [[“perturbedgenes”]]头(sample_scores) # >样本分数类zscore_class离群值# > GSM429248 GSM429248 0.2856816无症状-0.4841953 0 # > GSM429250 GSM429250 0.2868380无症状-0.4752288 0 # > GSM429256 GSM429256 0.1556385无症状-1.4925066 0 # > GSM429258 GSM429258 0.3825081无症状0.2665658 0 # > GSM429260 GSM429260 0.3800601无症状0.2475851 0 # > GSM429266 GSM429266 0.3895684无症状0.3213090 0 sample_plot (sample_scores control_lab =“基线”,title =“不安”)
的mdp
通过波z分数相对于控制样本,这个矩阵的绝对值和设置所有vlaues低于一个阈值(2作为默认)为0。表达式的值不是0摄动。您可以访问这个阈值z分数矩阵,
zscore < - mdp.results zscore美元
对于每个每个类基因,基因分数计算,这是基因的平均阈值z分数值。基因频率计算,这是基因的频率是在一个类中被扰乱。
gene_scores < - mdp。结果美元gene_scores gene_freq < - mdp。结果gene_freq头美元(gene_scores) # >符号基线症状无症状# > HBA2 HBA2 # > HBA1 HBA1 0.1096699 0.2279062 0.0000000 0.1005193 0.5358329 0.0000000 # > ACTB ACTB # > UBB UBB 0.1189312 0.0000000 0.0000000 0.2282284 0.5991647 0.2208631 # > HBB HBB 0.1284082 0.3200307 0.0000000 # > IFITM2 IFITM2 0.0000000 0.0000000 0.0000000
的mdp
排名根据其基因之间的差异基因测试中得分与控制样本。的fraction_genes
选择mdp
函数允许您控制这些排名的基因将被视为最高分数perturbed_genes
。你可以获得一个列表的摄动基因mdp的结果,
perturbed_genes < - mdp.results perturbed_genes美元
样本分数也可以计算在某些genesets基因。的mdp
将接受genesets,以列表的形式(见下面的例子)。你可以阅读.gmt genesets使用的文件fgsea: gmtPathways
函数的fgsea
包中。
file_address < -系统。文件(“extdata”、“ReactomePathways。格林尼治时间”,包= mdp)路径< - fgsea:: gmtPathways mdp (file_address)。结果< - mdp (data = example_data pdata = example_pheno control_lab =“基线”,途径=通路)# >计算Z分数计算基因分数# # > >计算样本分数# # > >显示异常值样本印刷
对于每个通路,信噪比的测试与控制样本分数计算。您可以访问这些结果通路
元素的mdp
结果。
头(mdp.results通路美元)# > Geneset Sig2noise # > 2 perturbedgenes 1.0065522 # > 7干扰素α/β信号0.8140508 # 0.6002146 # > > 8白细胞介素- 6信号3抗原processing-Cross演讲0.5473415 # > 4细胞凋亡0.3819693 # > 11 PI3K sample_scores < - mdp 0.3348710级联。结果$ sample_scores[[“干扰素α/β信号”]]sample_plot (sample_scores control_lab =“基线”,title =“干扰素a / b”)
缺省情况下,mdp
z分数正常化表达式使用中位数作为平均统计数据。标准差是使用平均绝对偏差估计疯了
函数的统计数据
包中。如果你想使用的意思相反,选择“是”。
mdp。结果< - mdp (data = example_data pdata = example_pheno control_lab =“基线”,衡量=“的意思是”)# >计算Z分数计算基因分数# # > >计算样本分数# # > >显示异常值样本印刷
你可以计算阈值z分数使用compute_zscore
函数。一个矢量控制必须提供样品名称。
control_samples < - example_pheno [example_pheno类= =美元“基线”,“Sample”] zscore < - compute_zscore (data = example_data control_samples = control_samples测量=“的意思是”,std = 2)