芝麻提供了一组质量控制步骤。
芝麻QC功能返回sesameqc
可以直接打印到屏幕上的对象。
## ## ======================== ## = = ## ========================================= ##编号探针485577 ##均值(m/u)(频段INFI):5529.506 ## MENAY(m+u)(band infi):11059.01 ## ## ## --Infinium II- ## No.探针:350076(72.095%)##平均强度:5160.813 ## ## ## -Infinium I(红色) - ## No.探针:89203(18.371%)## No.探针一致的通道:88799 ## No. Porbes交换通道:162 ## No.探针低强度:242 ##平均强度(带内):6527.3 ##平均强度(带外):928.2117 ## ###### - 无INFINIUM I(GRN) - ## No.探针:46298(9.535%)## No.探针一致频道:46000 ## No.探针交换通道:254 ## No. No.探针低强度:44 ##平均强度(频段):6394.865 ##平均强度(带外):640.0676 ## ## =============================#= beta values = ## ========================##平均BETA:0.5072937 ##中间Beta:0.6090879 ## ## ## - CG Probes- ## No.探针:482421 ## No. No. probes wi wiTH NA:63563(13.176%)##平均β:0.5098332 ##中位数betas:0.6173473 ##%未甲基化(beta <0.3):40.023%##%甲基化(beta> 0.7)CH探针 - ## No.探针:3091 ## NO NA:581(18.797%)##平均BETA:0.08337478 ## MENTIAN BETAS:0.07236062 ##%unt甲基化(beta <0.3):99.801%## ## ## ## ## ## ## ## ## ## ## ## ##%%甲基化(Beta> 0.7):0.000%## ## - RS探针 - ## No.探针:65 ## NA:0(0.000%)##平均BETA:0.5123969 ## ##中位数Betas:0.5321602 ##%未甲基化(β<0.3):30.769%##%甲基化(β> 0.7):30.769%## ## ## ## =================================================== ## =推理= ## =========================Bisulfite转换(GCT):1.10858
这sesameqc
可以将对象胁迫到data.frame并使用以下代码链接
QC10 < -do.call(rbind,lapply(SSET,功能(X)as.data.frame((sesameqc(X))))QC10$sample_name < -名称(SSET)QC10 [,C(('Mean_beta_cg',,,,'frac_meth_cg',,,,'frac_unmeth_cg',,,,'性别',,,,'年龄')]
## mean_beta_cg frac_meth_cg frac_unmeth_cg sex age ## WB_105 0.5098332 45.96235 40.02335 MALE 57.43640 ## WB_218 0.5096105 47.06082 41.04828 MALE 37.95232 ## WB_261 0.5157003 47.57101 40.73839 MALE 21.93794 ## PBMC_105 0.5180599 46.11539 38.77543 MALE 55.49295 ## PBMC_218 0.5203244 47.78827 39.92857 MALE 38.26392 ## PBMC_2610.5260290 48.75566 39.61534 MALE 18.05454 ## Gran_105 0.4973380 46.31641 43.06686 MALE 60.07713 ## Gran_218 0.4976376 46.47685 43.20653 MALE 39.87609 ## Gran_261 0.5061924 47.36164 42.82382 MALE 23.75574 ## CD4+_105 0.5203645 47.25563 39.20422 MALE 48.97698
背景级别由MANE_OOB_GRN
和MANE_OOB_RED
平均{m,u}强度可以通过MANE_INTMESTY
。同样,可以达到平均M+U强度MANE_INTSICTY_TOTAL
。低强度是低输入或杂交不良的症状。
图书馆(小麦图)p1 < -GGPLOT(QC10)+geom_bar((AES(sample_name,mean_intente),Stat ='身份')+XLAB((“样本名称”)+ylab((“平均强度”)+Ylim((0,,,,18000)+主题((axis.text.x =element_text((角度=90,,,,vjust =0.5,,,,hjust =1))p2 < -GGPLOT(QC10)+geom_bar((AES(sample_name,mean_intenty_total),Stat ='身份')+XLAB((“样本名称”)+ylab((“平均M+U强度”)+Ylim((0,,,,18000)+主题((axis.text.x =element_text((角度=90,,,,vjust =0.5,,,,hjust =1))WGG(P1)+WGG(P2,权())
颜色通道开关的比例可以在Infi_switch_g2r
和Infi_switch_r2g
。这些数字是Infinium I探针如何受SNP诱导的颜色通道切换的影响。
NAS的一部分是由于多种原因,包括检测失败,高背景,推定的低质量探针等。frac_na_cg
和num_na_cg
(CG代表CPG探针,因此我们也有num_na_ch
和num_na_rs
)
p1 < -GGPLOT(QC10)+geom_bar((AES(sample_name,num_na_cg),Stat ='身份')+XLAB((“样本名称”)+ylab((“ NAS数量”)+主题((axis.text.x =element_text((角度=90,,,,vjust =0.5,,,,hjust =1))p2 < -GGPLOT(QC10)+geom_bar((AES(sample_name,frac_na_cg),Stat ='身份')+XLAB((“样本名称”)+ylab((“ NAS(%)的分数”)+主题((axis.text.x =element_text((角度=90,,,,vjust =0.5,,,,hjust =1))WGG(P1)+WGG(P2,权())