《创世纪》提供了统计方法分析基因的数据样本与人口结构和/或家族亲缘。这个描述提供了一个描述如何使用《创世纪》推断人口结构,以及估算亲缘等措施亲属关系系数,由血统(IBD)共享概率身份,近亲繁殖系数。创世纪使用pc航空人口结构推断这是健壮的已知或含糊不清的关系,而且它使用PC-Relate亲缘准确估计的人口结构,admixutre,偏离哈迪温伯格平衡。
的功能《创世纪》
包从读取基因型数据GenotypeData
类对象创建的GWASTools
包中。通过使用GWASTools
,一个GenotypeData
可以很容易地创建类对象:
R代码创建一个示例GenotypeData
下面是对象。可以找到更多的细节GWASTools
包参考手册。
基因族群< -MatrixGenotypeReader(基因型=基因型,snpID =snpID,染色体=染色体,位置=的位置,scanID =scanID genoData < -)GenotypeData(基因工程)
基因型
是一个矩阵编码的基因型值0 / 1 / 2,行索引SNPs和列索引样品在哪里snpID
是一个整数向量独特的SNP id染色体
是一个整数向量指定每个SNP的染色体位置
是一个整数向量指定每个SNP的位置scanID
是一个向量独特的个人id基因族群< -GdsGenotypeReader(文件名=“genotype.gds”)genoData < -GenotypeData(基因工程)
文件名
文件路径到GDS对象吗的SNPRelate
包提供了snpgdsBED2GDS
函数将二进制叮铃声文件转化为一个GDS文件。
snpgdsBED2GDS(bed.fn=“genotype.bed”,bim.fn=“genotype.bim”,fam.fn=“genotype.fam”,out.gdsfn=“genotype.gds”)
bed.fn
是文件路径的叮铃声请全部文件bim.fn
是文件路径的叮铃声.bim文件fam.fn
是文件路径的叮铃声.fam文件out.gdsfn
GDS的输出文件的文件路径吗一旦叮铃声文件被转换为GDS文件,然后一个GenotypeData
对象可以创建如上所述。
演示pc航空和PC-Relate分析《创世纪》
包,我们分析SNP数据从墨西哥裔美国人在洛杉矶,加州(MXL)和非裔美国人在美国西南部(ASW)人口样本的人类基因组单体型图3所示。墨西哥裔美国人,非洲裔美国人有不同祖先的背景,和家庭亲属存在于这些数据。20 k常染色体单核苷酸多态性基因型数据的一个子集为173人提供一个GDS文件。
#读GDS数据gdsfile < -执行(“extdata”,“HapMap_ASW_MXL_geno.gds”,包=“创世纪”)HapMap_geno < -GdsGenotypeReader(文件名=gdsfile)#创建一个GenotypeData类对象HapMap_genoData < -GenotypeData(HapMap_geno) HapMap_genoData
# #的对象类GenotypeData # # |数据:# #文件:/ tmp / RtmpaHIlQO / Rinst50b55d9b81a0创世纪/ extdata / HapMap_ASW_MXL_geno。gds (923.5 KB) # # +[] * # # | - +样品。173邮政id {Int32,因素(40.90%),283字节}* # # | - + snp。id {Int32 20000邮政(34.64%),27.7 KB} # # | - + snp。位置{ Int32 20000 ZIP(34.64%), 27.7 KB } ## |--+ snp.chromosome { Int32 20000 ZIP(0.13%), 103 bytes } ## |--+ genotype { Bit2 20000x173, 865.0 KB } * ## | SNP Annotation: ## NULL ## | Scan Annotation: ## NULL
Conomos议员,Miller M.B., & Thornton T.A. (2015). Robust Inference of Population Structure for Ancestry Prediction and Correction of Stratification in the Presence of Relatedness. Genetic Epidemiology, 39(4), 276-293.
Gogarten,克里Bhangale, T。,Conomos, M.P., Laurie, C.A., McHugh, C.P., Painter, I., … & Laurie, C.C. (2012). GWASTools: an R/Bioconductor package for quality control and analysis of Genome-Wide Association Studies. Bioinformatics, 28(24), 3329-3331.
Manichaikul,。,Mychaleckyj, J.C., Rich, S.S., Daly, K., Sale, M., & Chen, W.M. (2010). Robust relationship inference in genome-wide association studies. Bioinformatics, 26(22), 2867-2873.