内容

1版本信息

R版本:R版本4.2.0 RC(2022-04-19 R82224)
生物导体版本:3.15
软件包版本:1.20.0

2设置:NHGRI GWAS目录作为基于HG38的Granges

图书馆(Gwascat)cur = makecurrentgwascat()#结果随着一天而变化
数据(CUR)CUR
## GWASLOC实例,具有65795记录和37个属性。##提取:2018-04-24 ##基因组:GRCH38 NA ##摘录:## Granges对象,带5个范围和3个元数据列:## Seqnames Ranges strand |疾病/特质SNP p-value ##    |  <数字> ## [1] 17 78284479 * |炎症皮肤DI .. RS9302874 2E-07 ## [2] 10 129683009 * |炎症皮肤DI .. RS80312298 6E-07 ## [3] 1 247490110 * |炎症皮肤DI .. RS10802516 6E-06 ## [4] 2 60845432 * |炎症皮肤DI .. RS35741374 4E-12 ## [5] 1 152619805 * |炎症皮肤DI .. RS1581803 2E-12 ## -------- ## Seqinfo:24个来自2个基因组的序列(GRCH38,NA)

3资源:HG38到HG19转换的链文件

对HG19坐标的转换由UCSC提供的链文件定义。rtracklayer :: import.Chain将将数据带入R。

库(rtracklayer)path = system.file(package =“ liftover”,“ extdata”,“ hg38tohg19.over.chain”)ch = import.chain(path)chain(路径)ch
##长度链25 ##名称(25):CHR22 CHR21 CHR19 CHR20 CHRY CHR18 ... CHR6 CHR5 CHR4 CHR3 CHR3 CHR2 CHR1
str(ch [[1]])
##正式类'Chainblock'[package“ rtracklayer”]带6个插槽## ..@ ranges:正式班级'iranges'[package'iranges'],带6个插槽## .. .. .. .. .. .. ..@ start:int:int [int [int [1:6842] 16367189 16386933 16386970 16387001 16387128 16395491 16395528 16395841 16395860 16395956 ... ## .. .. ..@ width : int [1:6842] 19744 36 31 112 8362 36 312 18 95 33 ... ## .. .. ..@ NAMES : NULL ## .. .. ..@ elementType : chr "ANY" ## .. .. ..@ elementMetadata: NULL ## .. .. ..@ metadata : list() ## ..@ offset : int [1:6842] -480662 -480702 -480702 -480726 -480726 -480726 -480726 -480726 -480726 -480726 ... ## ..@ score : int [1:1168] -1063867308 68830488 21156147 20814926 7358950 3927744 2928210 991419 880681 802146 ... ## ..@ space : chr [1:1168] "chr22" "chr14" "chr22" "chr21" ... ## ..@ reversed: logi [1:1168] FALSE FALSE FALSE FALSE FALSE FALSE ... ## ..@ length : int [1:1168] 1124 1280 173 465 398 110 43 173 342 84 ...

有关链数据结构的更多详细信息可在import.chain man页面中找到

链文件本质上详细介绍了许多本地对齐,因此“从”范围到映射到另一个序列中的重叠区域。“从”范围保证是不相交的(但不一定涵盖“从“序列”)。

4动作:举重

提升功能将创建一个Grangeslist。

seqlevelsstyle(cur)=“ ucsc”#必要的cur19 = liftover(cur,ch)类(cur19)
## [1]“ compressedgrangeslist” ## attr(“ package”)## [1]“ genomicranges”

我们不属于GWASWLOC班级,这是GWAS目录中带有许多MCOL领域的方便形式。

cur19 = unlist(cur19)基因组(cur19)=“ hg19” cur19 = new(“ gwaswloc”,cur19)cur19
## GWASLOC实例,具有65757记录和37个属性。##提取:## Genome:HG19 ##摘录:## Granges对象,带有5个范围和3个元数据列:## seqnames ranges strand |疾病/特质SNP p-value ##    |  <数字> ## [1] Chr17 76280560 * |炎症皮肤DI .. RS9302874 2E-07 ## [2] CHR10 131481273 * |炎症皮肤DI .. RS80312298 6E-07 ## [3] CHR1 247653412 * |炎症皮肤DI .. RS10802516 6E-06 ## [4] CHR2 61072567 * |炎症皮肤DI .. RS35741374 4E-12 ## [5] CHR1 152592281 * |炎症皮肤DI .. RS1581803 2E-12 ## -------- ## Seqinfo:HG19基因组的24个序列;没有seqlength

我们看到翻译导致了一些基因座的丧失。

长度(cur) - 长度(cur19)
## [1] 38
SetDiff(McOLS(CUR)$ SNP,MCOLS(CUR19)$ SNP)
## [1]“ RS757210”“ RS80644454”“ RS386000”“ RS644148”“ RS9876781” rs9876781“ ## [6] RS1167796“” RS649129“ RS649129” RS1167269116672691“ RS11672691”" "rs147767607" "rs148916504" "rs149506335" ## [16] "rs192514996" "rs2734221" "rs2855983" "rs4457242" "rs7777677" ## [21] "rs201386833" "rs3757378" "rs400942" "rs11263761" "rs8176645"## [26]“ RS11785400”“ RS451000”“ RS450937”“ RS12601991”“ RS7256693” ## [31] RS3020736“ RS453755”

可能很有趣跟进一些损失。