为什么?
什么?
库(Biostrings)
头(方法(class =“dnastringset”))
## [1]“!,列表 - 方法”“!=,任何,矢量 - 方法”## [3]“!=,矢量,任何方法”“!=,矢量,矢量方法”## [5]“[,列表 - 方法”[[,列表方法“
方法(通用= " reverseComplement”)
# # # # [1] reverseComplement, DNAString-method [2] reverseComplement, DNAStringSet-method # # [3] reverseComplement, MaskedDNAString-method # # [4] reverseComplement, MaskedRNAString-method # # [5] reverseComplement,矩阵法# # [6]reverseComplement, QualityScaledDNAStringSet-method # # [7] reverseComplement, QualityScaledRNAStringSet-method # # [8]## [10] reversecomplete,XStringViews-method ## see '?方法,用于访问帮助和源代码
DNA,氨基酸和其他生物序列。参见前面的示例01:对R和Biocumon的引入。
Granges()
:基因组坐标以表示注释(外显子,基因,监管标记,...)和数据(称为峰,变体,对齐读数)Grangeslist()
:将基因组坐标分组为列表元素(例如,配对末端;由转录物分组的外显子)开始()
/结尾()
/宽度()
长度()
,子集等。mcols ()
seqinfo.
, 包括seqlevels.
和seqlengths.
转变()
那狭窄的()
那侧面()
那推动者()
那调整()
那限制()
那修剪()
?“范围内 - 方法”
范围()
那减少()
那空白()
那disjoin()
覆盖范围()
(!)?“范围内 - 方法”
findoverlaps()
那倒数()
,......,% / %
那%之内%
那%外部%
;联盟()
那相交()
那setdiff()
那尖锐()
那pintersect()
那psetdiff()
库(GenomicRanges)
GR < - GRANGES(“A”,绞喉(C(10,20,22),宽度= 5),“+”)换档(GR,1)#内部范围内
## Granges对象具有3个范围和0元数据列:## SEQNAMES范围范围STRAND ## ## [1] A 11-15 + ## [2] A 21-25 + ##[3] 23-27 + ## ------- ## SEQINFO:1来自未指定的基因组的序列;没有SEQLENG
范围(gr) # inter-range
## Granges对象具有1个范围和0元数据列:## SEQNAMES范围股线## <铁锯> ## [1] A 10-26 + ## - - - - - ## SEQINFO:1个未指定的基因组的序列;没有SEQLENG
减少(GR)#间位
## seqnames ranges strand ## ## [1] A 10-14 + ## [2] A 20-26 + ## ------- ## seqinfo: 1序列来自一个未指定的基因组;没有SEQLENG
SNPS < - GRANGES(“A”,讽刺(C(11,17,24),宽度= 1))Sopdoverlaps(SNPS,GR)#之间
## queryHits subjectHits ## ## [1] 1 ## [2] 3 2 ## [3] 3 3 ## ------- ## queryLength: 3 / subjectLength: 3
setdiff(范围(gr),gr)#'内含子'
## seqnames ranges strand ## ## [1] A 15-19 + ## ------- ## seqinfo:一个未指定基因组的序列;没有SEQLENG
Coldata()
数据帧用于样品的描述rowranges()
农庄/格拉尔士或用于描述特征的数据帧exptData ()
描述整个对象测定()
可以是任何类似矩阵的对象,包括非常大的磁盘表示,如HDF5Array.库(SummarizedExperiment)库(气管)
数据(气管)气道
##类:范围:umaMarizedexperiment ## Dim:64102 8 ##元数据(1):''##测定(1):Counts ## Rownames(64102):ENSG00000000005 ... LRG_98 LRG_99 ## ROWDATA名称(0):## Colnames(8):SRR1039508 SRR1039509 ... SRR1039520 SRR1039521 ## COLDATA名称(9):SAMPLENAME CELL ...样品生物素
冷酷(呼吸道)
## DataFrame带有8行和9列## Samplename Cell Dex Albut Run Avglength ## ## SRR1039508 GSM1275862 N61311 UNTRTTT SRR1039508 126 ## SRR1039509 GSM1275863N61311 TRT untrt SRR1039509 126 ## SRR1039512 GSM1275866 N052611 untrt untrt SRR1039512 126 ## SRR1039513 GSM1275867 N052611 TRT untrt SRR1039513 87 ## SRR1039516 GSM1275870 N080611 untrt untrt SRR1039516 120 ## SRR1039517 GSM1275871 N080611 TRT untrt SRR1039517 126 ## SRR1039520 GSM1275874 N061011 untrt untrt SRR1039520 101## SRR1039521 GSM1275875 N061011 TRT untrt SRR1039521 98 ##实验试样生物样品## <因子> <因子> <因子> ## SRR1039508 SRX384345 SRS508568 SAMN02422669 ## SRR1039509 SRX384346 SRS508567 SAMN02422675 ## SRR1039512 SRX384349 SRS508571 SAMN02422678 ## SRR1039513 SRX384350 SRS508572 SAMN02422670##SRR1039516 SRX384353 SRS508575 SAMN02422682 ## SRR1039517 SRX384354 SRS508576 SAMN02422673 ## SRR1039520 SRX384357 SRS508579 SAMN02422683 ##SRR1039521 SRX384358 SRS508580 SAMN02422677
头(测定(气道))
## SRR1039508 SRR1039509 SRR1039512 SRR1039513 SRR1039516 ## ENSG00000000003 679 448 873 408 1138 ## 0 ENSG00000000005 0 0 0 0 ## 467 ENSG00000000419 515 621 365 587 ## 260 ENSG00000000457 211 263 164 245 ## 60 ENSG00000000460 55 40 35 78 ## ENSG000000009380 0 0 0 0 0 0 0 0 00 0 0 0 0 0 0
气道[,Airway $ Dex%In%“Trt”]
##类:范围:ummarizedexperiment ## Dim:64102 4 ##元数据(1):''##测定(1):Counts ## Rownames(64102):ENSG00000000005 ... LRG_98 LRG_99 ## ROWDATA名称(0):## Colnames(4):SRR1039509 SRR1039513 SRR1039517 SRR1039517 SRR1039521 ## COLDATA名称(9):SAMPLENAME CELL ...样品生物素
<- as(seqinfo(rowRanges(气道)),"GRanges")["14"]气道[气道%over% chr14,]
##类:范围ummarizedexperiment ## DIM:2244 8 ##元数据(1):''##测定(1):COUNTS ## Rowname(2244):ENSG00000009830 ... ## rowdata名称(0):## Colnames(8):SRR1039508 SRR1039509 ... SRR1039520 SRR1039521 ## GOLDATA名称(9):SAMPLENAME CELL ...样品生物素
该对象允许非常容易地访问测定,例如以确定库大小(每个样本中的映射读数的总数)
COLSUMS(测定(气道))
## SRR1039520SRR1039516 SRR1039516 SRR1039516 SRR1039516 SRR1039516 244448121213039411213039980130SRR1039512121111111111244864121244,611111111119203939512 sr1039516 sr1039516 ######
与非零计数的基因的平均日志数数
图书馆(GGPLOT2)
ridx <- rowsum (assay(气道))> 0 se <-气道[ridx,] ave_log_expr <- rowMeans(log(1 + assay(se))) tbl <- tibble::enframe(ave_log_expr, "gene", "ave_log_expr") ggplot(tbl, aes(ave_log_expr)) + geom_density()
NumericList
和朋友
解释()
/Relist()
快速运营IL =整数(样品(26,5),样品(26,7))IL> 7
##逻辑商长2 ## [[1]]真正的真实真实真实## [[2]]真实真实真为真为false true
任何(il > 7)
## [1]真实
IL [IL> 7]
##长度为2 ## [[1]] 12 26 18 15 9 ## [[2]] 13 16 21 10 17
重新刊登(字母[unlist (il)], il)
##长度为2 ## [[1]] l z r o i ## [[2]] m p u j e a q
DataFrame
长度()
那[
, 和[< -
方法。DataFrame(i = 1:2, il = IntegerList(sample(5), sample(7)), dna = DNAStringSet(c("ATCG", "AAACGGG")), gr = GRanges(c("chr1:1-20", "chr20:10-30"))))
## DataFrame带2行和4列## I IL DNA GR ## ## 1 1 3,4,5,... ATCG CHR1:1-20 ##2 2 6,4,3,... AACGGG CHR20:10-30
例如,GTF:
组件的坐标
7蛋白编码基因27221129 27224842。- . ... ...7蛋白编码转录本27221134 27224835。- - - - - -……7蛋白编码外显子27224055 27224835。- - - - - -……7蛋白编码CDS 27224055 27224763。- 0…7蛋白编码起始密码子27224761 27224763。- 0… 7 protein_coding exon 27221134 27222647 . - . ... 7 protein_coding CDS 27222418 27222647 . - 2 ... 7 protein_coding stop_codon 27222415 27222417 . - 0 ... 7 protein_coding UTR 27224764 27224835 . - . ... 7 protein_coding UTR 27221134 27222414 . - . ...
注释
gene_id“ensg00000005073”;gene_name“hoxa11”;gene_source“ensembl_havana”;gene_biotype“protein_coding”;... ... transcript_id“enst00000006015”;transcript_name“hoxa11-001”;transcript_source“ensembl_havana”;标签“CCD”;ccds_id“ccds5411”;... exon_number“1”; exon_id "ENSE00001147062"; ... exon_number "1"; protein_id "ENSP00000006015"; ... exon_number "1"; ... exon_number "2"; exon_id "ENSE00002099557"; ... exon_number "2"; protein_id "ENSP00000006015"; ... exon_number "2"; ...
进口()
:导入各种格式农庄
和类似的实例export ()
:变换农庄
和类似的类型睡觉,gtf,...库(rtracklayer)
cpgIslands$name <- letters[1:10] cpgIslands$score <- sample(10) cpgIslands
## Granges对象10范围和2个元数据列:## SEQNAMES范围股票|名称得分## <铁锯> | ## [1] Chr7 26549019-26550183 * |A 9 ## [2] CHR7 26564119-26564500 * |B 1 ## [3] CHR7 26585667-26586158 * |C 7 ## [4] CHR7 26591772-26593309 * |D 4 ## [5] CHR7 26594192-26594570 * |E 8 ## [6] CHR7 26623835-26624150 * |F 3 ## [7] CHR7 26659284-26660352 * |G 2 ## [8] CHR7 26721294-26721717 * | h 10 ## [9] chr7 26821518-26823297 * | i 6 ## [10] chr7 26991322-26991841 * | j 5 ## ------- ## seqinfo: 1 sequence from hg19 genome; no seqlengths
bed_file < - tempfile(fileext =“.bed”)baseName(bed_file)
## [1]“file5af33bf55cd0.bed”
出口(CPGISLANDS,BED_FILE)CAT(READLINES(BED_FILE),SEP =“\ n”)
## CHR7 26549018 26550183 A 9。## CHR7 26564118 26564500 B 1。## CHR7 26585666 26586158 C 7。## CHR7 26591771 26593309 D 4。## CHR7 26594191 26594570 e 8。## CHR7 26623834 26624150 F 3。## CHR7 26659283 26660352 G 2。## CHR7 26721293 26721717 H 10。## CHR7 26821517 26823297 I 6。## CHR7 26991321 26991841 J 5。
进口(Bed_file)
## Granges对象10范围和2个元数据列:## SEQNAMES范围股票|名称得分## <铁锯> | ## [1] CHR7 26549019-26550183 * |A 9 ## [2] CHR7 26564119-26564500 * |B 1 ## [3] CHR7 26585667-26586158 * |C 7 ## [4] CHR7 26591772-26593309 * |D 4 ## [5] CHR7 26594192-26594570 * |E 8 ## [6] CHR7 26623835-26624150 * |F 3 ## [7] CHR7 26659284-26660352 * |G 2 ## [8] CHR7 26721294-26721717 * | h 10 ## [9] chr7 26821518-26823297 * | i 6 ## [10] chr7 26991322-26991841 * | j 5 ## ------- ## seqinfo: 1 sequence from an unspecified genome; no seqlengths
gtf < - system.file(package =“airway”,“extdata”,“homo_sapiens.grch37.75_subset.gtf”)导入(gtf)
## GRanges对象有891个范围和16个元数据列:# # # # seqnames范围链|来源< Rle > < IRanges > < Rle > | <因素> # # [1]1 11006528 - 11009808 - | retained_intron # # [2] 1 11007700 - 11009808 - | retained_intron # # [3] 1 11006528 - 11006795 - | retained_intron # # [4] 1 11009681 - 11009871 - | protein_coding # # [5] 1 11009681 - 11009871 - | protein_coding ## ... ... ... ... . ...# # [887] 1 11126678 - 11141274 - | retained_intron # # [888] 1 11126678 - 11159894 - | protein_coding # # [889] 1 11140758 - 11142680 - | processed_transcript # # [890] 1 11166592 - 11322564 - | protein_coding # # [891] 1 11166592 - 11322564 - | protein_coding # #类型分阶段gene_id transcript_id # # <因素> <数字> <整数> <人物> <人物> # #[1]记录< NA > < NA > ENSG00000175262 ENST00000476357 # #[2]外显子< NA > < NA > ENSG00000175262 ENST00000476357 # #[3]外显子< NA > < NA > ENSG00000175262 ENST00000476357 # #[4]外显子< NA > < NA > ENSG00000175262 ENST00000418570 # # [5] cd < NA > 2 ENSG00000175262 ENST00000418570 ## ... ... ... ... ... ...# #[887]记录< NA > < NA > ENSG00000171824 ENST00000474216 # #[888]记录< NA > < NA > ENSG00000171824 ENST00000544779 # #[889]记录< NA > < NA > ENSG00000171824 ENST00000485606 # #[890]基因< NA > < NA > ENSG00000198793 < NA > # #[891]记录< NA > < NA > ENSG00000198793 ENST00000361445 # # gene_name gene_source gene_biotype transcript_name # # ## [1] C1orf127 ensemble哈瓦那protein_coding C1orf127-002 ## [2] C1orf127 ensemble哈瓦那protein_coding C1orf127-002 ## [4] C1orf127 ensemble哈瓦那protein_coding C1orf127-001 ## [5] C1orf127 ensemble哈瓦那protein_coding C1orf127-001 ##…... ... ... ...## [889] EXOSC10 ensemble bl_havana protein_coding EXOSC10-201 ## [889] EXOSC10 ensemble bl_havana protein_coding EXOSC10-011 ## [890] MTOR ensemble bl_havana protein_coding ## [891] MTOR ensemble bl_havana protein_coding MTOR-001 ##转录源exon_number exon_id标签## ## [1] havana ## [2] havana 1 ENSE00001869344 ## [3] havana 2 ENSE00001938325 ## [4] havana 6 ENSE00001262890 mRNA_start_NF ## [5] havana 6 mRNA_start_NF ## ... ... ... ... ... ## [887] havana ## [888] ensembl ## [889] havana ## [890] ## [891] ensembl_havana CCDS ## protein_id ccds_id ## ## [1] ## [2] ## [3] ## [4] ## [5] ENSP00000387816 ## ... ... ... ## [887] ## [888] ## [889] ## [890] ## [891] CCDS127 ## ------- ## seqinfo: 1 sequence from an unspecified genome; no seqlengths
##参见“GenonmicFeatures::makeTxDbFromGFF()”
测序读取:FASTQ文件
@err127302.1703 hwi-eas350_0441:1:1:1460:19184 #0/1 cctgagtgagagtgatcttgatctacgaagagatagatcttgatcgtcgaggaggaggctgaccttgacct + hhghhghhhhhhdgg < gdgge@gdggd b8 ?? adad < be@ee8egdga3cb85 *,77@>> ce ?=896=: @err127302.1704 hwi-eas350_0441:1:1:1460:16861 #0/1 gcggtatgctggaaggtgctcgaatggagagcgccagcgccccggcgctgagccccggcgctgagccccccggcgctgagccccccccggcgctgagccccccccccggcgctgagccccccccccccccccccccccccccccbb0 ed4 > eee > de8eeede8b ? eb <@3;########################
readfastq()
: 输入FastqStreamer ()
:迭代FASTQ文件FastqSampler ()
: FASTQ文件中的样品,例如,用于质量评估对齐读取:BAM文件
标题
@SQ SN:chr1 LN:249250621 @SQ SN:chr10 LN:135534747 @SQ SN:chr11 LN:135006516@SQ SN:chrY LN:59373566 @PG ID:TopHat VN:2.0.8b CL:/home/hpages/ TopHat -2.0.8b。2、tophat -out /ERR127306 /home/hpages/bowtie -2 -2.1.0/indexes/hg19 fastq/ERR127306_1. php -lib -type frunstranded . php -lib -type frunstranded . php -lib -type frunstranded . php -lib -type frunstranded . php -lib -type frunstranded . php -lib -type frunstranded . php -lib -type frunstranded。fastq fastq / ERR127306_2.fastq
对齐:ID,标志,对齐和配偶
ERR127306.7941162 403 CHR14 19653689 3 72M = 19652348 -1413 ... ERR127306.22648137 145 CHR14 19653692 1 72M = 19650044 -3720 ... ERR127306.933914 339 CHR14 19653707 1 66M120N6M = 19653686 -213 ...
对齐:序列和质量
... gaattgatcagtctcatctgagagagtaacttgtacccatcactgattcctttctgactgcctcacttccc *'%%%%%#&&%'''#'&%%%%)&& %% $ %%'%%'&***** $))$)'')'%)))))&)%%%% $'%%%&“))'')%))... ttgatcagtctcatctgagagagtaacttgtacccatcactgattcctttgagactgccactcactcactcacttcccag'****** **** *'*&*********('&)****&***(**'))))())))))))*')&***********)****... TGAGAGTAACTTTGTACCATCACTGATTCCTTCTGAGACTGCCTCCACTTCCCCCAGCCTCTGGTTTCT' ******&%)&))))&“)')'''''''''*((******&)和'')'))$))'')&))$)** && ****************
对齐:标签
...作为:I:0:0 XN:I:0 XM:I:0 XO:I:0 XG:I:0 NM:I:0 MD:Z:72 YT:Z:UU NH:I:2 CC:Z:IC:I:16189276嗨:I:0 ...如下:I:I:0 XN:I:0 XO:I:0 XO:I:0 XG:I:0 NM:I:0 MD:Z:72 YT:Z:UU NH:I:3 CC:Z:= CP:I:19921600嗨:I:0 ...如:I:0:0 XN:I:0 XM:I:0 XO:0 XG:i:0 nm:i:4 md:z:72 yt:z:uu xs:a:+ nh:i:3 cc:z:z:= cp:i:19921465嗨:i:0 ...如:我:0 xn:i:0 xm:i:0 xo:i:0 xg:i:0 nm:i:0 nm:i:4 md:z:72 yt:z:uu xs:a:+ nh:i:2 cc:z:CHR22 CP:I:16189138嗨:I:0
ReadGalignments()
:单端读取readgalignmentPairs()
那readGAlignmentsList ()
:配对结束读取图书馆(基因组)
##加载所需的包:Rsamtools
FLS < - dir(system.file(package =“airway”,“extdata”),pattern =“bam”,full.names = true)ReadGalignments(FLS [1])
## Galignments对象具有14282对齐和0元数据列:## SEQNAMES Strand STICH QWIDTH开始结束## <字符> <整数> <整数> <整数> ## [1] 1 + 63m 63 1105377311053835 ## [2] 1 - 63M 63 11053840 11053902 ## + 63m 63 11067866 11067928 ## [4] 1 - 63M 63 11067931 11067993 ## [5] 1 + 63M 63 11072708 11072770#... ... ... ... ## [14278] 1 - 6364795 ## [14279] 1 + 63M 63 11365866 11365928#1 - 63M 63 1136598711366049 ## [14281] 1 + 2S61M 63 11386063 11386123 ## - 63M 63 11386132 11386194 ##宽度njunc ## <整数> <整数> ## [1] 63 0 ## [2] 63 0##[3] 63 0 ## [4] 63 0 ## ... ... ... ## [14278 [14279] 63 0 ## [14280] 63 0 ## [14280]63 0 ## [14281] 61 0 ## [14282] 63 0 ## ------- ## SEQINFO:来自未指定基因组的84个序列
标题
##fileformat=VCFv4.2 ##fileDate=20090805 ##source=myImputationProgramV3.1 ##reference=file:///seq/references/ 1000genomespillot - ncbi36。fasta ##contig= ##phasing=partial ##INFO= ##INFO=…##FILTER= ##FILTER=…# #格式= < ID = GT,数量= 1 =字符串类型,描述=“基因型”> # #格式= < ID =《GQ》、数量= 1 =整数类型,描述=“基因型质量”>
地点
#CHROM POS ID REF ALT QUIL FILTER ... 20 14370 RS6054257 G A 29 PASS ... 20 17330。T A 3 Q10 ... 20 1110696 RS6040355 A G,T 67通过...
变异信息
#铬POS……信息…14370……NS = 3; DP = 14;房颤= 0.5;数据库;H2…17330……NS = 3; DP = 11;房颤= 0.017……20 1110696…NS = 2, DP = 10;房颤= 0.333,0.667;AA = T; DB……
格式和样本
... POS ...格式NA00001 NA00002 NA00003 ... 14370 ... GT:GQ:DP:HQ 0 | 0:48:1:51,51 1 | 0:48:8:51,51 1/1:43:5:。,。... 17330 ... GT:GQ:DP:HQ 0 | 0:49:3:58,50 0 | 1:3:5:65,3 0/0:41:3 ... 1110696 ......GT:GQ:DP:HQ 1 | 2:21:6:23,27 2 | 1:2:0:18,2:2/2:35:4
readvcf()
:VCF输入ScanVcfParam ()
:将输入限制为必要的字段/范围vcffile()
:通过大VCF文件索引和迭代locatevariants()
:与基因等相关;也可以看看ensemblVEP那变型滤波器filterVcf ()
:灵活的过滤示例:BAM文件
Scanbamparam()
:限制输入Bamfile(,ErysionSize =)
:迭代DreambyByield()
限制输入:
图书馆(基因组)
fl < - dir(system.file(package =“airway”,“extdata”),pattern =“bam”,full.name = true)fl [1]
## [1]“/users/ma38727/library/r/3.6/bioc/3.10/airway/extdata/srr1039508_subset.bam”
Readgalignments(FL [1])
## Galignments对象具有14282对齐和0元数据列:## SEQNAMES Strand STICH QWIDTH开始结束## <字符> <整数> <整数> <整数> ## [1] 1 + 63m 63 1105377311053835 ## [2] 1 - 63M 63 11053840 11053902 ## + 63m 63 11067866 11067928 ## [4] 1 - 63M 63 11067931 11067993 ## [5] 1 + 63M 63 11072708 11072770#... ... ... ... ## [14278] 1 - 6364795 ## [14279] 1 + 63M 63 11365866 11365928#1 - 63M 63 1136598711366049 ## [14281] 1 + 2S61M 63 11386063 11386123 ## - 63M 63 11386132 11386194 ##宽度njunc ## <整数> <整数> ## [1] 63 0 ## [2] 63 0##[3] 63 0 ## [4] 63 0 ## ... ... ... ## [14278 [14279] 63 0 ## [14280] 63 0 ## [14280]63 0 ## [14281] 61 0 ## [14282] 63 0 ## ------- ## SEQINFO:来自未指定基因组的84个序列
## hack:索引BAM文件就地隐形(INDEXBAM(FL [1]))(C(“1:11053773-11072770”,“,”,“)参数< - ScanBamparam(哪个=哪个,什么=“SEQ”)Readgalignments(FL [1],Param = Param)
## GAlignments对象有86个对齐和1个元数据列:# # seqnames链雪茄qwidth开始结束宽度# # < Rle > < Rle > <人物> <整数> <整数> <整数> <整数> # # [1]1 + 63 63 11053773 11053835 63 # # [2]1 - 63 63 11053840 11053902 63 # # [3]1 + 63 63 11067866 11067928 63 # # [4]1 - 63 63 11067931 11067993 63 # # [5]1 + 63 63 11072708 11072770 63 ## ... ... ... ... ... ... ... ...# # [82] 1 - 63 63 11364733 11364795 63 # # [83] 1 + 63 63 11365866 11365928 63 # # [84] 1 - 63 63 11365987 11366049 63 # # [85] 1 + 2 s61m 63 11386063 11386123 61 # # [86] 1 - 63 63 11386132 11386194 63 # # njunc | seq # # <整数> | < DNAStringSet > # # [1] 0 | ATACAAAAAT……## [2] 0 | agaatcactt…Tgcactccag ## [3] 0 | ctaaaaacat…Ttactttatt ## [4] 0 | tttattactt…Acctccgcca ## [5] 0 | gccatttgt…TTCGGTGTCC ## ... ... . ...## [82] 0 | ccccggccca…Gtgtgggaag ## [83] 0 | ctcctcactt…agacagggcg# # [84] 0 | tcacctccca…GGGGCGGCGG ## [85] 0 | gggcagtgca…Ttgggccaaa ## [86] 0 | ttctcgggt…来自一个未指定基因组的84个序列
迭代:
bf < - bamfile(fl [1],failitsize = 5000)打开(bf)重复{galn < - readgalignments(bf)if(长度(galn)== 0)break ##做工作消息(长度(galn))}
## 5000 ## 5000
## 4282
关闭(BF)
sessionInfo ()
## R版本3.6.0修补(2019-04-26 R76431)##平台:X86_64-Apple-Darwin17.7.0(64位)##正在运行:Macos High Sierra 10.13.6 ####矩阵产品:默认## blas:/users/ma38727/bin/r-3-6-branch/lib/liblblas.dylib ## lapack:/users/ma38727/bin/r-3-6-branch/lib/librlapack.dylib### locale:## [1] en_US.UTF-8 / en_US.UTF-8 / EN_US.UTF-8 / C / EN_US.UTF-8 / EN_US.UTF-8 ## ##附加基础包:##[1] stats4并行统计图形grdevices utils数据集## [8]方法基础#####其他附加包:## [1] Genomicalign_1.21.4 RsamTools_2.1.2 ## [3] rtracklayer_1.45.1 ggplot2_3.2.0 ##[5] Airway_1.5.0概述_1.15.5 ## [7] DelayedArray_0.11.2 BiocParlall_1.1.19.0 ## [9] MatrixStats_0.54.0 BioBase_2.45.0 ## [11] GenomicRanges_1.37.14 GenomeinfodB_1.21.1 ## [13] BioStrings_2.53.0xvector_0.25.0 ## [15] iRANGES_2.19.10 S4Vectors_0.23.17 ## [17] biocgenerics_0.31.4 biocstyle_2.13.2 ## ##通过命名空间加载(且未附加):## [1] tidySelect_0.2.5 xfun_0.8 purrr_0.3.2 ## [4] lattice_0.20-38 colorspace_1.4-1 htmltools_0.3.6 ## [7] yaml_2.2.0 xml_3.98-1.20 rlang_0.4.0 ## [10] Pillar_1.4.2 Glue_1。3.。1withr_2.1.2 ## [13] GenomeInfoDbData_1.2.1 stringr_1.4.0 zlibbioc_1.31.0 ## [16] munsell_0.5.0 gtable_0.3.0 codetools_0.2-16 ## [19] evaluate_0.14 labeling_0.3 knitr_1.23 ## [22] Rcpp_1.0.1 scales_1.0.0 BiocManager_1.30.5.1 ## [25] digest_0.6.19 stringi_1.4.3 bookdown_0.11 ## [28] dplyr_0.8.2 grid_3.6.0 tools_3.6.0 ## [31] bitops_1.0-6 magrittr_1.5 RCurl_1.95-4.12 ## [34] lazyeval_0.2.2 tibble_2.1.3 crayon_1.3.4 ## [37] pkgconfig_2.0.2 Matrix_1.2-17 assertthat_0.2.1 ## [40] rmarkdown_1.13 R6_2.4.0 compiler_3.6.0