本篇內(nèi)容主要講解“GATK BQSR的作用是什么”,感興趣的朋友不妨來看看。本文介紹的方法操作簡單快捷,實用性強。下面就讓小編來帶大家學(xué)習(xí)“GATK BQSR的作用是什么”吧!
超過10年行業(yè)經(jīng)驗,技術(shù)領(lǐng)先,服務(wù)至上的經(jīng)營模式,全靠網(wǎng)絡(luò)和口碑獲得客戶,為自己降低成本,也就是為客戶降低成本。到目前業(yè)務(wù)范圍包括了:成都網(wǎng)站制作、成都網(wǎng)站設(shè)計,成都網(wǎng)站推廣,成都網(wǎng)站優(yōu)化,整體網(wǎng)絡(luò)托管,小程序定制開發(fā),微信開發(fā),APP應(yīng)用開發(fā),同時也可以讓客戶的網(wǎng)站和網(wǎng)絡(luò)營銷和我們一樣獲得訂單和生意!
BQSR 全稱叫做 Base Quality Score Recalibration, 可以理解為堿基質(zhì)量校正。對于變異位點的鑒定,堿基質(zhì)量是非常重要的。比如測序識別到的一個位點,其堿基和參考基因組上的堿基不同,但是其質(zhì)量值特別低,此時可以認為是一個測序錯誤,而不是一個SNP位點。
在測序的原始數(shù)據(jù)中,本身就提供了每個堿基對應(yīng)的質(zhì)量值,但是GATK官方認為測序儀提供的堿基質(zhì)量值,是不準確的,存在誤差的。
某個位點前后的堿基的種類,稱之為上下文環(huán)境,會對這個堿基的質(zhì)量值產(chǎn)生影響。對于A,T,C,G 4種堿基,共有4 x 4 =16 種上下文環(huán)境,左側(cè)的圖是利用fastq文件中測序儀給出的堿基質(zhì)量值做的圖,可以看到,對于不同的上下文環(huán)境,堿基質(zhì)量值分布不同;右圖為經(jīng)過BQSR校正之后,不同上下文環(huán)境中堿基質(zhì)量的分布。可以看到,校正之后,不同的上下文環(huán)境的堿基質(zhì)量分布基本相同。也就是說,BQSR消除了上下文環(huán)境對堿基質(zhì)量的影響。

在堿基質(zhì)量校正時,主要考慮下列3個因素:
堿基在reads中的位置
堿基的上下文環(huán)境
堿基原始的質(zhì)量值
根據(jù)這3這個因素,首先計算出原始堿基質(zhì)量中錯誤的分布模型,然后利用這個模型對堿基質(zhì)量校正,生成新的堿基質(zhì)量值。
執(zhí)行BQSR分析包含以下三步
命令如下
gatk BaseRecalibrator \
-R ${ref_fasta} \
-I ${input_bam} \
--use-original-qualities \
-O ${recalibration_report_filename} \
--known-sites ${dbSNP_vcf} \
--known-sites ${sep=" --known-sites " known_indels_sites_VCFs}在計算的過程中, 不考慮已知的變異位點的堿基質(zhì)量,--known-sites指定已知變異位點對應(yīng)的vcf文件。這一步對單個樣本進行操作,每個樣本生成一個錯誤模型文件。
命令如下
gatk GatherBQSRReports \
-I ${sep=' -I ' input_bqsr_reports} \
-O ${output_report_filename}命令如下:
gatk ApplyBQSR \
-R ${ref_fasta} \
-I ${input_bam} \
-O ${output_bam_basename}.bam \
-bqsr ${recalibration_report} \
--static-quantized-quals 10 --static-quantized-quals 20 --static-quantized-quals 30 \
--add-output-sam-program-record \
--create-output-bam-md5 \
--use-original-qualitiesBQSR會對輸入的bam文件中的堿基質(zhì)量值進行替換,替換為校正之后的質(zhì)量值,而原先的質(zhì)量值保存在OQtag 中,示意圖如下

到此,相信大家對“GATK BQSR的作用是什么”有了更深的了解,不妨來實際操作一番吧!這里是創(chuàng)新互聯(lián)網(wǎng)站,更多相關(guān)內(nèi)容可以進入相關(guān)頻道進行查詢,關(guān)注我們,繼續(xù)學(xué)習(xí)!
本文名稱:GATKBQSR的作用是什么
本文路徑:http://chinadenli.net/article20/gdjpco.html
成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供小程序開發(fā)、自適應(yīng)網(wǎng)站、動態(tài)網(wǎng)站、網(wǎng)站設(shè)計公司、企業(yè)網(wǎng)站制作、搜索引擎優(yōu)化
聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請盡快告知,我們將會在第一時間刪除。文章觀點不代表本網(wǎng)站立場,如需處理請聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時需注明來源: 創(chuàng)新互聯(lián)