VCF파일 인덱싱하기

반응형

실행 예시

* Command line

bgzip -c file.vcf > file.vcf.gz
tabix -p vcf file.vcf.gz

vcf파일을 인덱싱하기 위해선, bgzip으로 압축을 한 뒤에, tabix툴을 이용해 인덱싱을 진행합니다. vcf파일은 보통 .gz 형태로 압축을 하기 때문에 bgzip이 사용됩니다. 그 후, tabix에서 -p 옵션의 인자로 vcf를 주고, 인덱싱하고자 하는 vcf파일을 입력으로 주면 아래와 같은 vcf의 인덱싱 파일이 생성됩니다.

* 결과 파일

file.vcf.gz.tbi

 

툴 설치

bgzip 설치

pip install bgzip

 

tabix 설치

conda install -c bioconda tabix

 

반응형

'생물정보학 > 생물정보학 Tools' 카테고리의 다른 글

[Multiqc] Custom Contents  (0) 2020.09.02
Conpair - tumor.bam normal.bam 비교  (0) 2020.08.24
bedtools merge  (0) 2020.07.25
bedtools - 양쪽 base pair 늘리고, 합치기  (3) 2020.07.16
MultiQC  (0) 2020.07.09

댓글

Designed by JB FACTORY