VCF파일 인덱싱하기
- 생물정보학/생물정보학 Tools
- 2020. 9. 14.
반응형
* Command line
bgzip -c file.vcf > file.vcf.gz
tabix -p vcf file.vcf.gz
vcf파일을 인덱싱하기 위해선, bgzip으로 압축을 한 뒤에, tabix툴을 이용해 인덱싱을 진행합니다. vcf파일은 보통 .gz 형태로 압축을 하기 때문에 bgzip이 사용됩니다. 그 후, tabix에서 -p 옵션의 인자로 vcf를 주고, 인덱싱하고자 하는 vcf파일을 입력으로 주면 아래와 같은 vcf의 인덱싱 파일이 생성됩니다.
* 결과 파일
file.vcf.gz.tbi
툴 설치
pip install bgzip
conda install -c bioconda tabix
반응형
'생물정보학 > 생물정보학 Tools' 카테고리의 다른 글
[Multiqc] Custom Contents (0) | 2020.09.02 |
---|---|
Conpair - tumor.bam normal.bam 비교 (0) | 2020.08.24 |
bedtools merge (0) | 2020.07.25 |
bedtools - 양쪽 base pair 늘리고, 합치기 (3) | 2020.07.16 |
MultiQC (0) | 2020.07.09 |