bedtools - 양쪽 base pair 늘리고, 합치기
- 생물정보학/생물정보학 Tools
- 2020. 7. 16.
반응형
1. slop: base pair 늘리기
bedtools slop -b 20 -i <file.bed> -g <Genome>
설명: <file.bed>의 모든 영역에 대해 앞, 뒤로 20 base pair 늘리는 명령어 입니다.
# 링크: https://bedtools.readthedocs.io/en/latest/content/tools/slop.html
* <Genome> 파일은 전체 영역에 대한 bed 영역입니다. 일반적인 bam파일로부터 얻을 수 있습니다.
1) Genome 파일 만들기
① 명령어
samtools view -H test.bam | grep LN | head -25
설명: bam 파일의 헤더부분(-H 옵션)중에서 길이 부분중에(grep LN) 25번째 line까지 확인 (미토콘드리아 염색체 길이 포함)
② 결과
사람에 대해 전체 영역에 대한 bed 파일을 첨부드립니다.
2. merge: base pair 합치기
bedtools merge -i <file.bed>
설명: 1. 에서 양쪽이 20 base pair씩 늘어나서 겹쳐지는 부분이 생길텐데, 해당 부분을 합쳐서 겹쳐지는 부분이 없도록 만들어 줍니다.
# 링크: https://bedtools.readthedocs.io/en/latest/content/tools/merge.html
이번엔 bedtools를 활용해 기존의 bed 파일에서 양쪽의 base pair를 늘리고, 겹쳐지는 영역을 합치는 과정을 알아보았습니다.
다음에 더 좋은 글로 찾아오겠습니다.
읽어주셔서 감사합니다.
* Reference)
그림 1), 그림 2) : https://bedtools.readthedocs.io/en/latest/index.html#
반응형
'생물정보학 > 생물정보학 Tools' 카테고리의 다른 글
VCF파일 인덱싱하기 (0) | 2020.09.14 |
---|---|
[Multiqc] Custom Contents (0) | 2020.09.02 |
Conpair - tumor.bam normal.bam 비교 (0) | 2020.08.24 |
bedtools merge (0) | 2020.07.25 |
MultiQC (0) | 2020.07.09 |