bedtools - 양쪽 base pair 늘리고, 합치기

반응형

 

1. slop: base pair 늘리기

그림 1) bedtools slop

bedtools slop -b 20 -i <file.bed> -g <Genome>

설명: <file.bed>의 모든 영역에 대해 앞, 뒤로 20 base pair 늘리는 명령어 입니다.

 

# 링크: https://bedtools.readthedocs.io/en/latest/content/tools/slop.html

 

* <Genome> 파일은 전체 영역에 대한 bed 영역입니다. 일반적인 bam파일로부터 얻을 수 있습니다.

 

1) Genome 파일 만들기

① 명령어

samtools view -H test.bam | grep LN | head -25

설명: bam 파일의 헤더부분(-H 옵션)중에서 길이 부분중에(grep LN) 25번째 line까지 확인 (미토콘드리아 염색체 길이 포함)

② 결과

사람에 대해 전체 영역에 대한 bed 파일을 첨부드립니다.

all_region.bed
0.00MB

 

2. merge: base pair 합치기

그림 2) bedtools merge

bedtools merge -i <file.bed>

설명: 1. 에서 양쪽이 20 base pair씩 늘어나서 겹쳐지는 부분이 생길텐데, 해당 부분을 합쳐서 겹쳐지는 부분이 없도록 만들어 줍니다.

 

# 링크: https://bedtools.readthedocs.io/en/latest/content/tools/merge.html

 

 

이번엔 bedtools를 활용해 기존의 bed 파일에서 양쪽의 base pair를 늘리고, 겹쳐지는 영역을 합치는 과정을 알아보았습니다.

다음에 더 좋은 글로 찾아오겠습니다.
읽어주셔서 감사합니다.

 

* Reference)

그림 1), 그림 2) : https://bedtools.readthedocs.io/en/latest/index.html#

반응형

'생물정보학 > 생물정보학 Tools' 카테고리의 다른 글

VCF파일 인덱싱하기  (0) 2020.09.14
[Multiqc] Custom Contents  (0) 2020.09.02
Conpair - tumor.bam normal.bam 비교  (0) 2020.08.24
bedtools merge  (0) 2020.07.25
MultiQC  (0) 2020.07.09

댓글

Designed by JB FACTORY