안녕하세요 저번 포스팅에서는 DNA를 직접 NGS기기에 넣어 나오는 생(raw) 데이터 FASTQ에 대해서 알아보았습니다. FASTQ : DNA 생(raw) 데이터!! 완벽 정리 FASTQ 데이터는 NGS기계에서 추출한 DNA 정보를 '데이터'형태로 보여주는 첫 파일입니다. 즉, FASTQ는 DNA 정보를 담고있는 아무 정제없는 가장 날 것의 데이터 입니다. 1. FASTQ의 구성 FASTQ는 아래 4줄이 bio-info.tistory.com 이번엔 이 FASTQ 데이터의 다음 단계인 Bam/Sam 파일이 뭔지, 어떻게 쓰이는건지 알아보겠습니다. Bam 파일을 이해하려면 FASTQ 데이터를 알아야 합니다. FASTQ 데이터는 read라고 불리는 매우 짧은 서열(50~200bp)들로 구성된 파일입니다. 보..
이 글을 쓰는 이유는 회사마다 다르겠지만, 생물정보학 분야에선 어떤일을 하고, 어떤 역량이 요구되는지 제 경험과 더불어 최대한 보편적으로 정리하기 위함입니다. 1. 생물정보학이란? 생물정보학(Bioinformatics)이란 넓은 의미에서 생명과 관련된 데이터를 컴퓨터를 통해 분석하는 학문입니다. 주로 DNA 서열 데이터로부터 유전자 관련 정보를 분석하거나, 아미노산 서열정보 분석부터 단백질의 상호작용 정보를 분석합니다. 생물정보학은 생물학, 컴퓨터 과학, 통계학 등이 융합된 학문입니다. 2. 생물정보학자는 무슨일을 할까? 위에서 설명한 것 처럼 DNA 수준에서 단백질 수준까지, 분자적인 수준에서 컴퓨터를 통하여 데이터를 분석하는 일을 주로 하게됩니다. 3. 현재 하는일은 무엇인가? 저는 맞춤형 의료 분야..