생물정보학 분야에선 어떤일을 할까?
- 생물정보학/생물정보학 이론
- 2020. 6. 16.
이 글을 쓰는 이유는 회사마다 다르겠지만, 생물정보학 분야에선 어떤일을 하고, 어떤 역량이 요구되는지 제 경험과 더불어 최대한 보편적으로 정리하기 위함입니다.
1. 생물정보학이란?
생물정보학(Bioinformatics)이란 넓은 의미에서 생명과 관련된 데이터를 컴퓨터를 통해 분석하는 학문입니다.
주로 DNA 서열 데이터로부터 유전자 관련 정보를 분석하거나, 아미노산 서열정보 분석부터 단백질의 상호작용 정보를 분석합니다.
생물정보학은 생물학, 컴퓨터 과학, 통계학 등이 융합된 학문입니다.
2. 생물정보학자는 무슨일을 할까?
위에서 설명한 것 처럼 DNA 수준에서 단백질 수준까지, 분자적인 수준에서 컴퓨터를 통하여 데이터를 분석하는 일을 주로 하게됩니다.
3. 현재 하는일은 무엇인가?
저는 맞춤형 의료 분야 내에서 혈액의 DNA로 부터 암이 발생했는지 파악하는 일을 합니다.
조금 더 구체적으로는, 혈액샘플에서 NGS(차세대 염기서열 분석)를 통해 얻은 DNA 서열을 데이터로 변환하고, 해당 데이터에서 암 관련 돌연변이를 찾아 암을 조기진단하는 방향성에서 일을 하고있습니다.
4. 구체적으로 필요한 역량은?
생물정보학 분야는 매우 넓다보니 필요한 역량도 딱 이거다! 라고 정해진게 없습니다. 가장 교집합에 가깝고, 현재 우리나라 생물정보학 회사 대부분에서 필요로 하는 능력을 작성하겠습니다.
생물정보학자는 주로 리눅스라는 운영체제에서 작업을 하게됩니다.
왜냐하면, 생명 정보는 용량이 크고, 데이터를 가공하는 과정에서 많은 자원을 필요로 하다보니 여러명이 사용할 수 있고, 병렬처리에 특화되어있는 리눅스(서버)를 선호합니다.
또한, 파이썬 등의 컴퓨터 언어를 사용하여 리눅스의 툴들이 커버하지 못하는 작업을 직접 코딩하여 처리하다보니 코딩 능력이 필요합니다. 제가 아는 선에선 주로 파이썬을 사용하며, 통계적인 분석을 주로 하는 곳에선 R을 사용하기도 한다고 알고있습니다.
기본적으로 DNA에서 유전자가 발현되고 단백질이 작동하는 분자적 수준에서의 데이터를 다루기 때문에, 분자 생물학, 유전체학 정도의 생물학적 지식이 필요합니다. 분자 생물학에선 센트럴 도그마(Central dogma)라고 하는 DNA에서 RNA를 거쳐 단백질이 되는 원리만 알면 됩니다.
정리하자면, 리눅스의 기초적인 명령어와 쉘 스크립트 작성 능력, 파이썬 등 코딩 능력, 기초적인 센트럴 도그마와 유전체학 지식이 필요합니다.
이번에는 생물정보학 분야에 대해 간단히 알아보고, 취업에 필요한 기초적인 역량을 알아보았습니다.
다음에 더 좋은 글로 찾아오겠습니다.
읽어주셔서 감사합니다.
'생물정보학 > 생물정보학 이론' 카테고리의 다른 글
타겟 선별과 NGS 시퀀싱 종류 (WGS, WES, Target-seq) (0) | 2020.07.28 |
---|---|
Central Dogma(중심원리)란? (4) | 2020.07.02 |
암(Cancer)과 생물정보학(BioInformatics) (1) | 2020.06.25 |
NGS 기반 DNA data 기본 분석 (3) | 2020.06.23 |
생물정보학(Bioinformatics) 회사 (3) | 2020.06.18 |