Coding DNA

티스토리 검색엔진 최적화! 구글,네이버 사이트맵 등록! (3분컷)

codingDNA
ETC/블로그
2020.08.08

안녕하세요!! 2020년 4월 27일부로 변경된 티스토리 블로그 사이트맵 등록을 알아보겠습니다. 1. 티스토리 사이트맵 확인 1) 블로그 관리홈에서 블로그 클릭 블로그 관리홈에서 왼쪽 하단에 '관리'에서 '블로그'를 클릭합니다. 2) 사이트맵 주소 확인 스크롤을 내려보시면 주소 설정 부분에 사이트맵 주소가 있습니다. 보통 블로그주소/sitemap.xml 형태입니다. 2. 구글 서치콘솔에 사이트맵 및 RSS 등록하기 아래 링크를 클릭하시면 Google Search Console로 이동합니다. Google Search Console Search Console 도구와 보고서를 사용하면 사이트의 검색 트래픽 및 실적을 측정하고, 문제를 해결하며, Google 검색결과에서 사이트가 돋보이게 할 수 있습니다. se..

[Pandas] str.extract, str.contains 정규표현식 사용

codingDNA
Data Science & Analysis/Pandas
2020.08.06

안녕하세요 저번 포스팅에서 실무에 유용한 pandas의 4가지 기능에 대해 알아보았습니다. 엑셀로 부터 자유로워진다!! 유용한 pandas 기능 4 가지 안녕하세요 저번에 포스팅에서 pydataset라이브러리를 통해 dataset을 가져오는 것을 정리해보았습니다. 2020/07/23 - [python] - pydataset 이란? 700개 이상의 테스트 데이터 library pydataset 이란? 700개 이.. bio-info.tistory.com 이번엔 pandas에서 데이터 프레임의 열에 접근하여 정보를 추출하는 매우 유용한 기능에 대해 알아보겠습니다. 목차 1. 정규표현식이란? 2. str.extract() 3. str.contains() 1. 정규표현식이란? 정규 표현식이란 특정한 조건의 문자..

FASTQ 파일 포맷 : DNA 생(raw) 데이터 정보를 담은 포맷

FASTQ 데이터는 NGS기계에서 추출한 DNA 정보를 '데이터'형태로 보여주는 첫 파일입니다. 즉, FASTQ는 DNA 정보를 담고있는 아무 정제없는 가장 날 것의 데이터 입니다. 1. FASTQ의 구성 FASTQ는 아래 4줄이 반복되는 형태를 갖습니다. @SEQ_ID Sequence + Quality scores 1) 첫 번째 줄 (@SEQ_ID) : 시퀀스 고유 ID로 NGS기기ID와 Cell Line 번호, index 서열 등의 기초정보를 담고 있습니다. 2) 두 번째 줄 (Sequence) : 시퀀싱된 1개 Read의 서열정보를 담고있습니다. (AGCT의 문자로만 이루어 집니다.) 3) 세 번째 줄 (+) : 여기는 항상 +가 있으며 그냥 구분자 입니다. 4) 네 번째 줄 (Quality sco..

[Jupyter Notebook] 예쁘게! 자유롭게! 테마 설정

codingDNA
Programming/Jupyter notebook
2020.08.01

안녕하세요!! 주피터 노트북을 통해 코딩작업을 하다보면 재밌을 때도 있지만, 너무 심심할때가 있습니다. 그럴때 테마를 예쁘게 꾸며주면 기분이 상당히 좋아집니다. 이번에 다룰 내용은 테마 설치하는 법, 테마 종류를 보고, 제가 쓰는 예쁜 테마를 보여드리도록 하겠습니다. 1. 테마 설치하는 법 테마 설치하는 방법은 주피터 노트북에서 아래와 같은 명령어를 치면 됩니다. !pip install jupyterthemes 2. 테마 종류 주피터 노트북의 테마는 총 9가지 입니다. 생각 보다 별로 없죠?? 하지만 하나씩 살펴보면 꽤 많은 듯 보이기도 합니다. (이런 테마는 왜 만들었을까 싶은 테마도 존재합니다.) 테마 종류를 보는 방법은 주피터 노트북에서 아래와 같은 명령어를 치면 볼 수 있습니다. !jt -l jt..

[Pandas] 유용한 pandas 기능 4 가지 (컬럼 순서 변경, insert, loc, Groupby)

codingDNA
Data Science & Analysis/Pandas
2020.07.30

안녕하세요 저번에 포스팅에서 pydataset라이브러리를 통해 dataset을 가져오는 것을 정리해보았습니다. 2020/07/23 - [python] - pydataset 이란? 700개 이상의 테스트 데이터 library pydataset 이란? 700개 이상의 테스트 데이터 library pydataset은 python에서 빠르게 다양한 종류의 dataset에 접근해서 dataframe을 불러오는 라이브러리 입니다. 현재 기준 757개의 데이터셋이 존재합니다. python으로 dataframe을 다룰땐 주로 주피터 노트북에� bio-info.tistory.com 이번엔 iris dataset을 이용하여 유용하고 실무에서 많이 쓰는 pandas 기능 4가지를 통해 데이터 정제를 해보겠습니다. 4 가지 ..

타겟 선별과 NGS 시퀀싱 종류 (WGS, WES, Target-seq)

이전 포스팅 2020/06/23 - [생물정보학] - NGS 기반 DNA data 기본 분석 NGS 기반 DNA data 기본 분석 이전 포스팅 2020/06/18 - [생물정보학] - 생물정보학(Bioinformatics) 회사에서 생물정보학자는 무슨일을 하는지, 현재 제가 하는일은 무엇인지 간단히 알아보았습니다. 이번엔, DNA 데이터가 도착하면 bio-info.tistory.com 에서 NGS 시퀀싱 결과 DNA 기본 분석 알고리즘에 대해 알아보았습니다. 이번 포스팅에선 타겟 선별(Target enrishment)과 타겟의 범위에 따른 DNA 시퀀싱 종류 3가지를 알아보겠습니다. Contents 1. 타켓 선별(Target enrishment) 타켓 선별은 앰플리콘 방식과 캡쳐 방식으로 나뉩니다. ..

[Jupyter Notebook] 확장 기능! Nbextensions

codingDNA
Programming/Jupyter notebook
2020.07.25

Contents 1. Nbextensions 이란? 주피터 노트북 확장 프로그램으로, 실행 시간, 목차, 변수 탐색기 등 기능 사용 가능. 2. Nbextensions 설치 및 사용방법 1) nbextensions 설치 pip install jupyter_nbextensions_configurator jupyter_contrib_nbextensions 주피터 노트북에서 설치할 때는 아래와 같이 앞에 !를 붙여주시면 됩니다. * 실행 화면 2) Nbextensions를 주피터 노트북과 연결 jupyter contrib nbextension install --user jupyter nbextensions_configurator enable --user 주피터 노트북에서 설치할 때는 아래와 같이 앞에 !를 붙..

bedtools merge

1. bedtools merge Input으로 들어온 bed 파일에 대해, 서로 겹치는 영역을 하나로 합쳐주는 기능입니다. 2. 주요 옵션 1) c 옵션: 컬럼 번호를 지정하여, -o 옵션을 수행합니다. 2) o 옵션: Default는 sum 이며 다양한 옵션이 존재합니다. 3. 예시 bedtools merge -i test.bed -c 4 -o collapse > test2.bed * 옵션 설명 -i test.bed : input으로 test.bed를 받는 옵션입니다. -c 4 : test.bed 파일에서 4번째 컬럼(아래 그림에서 Feature 컬럼)에 대해 -o 옵션을 적용합니다. -o collapse : 4번째 컬럼(Feature)에 대해 서로 영역이 합쳐지면, Feature 컬럼의 값이 콤마(,..

pydataset 이란? 700개 이상의 테스트 데이터 library

codingDNA
Data Science & Analysis/Pandas
2020.07.23

Contents pydataset은 python에서 빠르게 다양한 종류의 dataset에 접근해서 dataframe을 불러오는 라이브러리입니다. 현재 기준 757개의 데이터셋이 존재합니다. python으로 dataframe을 다룰 땐 주로 주피터 노트북에서 pandas라는 라이브러리를 사용하게 됩니다. dataframe을 불러오기만 할 때는 pandas가 필요 없으니 실제 사용 예시들과 함께 pydataset에 대해 알아보겠습니다. 깃허브 코드: https://github.com/netsus/pandas_practice/blob/master/pydataset_practice.ipynb 1. 설치 방법 !pip install pydataset 주피터 노트북에서도 앞에 !를 사용함으로써 pip를 통해 툴 설..

일	월	화	수	목	금	토
			1	2	3	4
5	6	7	8	9	10	11
12	13	14	15	16	17	18
19	20	21	22	23	24	25
26	27	28	29	30	31

Coding DNA

전체 글 (203)

Bam/Sam 파일 포맷: 인간유전체 정보를 담은 포맷

[Pandas] Dataframe 비교 - 부분비교와 전체비교

[Python 기초] 자료형

티스토리 검색엔진 최적화! 구글,네이버 사이트맵 등록! (3분컷)

[Pandas] str.extract, str.contains 정규표현식 사용

FASTQ 파일 포맷 : DNA 생(raw) 데이터 정보를 담은 포맷

[Jupyter Notebook] 예쁘게! 자유롭게! 테마 설정

[Pandas] 유용한 pandas 기능 4 가지 (컬럼 순서 변경, insert, loc, Groupby)

타겟 선별과 NGS 시퀀싱 종류 (WGS, WES, Target-seq)

[Jupyter Notebook] 확장 기능! Nbextensions

bedtools merge

pydataset 이란? 700개 이상의 테스트 데이터 library

Copyright © Coding DNA All Rights Reserved

Designed by JB FACTORY

Copyright © Coding DNA All Rights Reserved

Designed by JB FACTORY

티스토리툴바