<aside> 💡 Vaex 활용한 유전체 데이터 분석
Vaex는 대용량 데이터 셋을 다루기 위한 파이썬 라이브러리
메모리에 로딩 하지 않고도 처리 가능, 수십 기가바이트 유전체 데이터셋도 효율적으로 다룰 수 있음
데이터 필터링, 컬럼 기반 연산, 그룹화 및 집계 등 효율적으로 수행
시각화 도구 제공
</aside>
<aside> 💡 유전체 데이터 전처리
데이터 불러오기
유전체 데이터는 일반적으로 텍스트 파일 저장
데이터 읽어온 후에 정제
결측치 처리
이상치와 중복 데이터 제거도 이루어져야 함
데이터 변환
dna 서열 숫자로 변환하는 작업 수행해야 함
데이터 저장
write() 함수를 이용하여 데이터를 텍스트 파일에 저장 가능
</aside>
<aside> 💡 유전체 데이터 분석 기본 용어
유전체 데이터 분석 (1). 대부분의 내용을 [유전체데이터분석 -김주한 지음]에서 참고하였음을… | by 김병하 | 휴먼스케이프 기술 블로그 | Medium
</aside>
<aside> 💡 유전체 데이터 분석 과정
<aside> 💡 유전체 데이터 METHOD
순차적인 데이터 처리 딥 러닝 알고리즘
유전체 데이터 → DNA 염기서열로 표현 → (시퀀스 데이터)
시퀀스 데이터 → RNN입력하여 처리
GAN
</aside>