지도학습 방법을 이용한 Variant Filtering
- 김유진 김혜진 송예진
- 2023년 11월 11일
- 1분 분량
최종 수정일: 2023년 11월 14일
팀명
NewGenes
팀원 명단
김유진 김혜진 송예진
지도교수
김경섭 교수님
작품 배경 및 목적
최근 들어 유전 의학에 대한 관심도가 높아지면서 변이 식별 정확도에 대한 중요성이 높아지 고 있다. 본 연구는 기존 변이 탐지 도구에서 사용하는 비지도 학습 방법과 달리 골드 스탠다 드 데이터 셋을 활용한 지도학습 기반 Indel 감지 필터링 모델을 구현한다.
작품 내용
지도학습 모델 중 LGBM, XGBoost, SVM을 모델에 optuna, gridsearch를 사용하여 하이퍼 파라미터 조정 후 학습을 진행한다. 또한 모델의 높은 정확도 위해 데이터셋 내에 존재하는 특성들을 분석하고 특성간의 관계를 파악하여 각 데이터의 분포 형태를 고려하여 각 특징을 최적화한다.

Comentarios