- [환자] 본인이 가지는 질병에 대한 치료시기를 놓치는 문제 ex). 환자가 가진 폐질환을 코로나로 오인하게 되는 경우, 선별진료소에서 코로나 검사를 받고 검사결과를 기다리는 동안 자신이 가진 폐질환이 악화될 수 있음.
- [의료진] 진단 검사에 있어, 인력 낭비 발생 ex). 환자의 오인으로 인해 폐질환을 가진 환자가 코로나 선별진료소에 방문하여 코로나 검사를 받게 되면, 의료진 입장에서는 불필요한 업무를 수행하게 되는 꼴임.
- 가설
- 딥러닝 모델이 4가지 클래스에 대한 X-ray 이미지 패턴을 학습해서 환자 상태를 잘 분류할 수 있다.
- 데이터 선정 및 EDA 진행, 가설 설정
- [데이터 전처리] X-ray 이미지의 데이터 프레임 구축, 데이터 프레임 & 이미지 전처리
- [모델 구성 및 학습] 사전학습 모델을 활용한 모델구성, callback 함수 구성, 모델학습 진행
- [모델평가 및 저장] 학습된 모델을 테스트 셋으로 평가한 뒤 모델 저장
-
데이터 : 흉부 X-ray 이미지
-
데이터 종류 : 4가지 상태의 흉부 X-ray 이미지
-
데이터 크기(pixels) : 299(높이) X 299(너비)
-
라벨 별 데이터 개수
-
코로나 및 폐질환 판별 딥러닝 모델 제작 및 테스트
- 데이터 선정 및 EDA 진행, 가설 설정
- [데이터 전처리] X-ray 이미지의 데이터 프레임 구축, 데이터 프레임 & 이미지 전처리
- [모델 구성 및 학습] 사전학습 모델을 활용한 모델구성, callback 함수 구성, 모델학습 진행
- [모델평가 및 저장] 학습된 모델을 테스트 셋으로 평가한 뒤 모델 저장
-
제작한 딥러닝 모델을 이용한 이미지 분류
-
딥러닝 분류 결과에 맞는 병원 방문 및 치료법 적용
- [정확도] Training set - 0.9819, Validation set - 0.9423, Test set - 0.9396
- F1 score (Test set 이미지 1059개 기준)
- 모든 클래스[코로나, 정상상태, 바이러스성 폐렴, 폐 음영]에 대해 0.91 이상
- 특히, 희귀 케이스인 코로나와 바이러스성 폐렴에서의 분류성능이 양호함
- 한계점
- 사전학습 모델과 다른 사람들의 코드를 상당수 인용
- 데이터 셋 - 인종이나 나이, 성별 등에 대한 데이터가 없었음
- 해결방안
- 딥러닝 관련 기본지식 및 활용경험을 더 쌓는다.
- 데이터 셋을 searching을 통해 구하거나 데이터 셋을 생성할 수 있는 GAN과 같은 기술을 활용하여 인종, 나이, 성별 등에 대한 다양한 이미지셋을 확보한 후 딥러닝 모델을 최적화 한다.