DC Field | Value | Language |
---|---|---|
dc.contributor.advisor | Whang, Euijong | - |
dc.contributor.author | 이찬호 | - |
dc.contributor.author | Lee, Chanho | - |
dc.date.accessioned | 2024-07-30T19:31:34Z | - |
dc.date.available | 2024-07-30T19:31:34Z | - |
dc.date.issued | 2024 | - |
dc.identifier.uri | http://library.kaist.ac.kr/search/detail/view.do?bibCtrlNo=1097199&flag=dissertation | en_US |
dc.identifier.uri | http://hdl.handle.net/10203/321627 | - |
dc.description | 학위논문(석사) - 한국과학기술원 : 전기및전자공학부, 2024.2,[iv, 40 p. :] | - |
dc.description.abstract | 기계 학습에 있어서 좋은 품질의 데이터 확보는 필수적이지만, 데이터 수집 과정에서 다양한 이유로 잘못 분류된 데이터가 포함되기도 한다. 잘못 라벨링 된 데이터는 기계 학습 과정에서 문제를 일으킬 수 있으며, 전체적인 모델의 성능 저하를 유발한다. 잘못 라벨링 된 데이터를 가지치기하기 위한 기존 연구는 손실값을 주로 사용하지만, 데이터가 불균형하거나, 심하게 지저분한 경우에는 잘 작동하지 않는 단점을 가진다. 이에 본 연구에서는 모델의 설명을 위한 도구인 SHAP 값을 사용하여 잘못 분류된 데이터를 찾아내는 기법을 제시한다. SHAP 값은 손실값보다 기계 학습 모델에 대한 정보를 더 많이 담고 있으며, 데이터가 모델에서 잘못 분류되는 경우에 대해서도 손실값 대비 더욱 강건한 특성을 가진다. 최종적으로 본 연구는 SHAP 값 기반의 데이터 레이블 클리닝과 손실값 기반의 데이터 레이블 클리닝을 앙상블 한 모델을 통해 다양한 상황에서도 좋은 성능을 가지는 기법을 제시하며, 이를 다양한 실제 데이터 세트에서 평가한다. | - |
dc.language | kor | - |
dc.publisher | 한국과학기술원 | - |
dc.subject | Explanability▼aData Centric AI▼aData Preprocessing▼aRobust Training▼aAnomaly Detection | - |
dc.subject | 설명 가능성▼a데이터 중심 인공지능▼a데이터 전처리▼a강건 학습▼a이상 데이터 탐지 | - |
dc.title | 불균형한 데이터 상에서의 SHAP 기반 강건한 레이블 클리닝 | - |
dc.title.alternative | Robust label cleaning on class imbalanced data using SHAP | - |
dc.type | Thesis(Master) | - |
dc.identifier.CNRN | 325007 | - |
dc.description.department | 한국과학기술원 :전기및전자공학부, | - |
dc.contributor.alternativeauthor | 황의종 | - |
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.