DC Field | Value | Language |
---|---|---|
dc.contributor.author | 신지수 | ko |
dc.contributor.author | 송호윤 | ko |
dc.contributor.author | 이희제 | ko |
dc.contributor.author | 박종철 | ko |
dc.date.accessioned | 2022-11-10T23:00:42Z | - |
dc.date.available | 2022-11-10T23:00:42Z | - |
dc.date.created | 2022-11-10 | - |
dc.date.issued | 2022-06-29 | - |
dc.identifier.citation | 2022 한국컴퓨터종합학술대회 (KCC) | - |
dc.identifier.uri | http://hdl.handle.net/10203/299500 | - |
dc.description.abstract | 소셜 미디어나 온라인 커뮤니티 등의 매체를 통해 빠르게 확산되는 언어폭력을 탐지하기 위한 자연언어처리 기법들이 활발하게 연구되고 있다. 선행연구들은 텍스트의 폭력성 여부를 탐지하는 것 외에도 폭력 대상 식별, 폭력의 하위 유형 분류, 암묵적 언어폭력 탐지 등 다양한 언어폭력의 유형을 탐지하는 것에 집중하고 있다. 하지만 아직 한국어에 대한 언어폭력 탐지 연구는 매우 부족한 상황이며, 이보다 앞선 문제는 관련 한국어 데이터셋을 구하기 어렵다는 점이다. 본 연구에서는 새로운 데이터셋 구축의 어려움을 줄이고 기존의 영어 데이터셋을 사용하는 다양한 언어폭력 분야 태스크를 한국어 언어폭력에도 적용 및 구현하기 위하여 기존의 영어 데이터셋을 한국어로 번역하여 활용하는 방안을 제시한다. 또한 실험을 통하여 구축한 한국어 데이터셋을 활용하여 한국어 언어폭력 탐지를 효과적으로 수행할 수 있음을 확인하였다. | - |
dc.language | Korean | - |
dc.publisher | 한국정보과학회 | - |
dc.title | 기계번역을 활용한 한국어 언어폭력 데이터셋의 구축 | - |
dc.title.alternative | Constructing Korean Abusive Language Dataset using Machine Translation | - |
dc.type | Conference | - |
dc.type.rims | CONF | - |
dc.citation.publicationname | 2022 한국컴퓨터종합학술대회 (KCC) | - |
dc.identifier.conferencecountry | KO | - |
dc.identifier.conferencelocation | 제주국제컨벤션센터 | - |
dc.contributor.localauthor | 박종철 | - |
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.