강화학습 방법론을 이용한 탄도미사일 방어체계 무기-표적할당에 대한 인공지능 방법론 적용에 대한 연구A study on AI-based Weapon-Target Assignment of Ballistic Missile Defense System using Reinforcement Learning Methodologies
군사적인 관점에서 탄도미사일 방어작전은 전구적·전략적 차원의 군사작전에 속한다. 특히, 탄도미사일 방어작전의 성패는 전략적 중심을 방어하는 중요한 군사적 행동이라고 할 수 있다. 탄도미사일 방어작전에 사용되는 무기체계의 특성상 피아간의 작전템포가 빠르게 진행되고, 방자의 입장에서는 실패 시 그 치명성이 크다. 따라서, 탄도미사일 방어작전의 성공을 위해 최신 군사과학기술 특히, 인공지능 기술을 이용한 방법론이 필연적으로 요구된다. 본 연구에서는 탄도미사일 방어작전의 작전과정 중 임무할당 문제에 초점을 맞추어 연구하였다. 전통적으로 무기-표적할당 문제에 대한 연구는 유전자 알고리즘, 휴리스틱 방법론 중심으로 최적해를 찾기 위해 많은 연구들이 진행되어져 왔다. 본 연구에서는 무기-표적할당 문제를 인공지능 중 강화학습 방법론으로 접근하여 최적해를 찾기위해 가치기반의 강화학습 방법론과 정책기반의 강화학습 방법론으로 두 가지 접근법을 사용하였으며, 특히 다중에이전트를 적용한 결과까지 제시하여 실제 작전환경과 유사한 환경을 적용하였다. 그 결과, 전통적인 방법론과 대등하거나 우세한 결과를 통해 인공지능 방법론을 접목한 무기-할당 문제의 최적해를 찾을 수 있었다.