DSpace at KOASAS: 적대적 생성신경망을 통한 이종 행위자 스타일의 모방학습

DSpace at KOASAS

College of Engineering(공과대학)Dept. of Industrial and Systems Engineering(산업및시스템공학과)IE-Theses_Master(석사논문)

적대적 생성신경망을 통한 이종 행위자 스타일의 모방학습Imitation learning for different player style using generative adversarial networks

Cited 0 time in webofscience

Cited 0 time in scopus

Hit : 344
Download : 0

Export

김도형

실생활 예시에서 쉽게 찾을 수 있는 문제들은 대개 순차적 의사 결정 문제로 모델링 될 수 있으나, 강화학습 방법론을 사용하여 해당 문제를 해결하려 할 때 reward design이 어렵다는 단점을 가진다. Imitation learning의 경우, reward가 아닌 한정된 optimal action을 활용하여 최적 행동을 모방하여 순차적 의사 결정 문제를 해결한다. 본 연구에서는 최근 제안된 deep generative model인 VAEGAN의 구조를 활용한다. MDP로 정의된 순차적 의사 결정 문제에 대해 한정된 양의 state와 이에 해당되는 optimal action이 학습 데이터로 주어졌을 때, state의 정보를 효율적으로 함축하고 해당 정보를 최적 행동으로 재생성 할 수 있는 모델에 대해 제안하였다. 또, 개체 스타일에 대한 정보를 conditional 하게 학습시켜 같은 state가 주어질 때 개체의 스타일에 맞는 행위를 생성할 수 있는 방법을 제시하였다.

Advisors: 문일철 researcher; Moon, Il-Chul researcher

Description: 한국과학기술원 :산업및시스템공학과,

Publisher: 한국과학기술원

Issue Date: 2018

Identifier: 325007

Language: kor

Description: 학위논문(석사) - 한국과학기술원 : 산업및시스템공학과, 2018.2,[iii, 35 p. :]

Keywords: Deep Generative Model▼aImitation Learning▼aVariational Auto-encoder; Generative Adversarial Networks▼aSequential Decision Problem

URI: http://hdl.handle.net/10203/266239

Link: http://library.kaist.ac.kr/search/detail/view.do?bibCtrlNo=733831&flag=dissertation

Appears in Collection: IE-Theses_Master(석사논문)

Files in This Item: There are no files associated with this item.

Display Full Item Record

qr_code

트윗하기

KOASAS

Knowledge Service Development Team, KAIST 291 Daehak-ro, Yuseong-gu, Daejeon 34141, Republic of Korea. T. 82-42-350-4493 Email. koasas@kaist.ac.kr
Copyright © 2016. Korea Advanced Institute of Science and Technology. All Rights Reserved.

KOASAS

KOASAS

Browse

적대적 생성신경망을 통한 이종 행위자 스타일의 모방학습Imitation learning for different player style using generative adversarial networks

KOASAS

Communities & Collections