DSpace at KOASAS: 심층 역 강화 학습

DSpace at KOASAS

College of Engineering(공과대학)School of Computing(전산학부)CS-Theses_Master(석사논문)

심층 역 강화 학습Deep inverse reinforcement learning

Cited 0 time in webofscience

Cited 0 time in scopus

Hit : 2968
Download : 0

Export

홍정표 / Hong, Jung-Pyo

역 강화 학습 문제는 마코프 의사 결정 과정을 가정하는 환경에서, 주어진 전문가의 행동 정책에 대해 이를 잘 설명해주는 보상 함수를 찾는 문제이다. 현재 알려진 역 강화 학습 알고리즘들은 환경을 나타내기 위해 특성 함수를 가 주어져 있으며, 또한 보상 함수가 이러한 특성 함수 공간에 선형이라 가정한다. 하지만 문제가 복잡해질 수록, 예를 들면 Arcade Learning Environment(ALE) 같은 환경 상태가 화상으로 나타나는 경우에 대해선 이러한 가정은 문제점을 나타내게 된다. 본 논문은 콘볼루션 신경망과 상대 엔트로피 역 강화 학습 알고리즘을 조합하여 이러한 문제를 해결해보고자 한다. 심층 역 강화 학습 알고리즘은 이미지로부터 보상 함수에 대한 자동으로 특성을 구성한다. ALE에서의 실험 결과는 알고리즘이 효과적으로 전문가의 행동 정책과 사람의 선호를 보상 함수의 형태로 복구할 수 있음을 나타낸다.

Advisors: 김기응 researcher; Kim, Kee-Eung researcher

Description: 한국과학기술원 :전산학부,

Publisher: 한국과학기술원

Issue Date: 2016

Identifier: 325007

Language: kor

Description: 학위논문(석사) - 한국과학기술원 : 전산학부, 2016.2 ,[iv, 20 p. :]

Keywords: 역 강화 학습; 심층 학습; 특성 구성; 콘볼루션 신경망; Arcade Learning Environment; Inverse Reinforcement Learning; Deep Learning; Feature Construction; Convolutional Neural Network

URI: http://hdl.handle.net/10203/221844

Link: http://library.kaist.ac.kr/search/detail/view.do?bibCtrlNo=649696&flag=dissertation

Appears in Collection: CS-Theses_Master(석사논문)

Files in This Item: There are no files associated with this item.

Display Full Item Record

qr_code

트윗하기

KOASAS

Knowledge Service Development Team, KAIST 291 Daehak-ro, Yuseong-gu, Daejeon 34141, Republic of Korea. T. 82-42-350-4493 Email. koasas@kaist.ac.kr
Copyright © 2016. Korea Advanced Institute of Science and Technology. All Rights Reserved.

KOASAS

KOASAS

Browse

심층 역 강화 학습Deep inverse reinforcement learning

KOASAS

Communities & Collections