강화학습을 이용한 다양한 토공사 환경에서의 작업 경로 계획Earthwork planning in various environment via reinforcement learning

Cited 0 time in webofscience Cited 0 time in scopus
  • Hit : 385
  • Download : 0
DC FieldValueLanguage
dc.contributor.advisor문일철-
dc.contributor.advisorMoon, Il-Chul-
dc.contributor.author지민기-
dc.date.accessioned2019-09-03T02:42:03Z-
dc.date.available2019-09-03T02:42:03Z-
dc.date.issued2018-
dc.identifier.urihttp://library.kaist.ac.kr/search/detail/view.do?bibCtrlNo=828505&flag=dissertationen_US
dc.identifier.urihttp://hdl.handle.net/10203/266242-
dc.description학위논문(석사) - 한국과학기술원 : 산업및시스템공학과, 2018.8,[iii, 30 p. :]-
dc.description.abstract토공사는 건설 공사 대부분의 선행되는 공종으로 건설 공정 관리에서 중요한 과제 중 하나이다. 수학적 방법론에 기반을 둔 최적화 기법, 휴리스틱에 기반을 둔 최적화 기법 그리고 행위자 기반의 시뮬레이션 등의 방법론이 건설 공정 관리를 위해 적용되어왔다. 본 연구에서는 가상의 토공사 시뮬레이션 환경을 개발하고, 가상의 토공사 시뮬레이션 환경에서 강화학습을 이용하여 시뮬레이션을 통해 토공사의 최적 작업 경로를 찾는 방법을 제안하였다. 강화학습에 있어 본 연구에서는 굴삭기 에이전트에 대해 Q-learning과 딥강화학습을 사용하여 행동 정책을 학습하였다. 학습이 이루어진 토공사 시뮬레이션 환경에서 Q-learning과 딥강화학습을 사용하여 학습한 경우 모두 최적의 작업 경로 계획을 생성할 수 있음을 확인하였다. 또한, 학습된 굴삭기 에이전트를 학습에 사용하지 않은 시뮬레이션 환경에 적용하여 토공사 작업 경로를 생성하였으며, 딥강화학습으로 학습된 에이전트의 경우 생선된 작업 경로가 최적에 가까움을 확인할 수 있었다. 이 계획은 건설 자동화의 기초가 될 수 있을 것이다.-
dc.languagekor-
dc.publisher한국과학기술원-
dc.subject토공사▼a강화학습▼a딥강화학습▼a마르코브 결정 과정-
dc.subjectEarthwork▼areinforcement learning▼adeep reinforcement learning▼amarkov decision process-
dc.title강화학습을 이용한 다양한 토공사 환경에서의 작업 경로 계획-
dc.title.alternativeEarthwork planning in various environment via reinforcement learning-
dc.typeThesis(Master)-
dc.identifier.CNRN325007-
dc.description.department한국과학기술원 :산업및시스템공학과,-
dc.contributor.alternativeauthorJi, Mingi-
Appears in Collection
IE-Theses_Master(석사논문)
Files in This Item
There are no files associated with this item.

qr_code

  • mendeley

    citeulike


rss_1.0 rss_2.0 atom_1.0