샘플 효율적인 탐색을 위한 샘플-인지 엔트로피 정규화 기법SAMPLE-AWARE ENTROPY REGULARIZATION METHOD FOR SAMPLE EFFICIENT EXPLORATION

Cited 0 time in webofscience Cited 0 time in scopus
  • Hit : 94
  • Download : 0
DC FieldValueLanguage
dc.contributor.author성영철ko
dc.contributor.author한승열ko
dc.date.accessioned2023-08-11T01:00:29Z-
dc.date.available2023-08-11T01:00:29Z-
dc.identifier.urihttp://hdl.handle.net/10203/311418-
dc.description.abstract샘플 효율적인 탐색을 위한 샘플-인지 엔트로피 정규화 기법에 관한 것으로, 업데이트된 정책(policy)을 이용하여 생성된 경험을 경험 리플레이 메모리(experience replay memory)에 저장하는 단계; 상기 경험 리플레이 메모리로부터 상기 경험의 랜덤 미니-배치(mini-batch)를 샘플링(sampling)하는 단계; 상기 샘플링한 미니-배치 내의 경험에 대하여 비율 함수를 계산하는 단계; 상기 샘플링한 미니-배치를 대상으로, 상기 비율 함수를 이용하여 가치 함수(value function)의 매개변수 및 정책의 매개변수를 업데이트하는 단계; 상기 샘플링한 미니-배치를 대상으로, 상기 비율 함수의 매개변수를 업데이트하는 단계; 및 상기 샘플링한 미니-배치를 대상으로, 상기 경험 리플레이 메모리 내 상기 경험의 확률 분포와 정책의 확률 분포의 비중을 조정하는 단계를 포함할 수 있다.-
dc.title샘플 효율적인 탐색을 위한 샘플-인지 엔트로피 정규화 기법-
dc.title.alternativeSAMPLE-AWARE ENTROPY REGULARIZATION METHOD FOR SAMPLE EFFICIENT EXPLORATION-
dc.typePatent-
dc.type.rimsPAT-
dc.contributor.localauthor성영철-
dc.contributor.assignee한국과학기술원-
dc.identifier.iprsType특허-
dc.identifier.patentApplicationNumber10-2021-0040188-
dc.identifier.patentRegistrationNumber10-2558092-0000-
dc.date.application2021-03-29-
dc.date.registration2023-07-18-
dc.publisher.countryKO-
Appears in Collection
EE-Patent(특허)
Files in This Item
There are no files associated with this item.

qr_code

  • mendeley

    citeulike


rss_1.0 rss_2.0 atom_1.0