DC Field | Value | Language |
---|---|---|
dc.contributor.author | 성영철 | ko |
dc.contributor.author | 한승열 | ko |
dc.date.accessioned | 2023-08-11T01:00:29Z | - |
dc.date.available | 2023-08-11T01:00:29Z | - |
dc.identifier.uri | http://hdl.handle.net/10203/311418 | - |
dc.description.abstract | 샘플 효율적인 탐색을 위한 샘플-인지 엔트로피 정규화 기법에 관한 것으로, 업데이트된 정책(policy)을 이용하여 생성된 경험을 경험 리플레이 메모리(experience replay memory)에 저장하는 단계; 상기 경험 리플레이 메모리로부터 상기 경험의 랜덤 미니-배치(mini-batch)를 샘플링(sampling)하는 단계; 상기 샘플링한 미니-배치 내의 경험에 대하여 비율 함수를 계산하는 단계; 상기 샘플링한 미니-배치를 대상으로, 상기 비율 함수를 이용하여 가치 함수(value function)의 매개변수 및 정책의 매개변수를 업데이트하는 단계; 상기 샘플링한 미니-배치를 대상으로, 상기 비율 함수의 매개변수를 업데이트하는 단계; 및 상기 샘플링한 미니-배치를 대상으로, 상기 경험 리플레이 메모리 내 상기 경험의 확률 분포와 정책의 확률 분포의 비중을 조정하는 단계를 포함할 수 있다. | - |
dc.title | 샘플 효율적인 탐색을 위한 샘플-인지 엔트로피 정규화 기법 | - |
dc.title.alternative | SAMPLE-AWARE ENTROPY REGULARIZATION METHOD FOR SAMPLE EFFICIENT EXPLORATION | - |
dc.type | Patent | - |
dc.type.rims | PAT | - |
dc.contributor.localauthor | 성영철 | - |
dc.contributor.assignee | 한국과학기술원 | - |
dc.identifier.iprsType | 특허 | - |
dc.identifier.patentApplicationNumber | 10-2021-0040188 | - |
dc.identifier.patentRegistrationNumber | 10-2558092-0000 | - |
dc.date.application | 2021-03-29 | - |
dc.date.registration | 2023-07-18 | - |
dc.publisher.country | KO | - |
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.