모델 추출 공격에 대한 인공신경망 워터마킹의 안전성 평가 방법이 개시된다. 일 실시예에 따른 인공신경망 워터마킹의 안전성 평가 방법은, 훈련 데이터와 워터마크를 위한 부가 정보를 이용하여 인공신경망 모델을 학습시키는 단계; 상기 학습된 인공신경망 모델과 동일한 구조의 복제 모델을 학습시키기 위한 새로운 훈련 데이터를 수집하는 단계; 상기 복제 모델에 상기 수집된 새로운 훈련 데이터를 입력하여 상기 동일한 구조의 복제 모델을 학습시키는 단계; 및 상기 학습된 복제 모델로부터 실행된 모델 추출 공격을 통해 상기 학습된 인공신경망 모델에 대한 워터마킹의 안전성을 평가하는 단계를 포함할 수 있다.