데이터 관리 정책과 저장 장치 성능 분석을 위한 재구성 용이한 HDFS 시뮬레이션 환경 = Reconfigurable HDFS simulation environment for performance analysis of data management policy and storage device

Cited 0 time in webofscience Cited 0 time in scopus
  • Hit : 364
  • Download : 0
오늘 날에는 수많은 데이터들로 넘쳐나고 있으며, 이로 인하여 빅 데이터라는 분야가 생겨났다. 빅 데이터는 기존의 데이터베이스 관리도구로 데이터를 수집, 저장, 관리, 분석할 수 있는 역량을 넘어서는 대량의 정형 또는 비정형 데이터 집합 및 이러한 데이터로부터 가치를 추출하고 결과를 분석하는 기술을 의미한다. 빅 데이터를 저장 및 처리하는 다양한 플랫폼들이 존재하지만 이들 중 대표적인 것이 Hadoop 플랫폼이다. Hadoop 플랫폼은 Apache Software Foundation에서 개발한 오픈소스 소프트웨어로, 뛰어난 확장성과 성능으로 인하여 가장 범용적으로 사용되고 있다. 이러한 Hadoop 플랫폼은 병렬 처리를 위한 MapReduce와 데이터를 분산 저장 및 관리하는 Hadoop 분산 파일 시스템인 HDFS로 구성된다. MapReduce 프레임워크는 HDFS 위에 구축되어 HDFS로부터 데이터를 읽어 들이고 저장하며, 하나의 애플리케이션을 분산 및 병렬적으로 처리한다. 그렇기 때문에 MapReduce 애플리케이션의 성능에 있어서 HDFS의 역할인 데이터 관리는 매우 중요하다. 또한 이러한 작업 시 실질적으로 데이터를 저장하고, 읽어오는 저장 장치의 성능을 분석하는 것도 중요한 문제이다. 하지만 Hadoop 플랫폼은 일반적으로 하나의 클러스터가 수 백 ~ 수 천대 규모로 구성되는 대규모 시스템이기 때문에 실제로 대규모 Hadoop 플랫폼을 구축하여 다양한 데이터 관리 정책과 저장 장치에 따른 성능을 테스트하는 것을 현실적으로 매우 어려운 일이다. 본 논문에서는 이러한 어려움을 해결하기 위하여, 다음과 같은 기능을 제공하는 재구성 용이한 HDFS 시뮬레이션 환경을 제안한다. 1) 소규모 Hadoop 클러스터의 실행 결과와 로그 정보를 통하여, 임의의 규모의 MapReduce 애플리케이션의 읽기/쓰기 패턴 생성이 가능하다. 2) 다양한 데이터 관리 정책을 테스트하기 위한 재구성 용이한 모델을 제공함으로써, 데이터 저장 알고리즘과 복제 블록 개수, 블록 크기, Data Node 개수를 변경하는 것이 용이하다. 이와 같은 제안하는 시뮬레이션 환경을 통하여 사용자는 테스트 하고자 하는 MapReduce 애플리케이션에 따른 다양한 데이터 관리 정책을 시뮬레이션 하는 것이 용이하다. 또한 잘 알려진 저장 장치 시뮬레이터인 DiskSim을 연동함으로써, 다양한 저장 장치에 따른 성능 분석이 가능하다. 본 논문은 제안하는 시뮬레이션 환경을 활용하는 방법을 제시하고, 제안하는 방법에 따라 사례 연구를 수행한다. 사례 연구를 통하여 제안하는 시뮬레이션 환경이 다양한 데이터 관리 정책과 저장 장치에 따른 HDFS의 성능 분석이 가능함을 확인할 수 있다.
Advisors
김탁곤researcherKim, Tag-Gon
Description
한국과학기술원 : 전기및전자공학과,
Publisher
한국과학기술원
Issue Date
2014
Identifier
569261/325007  / 020123499
Language
kor
Description

학위논문(석사) - 한국과학기술원 : 전기및전자공학과, 2014.2, [ ⅴ, 64 p. ]

Keywords

Hadoop; DiskSim; Simulation Environment; Reconfiguration; HDFS; Hadoop; HDFS; 재구성; 시뮬레이션 환경; DiskSim

URI
http://hdl.handle.net/10203/196789
Link
http://library.kaist.ac.kr/search/detail/view.do?bibCtrlNo=569261&flag=dissertation
Appears in Collection
EE-Theses_Master(석사논문)
Files in This Item
There are no files associated with this item.

qr_code

  • mendeley

    citeulike


rss_1.0 rss_2.0 atom_1.0