맵리듀스 상에서 Edge-Betweenness 기반의 커뮤니티 발견 알고리즘의 구현 = Implementation of a community detection algorithm using edge-betweenness on MapReduce

Cited 0 time in webofscience Cited 0 time in scopus
  • Hit : 526
  • Download : 0
Facebook 그리고 Twitter를 위시한 소셜 네트워킹 서비스들(SNSs)의 인기가 증가함에 따라, 소셜 네트워크 데이터를 분석하는 것은 다양한 분야에서 가장 중요한 이슈 중의 하나가 되었다. 여러 분석들 중에, 친구 추천과 타겟 마케팅등에 실질적으로 응용 가능한 소셜 네트워크 데이터로 부터 커뮤니티의 발견은 학계와 산업계로부터 많은 관심을 받고 있다. Girvan-Newman (GN) 알고리즘은 가장 유명한 divisive hierarchical 클러스터링 알고리즘들 중 하나이다. GN 알고리즘은 edge betweenness개념을 이용하여 하나의 네트워크를 복수 개의 커뮤니티로 분할 한다. GN 알고리즘은 널리 이용 됨에도 불구하고, 네트워크 상의 모든 Node쌍 간의 최단경로 계산을 요구하기 때문에 큰 규모의 네트워크에 적용하는 데에 한계가 있다. 이를 위하여, 우리는 맵리듀스 모델을 이용하는 Shortest Path Betweenness MapReduce Algorithm (SPB-MRA)라는 하나의 새로운 알고리즘을 제안한다. 이 알고리즘은 4단계로 구성되어 있으며 모든 연산이 병렬로 실행된다. 이 뿐만 아니라, 우리는 커뮤니티 발견의 더 큰 속도 향상을 위하여, 하나의 approximation 기법을 제안 한다. 우리는 SPB-MRA를 가장 인기 있는 맵리듀스 오픈 소스 플랫폼인 하둡 상에서 구현하고, Amazon EC2 인스턴스들 상에서 성능 평가를 수행 하였다. 실험 결과는 reducer의 개수가 증가함에 따라 소요 시간이 거의 선형적으로 줄어드는 것과 approximation 기법이 경미한 수준의 오차를 유발 한다는 것을 보여준다.
Advisors
이재길researcherLee, Jae-Gil
Description
한국과학기술원 : 지식서비스공학과,
Publisher
한국과학기술원
Issue Date
2013
Identifier
567100/325007  / 020114354
Language
kor
Description

학위논문(석사) - 한국과학기술원 : 지식서비스공학과, 2013.8, [ iv, 35 p. ]

Keywords

맵리듀스; Edge Betweenness; Hadoop; Algorithm; Community Detection; MapReduce; 커뮤니티 발견; 알고리즘; 하둡; 엣지 비트윈니스

URI
http://hdl.handle.net/10203/197086
Link
http://library.kaist.ac.kr/search/detail/view.do?bibCtrlNo=567100&flag=dissertation
Appears in Collection
IE-Theses_Master(석사논문)
Files in This Item
There are no files associated with this item.

qr_code

  • mendeley

    citeulike


rss_1.0 rss_2.0 atom_1.0