적어도 하나의 프로세서에 의해 동작하는 시스템이 암의 재발 예후 예측을 위한 바이오마커를 발굴하는 방법으로서, 특정 종류의 암환자들의 대규모 유전자 발현 데이터들을 수집하는 단계, 상기 대규모 유전자 발현 데이터들 사이의 유사성을 분석하여 상기 대규모 유전자 발현 데이터들을 복수의 클러스터들로 분류하는 단계, 각 클러스터로 분류된 유전자 발현 데이터들에서 공통 발현되는 유전자들을 추출하여, 해당 클러스터의 암 연관 유전자셋으로 결정하는 단계, 그리고 각 암 연관 유전자셋의 암 재발 예후 관련 정보로 계산한 위험비(harzard ratio)를 기초로, 각 클러스터의 암 연관 유전자셋으로 구성된 복수의 암 연관 유전자셋들 중 적어도 하나의 유전자셋을 바이오마커로 선정하는 단계를 포함한다.