본 발명은 마이크로어레이 데이터 셋으로부터 표본 클래스 판별 (질병 진단)을 위한 판별 유전자 셋을 탐색하는 방법에 관한 것으로서, 본 발명에 의한 방법은 마이크로어레이 데이터 셋의 발현량 수치 데이터를 이산화하는 단계(a); 상기 단계 (a)에서 이산화된 데이터를 이용하여 유전자-클래스 연관성을 바탕으로 유전자를 여과하는 단계(b); 상기 단계 (b)에서 여과된 유전자 중 유전자-클래스 연관성을 고려하여 판별 유전자 셋을 초기화하는 단계(c); 상기 단계 (b)에서 계산된 유전자-클래스 연관성과 유전자 간 중복성을 동시에 표현한 수치를 고려하여 상기 단계 (c)에서 초기화된 판별 유전자 셋에 유전자를 전진 선택하여 추가하는 단계(d); 상기 단계 (c)와 상기 단계 (d)에서 형성된 판별 유전자 셋의 표본 클래스 판별 오차를 평가하는 단계(e)를 포함한다.마이크로어레이, 유전자, 선택, 판별, 진단, 질병, 소표본, 이산화, 피셔, 정확검정