맵리듀스를 이용한 효율적인 병렬 유전자 선택 기법

2014 
마이크로어레이(microarray) 데이터 분석은 특정 세포에서 발현(expression)되는 수천 가지 유전자로부터 중요한 생물학적 정보를 추출하기 위해 널리 사용되고 있다. 그러나 발현된 유전자들 중 대부분은 실제 임상 진단 및 질병 분류와 무관하거나 중요하지 않은 경우가 많기 때문에 소수의 중요한 유전자들을 선별하는 방법이 요구되고 있다. 본 논문에서는 맵리듀스(MapReduce) 프로그래밍 모델을 이용하여 확장 가능한(scalable) 병렬 유전자 선택 기법을 제안한다. 제안하는 기법은 맵리듀스 기반으로 유전자 선별 작업을 병렬적으로 수행하고, 분류의 정확도를 평가하기 위해 kNN 분류 알고리즘을 활용한다. 또한 실험 결과를 통하여 제안 기법이 데이터 크기의 증가와 노드 개수의 차이에 따라 좋은 확장성(scalability)을 제공하고 있고, 선별한 유전자들을 사용한 분류 결과가 전체 유전자 집합을 사용한 분류보다 더 높은 분류 정확도를 가지고 있음을 보인다.
    • Correction
    • Source
    • Cite
    • Save
    • Machine Reading By IdeaReader
    1
    References
    0
    Citations
    NaN
    KQI
    []