본문 바로가기
HOME> 논문 > 논문 검색상세

논문 상세정보

다층퍼셉트론 기반 리 샘플링 방법 비교를 위한 마이크로어레이 분류 예측 에러 추정 시스템
Classification Prediction Error Estimation System of Microarray for a Comparison of Resampling Methods Based on Multi-Layer Perceptron

박수영    (조선대학교 컴퓨터통계학과   ); 정채영    (조선대학교 컴퓨터통계학과  );
  • 초록

    게놈 연구에서 수천 개의 특징들은 비교적 작은 샘플들로부터 모아진다. 게놈 연구의 목적은 미래 관찰들의 결과를 예측하는 분류기를 만드는 것이다. 분류기를 만들기 위해서는 특징 선택, 모델 선택 그리고 예측 평가 등의 3단계 과정을 거친다. 본 논문은 예측 평가에 초점을 맞추고 모든 슬라이드의 사분위수를 똑같게 맞추는 quantilenormalization 적용하여 마이크로어레이 데이터를 표준화 한 후 특징 선택에 앞서 예측 모델의 '진짜' 예측 에러를 평가하기 위해 몇 개의 방법들을 비교하는 시스템을 고안하고 방법들의 예측 에러를 비교 분석 하였다. LOOCV는 전체적으로 작은 MSE와 bias를 나타내었고, 크기가 작은 샘플에서 split 방법과 2-fold CV는 매우 좋지 않는 결과를 보였다. 계산적으로 번거로운 분석에 대해서는 10-fold CV가 LOOCV보다 오히려 더 낳은 경향을 보였다.


    In genomic studies, thousands of features are collected on relatively few samples. One of the goals of these studies is to build classifiers to predict the outcome of future observations. There are three inherent steps to build classifiers: a significant gene selection, model selection and prediction assessment. In the paper, with a focus on prediction assessment, we normalize microarray data with quantile-normalization methods that adjust quartile of all slide equally and then design a system comparing several methods to estimate 'true' prediction error of a prediction model in the presence of feature selection and compare and analyze a prediction error of them. LOOCV generally performs very well with small MSE and bias, the split sample method and 2-fold CV perform with small sample size very pooly. For computationally burdensome analyses, 10-fold CV may be preferable to LOOCV.


  • 주제어

    마이크로어레이 .   리샘플링 방법 .   다층 퍼셉트론.  

  • 참고문헌 (6)

    1. Ransohoff,D,F., "Rules of evidence for cancer molecular marker discovery and validation,", Nature Reviews/Cancer, 4, 309-313, 2004. 
    2. Breiman,L. and spector,P., "Submodel selection and evaluation in regression.", The X-random case, Int. Stat. Rev., 60, 291-391, 1992. 
    3. S, Dudoit, "Comparison of discrimination methods for the classification of trunors using gene expression data", Journal of the American Statistical Association, vol. 97, pp. 77-87, 2002. 
    4. Vreiman,L. Friedman,J.H., Olshen,R.A and Stone,C.J., "Classification and Regression Tress.", Wadsworth and Brooks/Cole, Monterey, CA., 1984. 
    5. Golub, T.R., "Molecular classification of cancer: class discovery and class prediction by gene expression monitoring", Science, vo1286, no, 5439, pp. 531-537, 1999. 
    6. WEKA, http://www.cs.waikato.ac.nz/ml/weka/ 

 저자의 다른 논문

  • 박수영 (12)

    1. 2002 "XML기반의 EDI 문서교환을 위한 미들웨어 설계 및 구현" 정보처리학회논문지. The KIPS transactions. Part B. Part B b9 (6): 845~852    
    2. 2006 "마이크로어레이 발현 데이터 분류를 위한 베이지안 검증 기법" 한국해양정보통신학회논문지 = The journal of the Korea Institute of Maritime Information & Communication Sciences 10 (11): 2039~2044    
    3. 2006 "베이지안 기법을 적용한 마이크로어레이 데이터 분류 알고리즘 설계와 구현" 한국해양정보통신학회논문지 = The journal of the Korea Institute of Maritime Information & Communication Sciences 10 (12): 2283~2288    
    4. 2006 "PKI를 이용한 인스턴트 메신저에서의 인증 시스템 설계" 한국해양정보통신학회논문지 = The journal of the Korea Institute of Maritime Information & Communication Sciences 10 (1): 142~147    
    5. 2006 "PKI환경에서 ElGamal 방식의 ECC를 이용한 안전한 메신저 설계에 관한 연구" 한국해양정보통신학회논문지 = The journal of the Korea Institute of Maritime Information & Communication Sciences 10 (8): 1443~1448    
    6. 2007 "종양 분류를 위한 마이크로어레이 데이터 분류 모델 설계와 구현" 한국해양정보통신학회논문지 = The journal of the Korea Institute of Maritime Information & Communication Sciences 11 (10): 1924~1929    
    7. 2008 "정보력 있는 유전자 선택 방법 조합을 이용한 마이크로어레이 분류 시스템 구현" 한국해양정보통신학회논문지 = The journal of the Korea Institute of Maritime Information & Communication Sciences 12 (2): 315~320    
    8. 2008 "신경망 기반의 유전자조합을 이용한 마이크로어레이 데이터 분류 시스템" 한국해양정보통신학회논문지 = The journal of the Korea Institute of Maritime Information & Communication Sciences 12 (7): 1243~1248    
    9. 2010 "마이크로어레이 데이터를 이용한 암 분류 표지 유전자 선별 시스템" 한국해양정보통신학회논문지 = The journal of the Korea Institute of Maritime Information & Communication Sciences 14 (10): 2365~2370    
    10. 2011 "선별 시스템 기반 표지 유전자를 포함한 난소암 마이크로어레이 데이터 분류" 한국해양정보통신학회논문지 = The journal of the Korea Institute of Maritime Information & Communication Sciences 15 (3): 747~752    
  • 정채영 (33)

 활용도 분석

  • 상세보기

    amChart 영역
  • 원문보기

    amChart 영역

원문보기

무료다운로드
유료다운로드

유료 다운로드의 경우 해당 사이트의 정책에 따라 신규 회원가입, 로그인, 유료 구매 등이 필요할 수 있습니다. 해당 사이트에서 발생하는 귀하의 모든 정보활동은 NDSL의 서비스 정책과 무관합니다.

원문복사신청을 하시면, 일부 해외 인쇄학술지의 경우 외국학술지지원센터(FRIC)에서
무료 원문복사 서비스를 제공합니다.

NDSL에서는 해당 원문을 복사서비스하고 있습니다. 위의 원문복사신청 또는 장바구니 담기를 통하여 원문복사서비스 이용이 가능합니다.

이 논문과 함께 이용한 콘텐츠
이 논문과 함께 출판된 논문 + 더보기