본문 바로가기
HOME> 논문 > 논문 검색상세

논문 상세정보

유전자 알고리즘을 이용한 프로모터 영역의 전사인자 결합부위 패턴 탐색
(Pattern Search for Transcription Factor Binding Sites in a Promoter Region using Genetic Algorithm)

김기봉   ((주) 스몰포스트 정보기술연구소  ); 공은배   (충남대학교 컴퓨터공학과UU0001302  );
  • 초록

    유전자 발현에 매우 중요한 신호역할을 하는 프로모터 영역은 여러 전사인자들이 결합하는 특정 부위들을 갖고 있다. 전사인자의 결합부위는 프로모터의 다양한 부위에 위치하며, 진화론적으로 잘 보존된 Consensus 형태의 염기서열 패턴을 띠고 있다. 본 논문은 이러한 최적의 패턴들을 탐색하기 위해 유전자 알고리즘을 기반으로 하면서, 동시에 MEME 알고리즘의 N-occurrence-per-dataset 모델의 가정과 패턴의 길이를 결정할 수 있는 Wataru 방법의 장점을 따르는 새로운 방법을 제시하고 있다. 이러한 탐색 방법은 유전체 연구자들이 임의의 DNA 염기서열 상에서 프로모터 영역을 예측하거나 특정 전사인자의 결합부위를 탐색하는데 적극 활용할 수 있다.


    The promoter that plays a very important role in gene expression as a signal part has various binding sites for transcription factors. These binding sites are located on various parts in promoter region and have highly conserved consensus sequence patterns. This paper presents a new method for the consensus pattern search in promoter regions using genetic algorithm, which adopts the assumption of N-occurrence-per-dataset model of MEME algorithm and employs the advantage of Wataru method in determining the pattern length. Our method will be employed by genome researchers who try to predict the promoter region on anonymous DNA sequence and to find out the binding site for a specific transcription factor.


  • 주제어

    유전자 .   프로모터 .   전사인자 .   유전체 .   MEME 알고리즘 .   Wataru 방법 .   유전자 알고리즘.  

  • 참고문헌 (19)

    1. Ching Zhang and Andrew KX.Wong, 'A genetic algorithm for multiple molecular sequence alignment', CABIOS, Vol. 13, No. 6, 1997 
    2. Cedric Notredame and Desmond G. Higgins, 'SAGA: sequence alignment by genetic algorithm', Nucleic Acids Research, Vol. 24, No. 8, pp. 1515-1524, 1996 
    3. Cavin Perier, R., Junier, T., Bonnard, C. and Bucher, P. 'The Eukaryotic Promoter Database EPD: Recent Developments', Nucleic Acids Research, Vol. 27, pp. 307-309, 1999 
    4. Ghosh, D., A relational database of transcription factors, Nucleic Acids Research, Vol. 18, pp. 1749-1756, 1990 
    5. Timothy L. Bailey, Likelihood vs. Information in Aligning Biopolymer Sequences, UCSD Technical Report CS93-318, 1993 
    6. James W. Fickett and Artemis G. Hatzigeorgiou, 'REVIEW Eukaryotic Promoter Recognition', Genome Research, Vol. 7, pp. 861-878, 1997 
    7. Thomas D. Schneider, Gary D. Stormo and Larry Gold, Information Content of Binding Sites on Nucleotide Sequences, Journal of Molecular Biology, Vol. 188, pp. 415-431, 1986 
    8. Timothy Bailey and Charles Elkan, 'Unsupervised Learning of Multiple Motifs in Biopolymers Using Expectation Maximization', Machine learning Journal, Vol. 21, pp. 51-83, 1995 
    9. Z. Michalewicz, 유전자 알고리즘, 그린출판사, 1996 
    10. David Beasley, David R. Bull and Ralph R. Martin, An Overview of Genetic Algorithms, University Computing, Vol. 15, No. 2, pp. 58-69, 1993 
    11. Wataru Fujibuchi and Minora Kanehisa, 'Prediction of Gene Expression specificity by Promoter Sequence Patterns', DNA Research 4, pp. 81-90, 1997 
    12. Dan S. Prestridge, 'Predicting Pol II Promoter Sequences using Transcription Factor Binding Sites', Journal of Molecular Biology, Vol. 249, pp. 923-932, 1995 
    13. Dan S. Prestridge, SIGNAL SCAN: A computer program that scans DNA sequences for eukaryotic transcriptional elements, CABIOS, Vol. 7, pp. 203-206, 1991 
    14. Pesole G., Prunella N., Liuni S., Attimonelli M., and Saccone C, 'WORDUP: an efficient algorithm for discovering statistically significant patterns in DNA sequences', Nucleic Acids Research, Vol. 20, pp. 2871-2875, 1992 
    15. Lon R. Cardon and Gary D. Stormo, 'Expectation maximization algorithm for identifying protein-binding sites with variable lengths from unaligned DNA fragments', Journal of Molecular Biology, Vol. 223, pp. 159-170, 1992 
    16. E. Snyder and G. Stormo, Identification of protein coding regions in genomic DNA, Journal of Molecular Biology, Vol. 248, pp 1-18, 1995 
    17. M. Burset and R. Guigo, Evaluation of gene structure prediction programs, Genomics, Vol. 34, pp 353-367, 1996 
    18. C. Burge and S. Karlin, Prediction of complete gene structures in human genomic DNA, Journal of Molecular Biology, Vol. 268, pp 78-94, 1997 
    19. Tim Bailey and William E. Hart, 'Learning Consensus Patterns in Unaligned DNA Sequences Using a Genetic Algorithm', Sandia Laboratories Tech Report SAND95-2293 

 저자의 다른 논문

  • 공은배 (9)

    1. 2000 "유전자 구조분석을 위한 계산학적 방법" 정보과학회지 = Communications of the Korean Institute of Information Scientists and Engineers 18 (8): 49~54    
    2. 2000 "하드웨어에 종속된 암호키 비밀 분할을 이용한 정보권한관리 시스템" 정보과학회논문지. Journal of KIISE. 시스템 및 이론 27 (3): 345~351    
    3. 2001 "SecuROS 에서 개발된 사용자 및 프로그램 인터페이스" 정보처리학회논문지. The KIPS transactions. Part C Part C c8 (5): 557~564    
    4. 2002 "A Method for Identifying Splice Sites and Translation Start Sites in Human Genomic Sequences" Journal of biochemistry and molecular biology = 한국생화학회지 35 (5): 513~517    
    5. 2003 "SecuROS/FreeBSD 기반 다단계 사용자 인증 시스템" 정보처리학회논문지. The KIPS transactions. Part C Part C c10 (1): 11~16    
    6. 2003 "의존성 반영 분해모델에 의한 유전자의 핵심 프로모터 영역 예측" 정보과학회논문지. Journal of KIISE. 소프트웨어 및 응용 30 (3): 379~387    
    7. 2003 "RFID 스마트카드내 DNA STR Information과 일회용 의사난수를 사용한 다중 사용자 인증시스템" 정보처리학회논문지. The KIPS transactions. Part C Part C c10 (6): 747~754    
    8. 2007 "RGISS: Rice (Oryza sativa L. ssp. japonica) Genome Information Service System" Genomics & informatics 5 (4): 194~195    

 활용도 분석

  • 상세보기

    amChart 영역
  • 원문보기

    amChart 영역

원문보기

무료다운로드
  • NDSL :
유료다운로드

유료 다운로드의 경우 해당 사이트의 정책에 따라 신규 회원가입, 로그인, 유료 구매 등이 필요할 수 있습니다. 해당 사이트에서 발생하는 귀하의 모든 정보활동은 NDSL의 서비스 정책과 무관합니다.

원문복사신청을 하시면, 일부 해외 인쇄학술지의 경우 외국학술지지원센터(FRIC)에서
무료 원문복사 서비스를 제공합니다.

NDSL에서는 해당 원문을 복사서비스하고 있습니다. 위의 원문복사신청 또는 장바구니 담기를 통하여 원문복사서비스 이용이 가능합니다.

이 논문과 함께 이용한 콘텐츠
이 논문과 함께 출판된 논문 + 더보기