본문 바로가기
HOME> 논문 > 논문 검색상세

논문 상세정보

XQuery에서의 XML 데이터 특성을 고려한 group by 지원을 위한 질의 표현 기법에 대한 연구
Research on supporting the group by clause reflecting XML data characteristics in XQuery

이민수   (이화여자대학교 컴퓨터학과UU0001056  ); 조혜영   (이화여자대학교 대학원 컴퓨터학과UU0001056  ); 오정선   (이화여자대학교 대학원 컴퓨터학과UU0001056  ); 김윤미   (이화여자대학교 컴퓨터학과UU0001056  ); 송수경   (이화여자대학교 컴퓨터학과UU0001056  );
  • 초록

    현재 널리 채택되고 있는 XML은 플랫폼에 의존하지 않는 데이터 표현 형식으로 B2B 응용 프로그램이나 워크플로우 상황에서처럼 느슨하게 연결된(loosely coupled) 이기종 시스템 간에 정보를 교환하는 데 매우 유용하게 사용되고 있다. XML의 이러한 장점 때문에 점차 증가하는 XML에 대한 관리 및 검색에 대한 요구 사항에 대처할 수 있도록 강력한 질의 언어인 XQuery가 만들어졌다. 문서의 검색을 위한 질의 언어인 XQuery는 다양한 데이터 소스로부터 가져온 XML 데이터를 고유한 구조를 가진 질의 결과로 구성할 수 있도록 설계되었으며 현재 XML 질의 언어의 표준이다. XQuery는 반복문 등을 포함하는 강력한 검색 기능을 지원하나 데이터를 그룹화 하는 경우에는 질의 표현이 상대적으로 어렵고, 복잡한 형태를 취한다. 따라서 본 논문에서는 XQuery에 그룹화 처리를 위한 명시적인 groupby절을 도입한 질의 표현 기법을 모색함으로써 XML 데이터의 재구성과 집계 함수 처리를 위한 그룹화를 보다 효율적으로 처리할 수 있도록 하였다. 이를 위해서 XQuery에 groupby절을 도입하기 위한 EBNF(Extended Backus-Naur Form)를 제안하고, 네이티브 XML 데이터베이스인 eXist 기반의 XQuery 그룹화 질의 처리 시스템을 구현하였다.


    XML is the most popular platform-independent data expression which is used to communicate between loosely coupled heterogeneous systems such as B2B Applications or Workflow systems. The powerful query language XQuery has been developed to support diverse needs for querying XML documents. XQuery is designed to configure results from diverse data sources into a uniquely structured query result. Therefore, it became the standard for the XML query language. Although the latest XQuery supports heavy search functions including iterations, the grouping mechanism for data is too primitive and makes the query expression difficult and complex. Therefore, this work is focused on supporting the groupby clause in the query expression to process XQuery grouping. We suggest it to be a more efficient way to process grouping for restructuring and aggregation functions on XML data. We propose an XQuery EBNF that includes the groupby clause and implemented an XQuery processing system with grouping functions based on the eXist Native XML Database.


  • 주제어

    그룹화 .   XML 데이터베이스.  

  • 참고문헌 (11)

    1. XML(eXtensible Markup Language), http://www.w3.org/XML/ 
    2. XQuery (XML Query Language), http://www.w3.org/XML/Query/ 
    3. eXist(An Open Source Native XML Database), http://exist.sourceforge.net 
    4. XML Path Language (XPath) 2.0, http://www.w3.org/TR/2005/WD-xpath20- 20050404/ 
    5. J. McHugh, S. Abiteboul, R. Goldman, D. Quass and J. Widom, 'Lore: A Database Management System for Semistructured Data', SIGMOD Record, 26(3), pp.54-66, September, 1997 
    6. H. V. jagadish, Shurug Al-Khalifa, Adriane Chapman, Laks V.S. Lakshmanan, Andrew Nierman, Stelios Paparizos, Jignesh M Patel, Divesh Srivastava, Nuwee Wiwatwattana, Yuqing Wu and Cong Yu. 'TIMBER: A Native XML Database', VLDB Journal, Vol.11, Issue 4, pp.274-291, 2002 
    7. D. Chatziantoniou and K. A. Ross, 'Querying multiple features of groups in relational databases', VLDB, pp.295-306, 1996 
    8. D. Chatziantoniou and K. A. Ross, 'Groupwise processing of relational queries', VLDB, pp.476-485, 1997 
    9. H. V. Jagadish, Laks V.S.Lakshmanan, Divesh Srivastava and Keith Thompson. 'TAX: A Tree Algebra for XML', In Proc. DBPL Conf., pp.149-164, Frascati, Italy, Sep. 2001 
    10. Stelios Paparizos, Shurug Al-Khalifa, H. V. Jagadish, Laks Lakshmanan, Andrew Nierman, Divesh Srivastava and Yuqing Wu, 'Grouping in XML', In: EDBT 2002 Workshop on XML-Based Data Management (XMLDM'02), pp.128-147, 2002 
    11. S. Chaudhuri, R. Kaushik and J.F. Naughton, 'On Relational Support for XML Publishing: Beyond Sorting and Tagging', SIGMOD, pp.611-622, 2003 

 저자의 다른 논문

  • 이민수 (16)

    1. 2002 "웹 기반의 OLAP 메타데이터 교환 시스템의 설계 및 구현" 정보처리학회논문지. The KIPS transactions. Part D. Part D d9 (6): 971~980    
    2. 2003 "샤모아: 컴포넌트 기반의 지식공학 프레임워크" 정보과학회지 = Communications of the Korean Institute of Information Scientists and Engineers 21 (10): 45~53    
    3. 2004 "데이터웨어하우스에서 유전자 알고리즘을 이용한 구체화된 뷰 선택 기법" 정보처리학회논문지. The KIPS transactions. Part D. Part D d11 (2): 325~338    
    4. 2004 "바이오패스웨이를 위한 지식 표현 시스템" 정보과학회논문지. Journal of KIISE. 소프트웨어 및 응용 31 (3): 343~352    
    5. 2005 "무선 인터넷 컨텐츠의 자동 생성을 위한 WML 변환기와 WML 편집기의 설계 및 구현" 정보처리학회논문지. The KIPS transactions. Part D. Part D d12 (2): 309~318    
    6. 2006 "Prediction Model for the Cellular Immortalization and Transformation Potentials of Cell Substrates" Genomics & informatics 4 (4): 161~166    
    7. 2006 "특징 추출과 분석 기법에 기반한 단백질 상호작용 데이터 신뢰도 향상 시스템" 정보처리학회논문지. The KIPS transactions. Part B. Part B b13 (7): 679~688    
    8. 2006 "Prediction of Exposure to 1763MHz Radiofrequency Radiation Using Support Vector Machine Algorithm in Jurkat Cell Model System" Genomics & informatics 4 (2): 71~76    
    9. 2010 "교통이력 데이터의 품질 개선과 What-If 분석을 위한 자료처리 기법의 구현" 정보처리학회논문지. The KIPS transactions. Part D. Part D d17 (2): 87~102    
    10. 2011 "Implementation of a Particle Swarm Optimization-based Classification Algorithm for Analyzing DNA Chip Data" Genomics & informatics 9 (3): 134~135    
  • 조혜영 (1)

  • 오정선 (0)

  • 김윤미 (0)

  • 송수경 (0)

 활용도 분석

  • 상세보기

    amChart 영역
  • 원문보기

    amChart 영역

원문보기

무료다운로드
  • NDSL :
유료다운로드

유료 다운로드의 경우 해당 사이트의 정책에 따라 신규 회원가입, 로그인, 유료 구매 등이 필요할 수 있습니다. 해당 사이트에서 발생하는 귀하의 모든 정보활동은 NDSL의 서비스 정책과 무관합니다.

원문복사신청을 하시면, 일부 해외 인쇄학술지의 경우 외국학술지지원센터(FRIC)에서
무료 원문복사 서비스를 제공합니다.

NDSL에서는 해당 원문을 복사서비스하고 있습니다. 위의 원문복사신청 또는 장바구니 담기를 통하여 원문복사서비스 이용이 가능합니다.

이 논문과 함께 출판된 논문 + 더보기