본문 바로가기
HOME> 보고서 > 보고서 검색상세

보고서 상세정보

위해평가 기초자료 분석방법 연구
Statistical methods for risk assessment

  • 사업명

    안전성관리기반연구

  • 과제명

    위해평가 기초자료 분석방법 연구

  • 주관연구기관

    동국대학교
    DongGuk University

  • 연구책임자

    주용성

  • 보고서유형

    최종보고서

  • 발행국가

    대한민국

  • 언어

    한국어

  • 발행년월

    2009-11

  • 과제시작년도

    2009

  • 주관부처

    식품의약품안전청

  • 사업 관리 기관

    식품의약품안전청
    Korea Food & Drug Administration

  • 등록번호

    TRKO201000015767

  • 과제고유번호

    1475005066

  • 키워드

    노출평가.식품 섭취량.위해평가.통계적 방법론.exposure assessment.food intake.risk assessment.statistical methodology.

  • DB 구축일자

    2013-04-18

  • 초록 


    Because public health and environmental policies are often developed to protect risk groups that are identified based on the dist...

    Because public health and environmental policies are often developed to protect risk groups that are identified based on the distributions of intake or monitoring data, it is an essential part of exposure assessment estimating the distributions of intake or monitoring data.
    In this project, we mainly worked on estimation of censored, truncated, or zero-inflated distributions using the EM algorithm framework, handling uncertainty of parameter estimates due to small sample size. We developed and 21 EM algorithms in this project and implemented these algorithms in a statistical software, SARAhiStatistical Analyzer for Risk Assessment), which is developed as the final product of this project. Additionally, we implemented bootstrapping to estimate of distribution of parameter estimates, predictive distribution to handle uncertainty of parameter estimates due to small sample size, tail probability estimation procedure.
    When the distribution has a skewed and heavy tail, estimation of tail probability should be carefully proceeded because it is sensitive to large values. If the sample size is small, the estimation becomes even more difficult. In this study, we developed an estimation program using bootstrapping and extreme value theory to provide accurate estimates. Also, we applied our method to actual food intake data set to demonstrate the performance of our program.
    We implemented all the above statistically sophisticated methods using R. Then we developed a GUI software, so-called SARA, that links R programs and provides input/output windows for R programs. In SARA, although all statistical graphs and calculations are done using R, users cannot even notice that R programs are being used within SARA. In other words, without prior knowledge in R, SARA users can analyze data with considered statistical methods.


    섭취량 자료와 모니터링 자료, 노출평가를 위해 생성된 자료의 분포를 추정하는 것은 유해물질의 노출평가를 가능하게 하는 중요한 요인이다. 이러한 분포의 추정을 위하여 여러 가지 기술적 또는 시각적 통계 기법을 사용하여 자료의 특성을 ...

    섭취량 자료와 모니터링 자료, 노출평가를 위해 생성된 자료의 분포를 추정하는 것은 유해물질의 노출평가를 가능하게 하는 중요한 요인이다. 이러한 분포의 추정을 위하여 여러 가지 기술적 또는 시각적 통계 기법을 사용하여 자료의 특성을 파악하고 관심 있는 모수를 정확히 추정해야 한다.
    자료 증대에 대한 최신의 방법론을 기초로 하여 위해평가 자료에서 흔히 나타나는 소표본에서의 시뮬레이션문제, 측정한계 이하로 나타나는 관측치들에 의한 절단자료의 처리문제, 0의 값을 가지는 관찰값들이 많이 나타나서 일반적인 분포를 사용할 수 없는 영과잉자료 처리문제를 해결하는 데에 초점을 맞췄다. 절단자료와 영과잉자료 처리를 위해서는 EM알고리즘을 이용하여 최대우도추정치를 구하도록 하였다. 총 21개의 EM 알고리즘 방법을 개발하였고, 이를 본 연구의 최종 결과물인 SARA(Statistical Analyzer for Risk Assessment) 프로그램에 포함시켰다. 이외에도 소표본 자료에서 모수의 추정치가 가지는 불확실성을 고려한 예측분포를 제시하고 대표적인 자료증대 방법인 부스트랩 방법을 SARA에 포함시켰다.
    위해성 자료의 특성 상 꼬리가 두터운 분포에 대한 정확한 추정 방법은 매우 중요하다. 이러한 분포에서 기준값 이상의 매우 작은 확률이나 매우 큰 백부위수를 추정하는 것이 목적인 경우가 많으므로 평균의 추정에 대한 문제와 다르게 접근을 해야 한다.
    이 연구에서는 비대칭이며 꼬리가 두터운 분포를 고려하고 소표본에서도 추정의 정도를 높일 수 있는 여러 가지 고급 통계 방법을 적용해 보고 섭취량 자료와 모니터링 자료의 분포 특성을 잘 파악할 수 있는 방법을 개발하였다. 또한, 부스트랩과 극단값 이론을 써서 분포의 특성과 정확한 확률 계산 하였다. 개발된 통계적 방법을 실제 자료에 적용하여 그 유용성을 확인하였다.
    기초 통계량의 계산, C-절단자료, T-절단자료, 영과잉 자료의 분포추정, 예측분포, 부스트랩핑, 꼬리가 두꺼운 분포에 대한 통계적 방법, 몬테카를로 시뮬레이션 등의 고급통계기법을 위한 R프로그램들을 개발하였다. 위해성 자료를 연구하는 비통계전문가들이 이러한 R프로그램들을 편하게 사용할 수 있도록 GUI(Graphic User Interface)를 C++를 이용하여 개발하였다. 이렇게 만들어진 GUI와 R프로 그램들로 구성된 소프트웨어 패키지를 SARA라고 명명하였다. SARA에서는 R프로그램이 GUI의 배경에서 실행되기 때문에 사용자는 R에 관한 지식 없이도 쉽게 사용할 수 있다.


  • 목차(Contents) 

    1. 용역연구개발과제 최종보고서 ...1
    2. 제출문 ...3
    3. 목차 ...4
    4. I. 총괄연구개발과제 요약문 ...6
    5. 1. 국문 요약문 ...6
    6. 2. 영문 요약문 ...8
    7. II. 총괄연구개발과제 연구결과 ...10
    8. 제1장 총괄연구개발과제의 목적 및 필요성 ...10<...
    1. 용역연구개발과제 최종보고서 ...1
    2. 제출문 ...3
    3. 목차 ...4
    4. I. 총괄연구개발과제 요약문 ...6
    5. 1. 국문 요약문 ...6
    6. 2. 영문 요약문 ...8
    7. II. 총괄연구개발과제 연구결과 ...10
    8. 제1장 총괄연구개발과제의 목적 및 필요성 ...10
    9. 1.1. 총괄연구개발과제의 목표 ...10
    10. 1.2. 총괄연구개발과제의 목표달성도 ...10
    11. 1.3. 총괄국내.외 기술개발 현황 ...11
    12. 1.4. 총괄연구개발과정에서 수집한 국외과학기술정보 ...11
    13. 제2장 총괄연구개발과제의 내용 및 방법 ...12
    14. 2.1. 개발된 프로그램 (SARA)에 포함된 내용들 ...13
    15. 2.2. SARA (Statistical Analyzer for Risk Assessment)의 개발환경 ...54
    16. 2.3. 극단값 이론을 사용한 꼬리 확률 추정 ...60
    17. 제3장 총괄연구개발과제의 최종결과 및 고찰 ...76
    18. 3.1. 위해성 자료의 통계적 분석 ...77
    19. 3.2. SARA 메뉴얼 ...92
    20. 제4장 총괄연구개발과제의 연구성과 ...140
    21. 4.1. 총괄활용성과 ...140
    22. 4.2. 총괄활용계획 ...141
    23. 제5장 총괄주요연구 변경사항 ...142
    24. 제6장 총괄참고문헌 ...142
    25. 제7장 총괄첨부서류 ...142
    26. III. 제1세부연구개발과제 연구결과 ...144
    27. 제1장 제1세부 연구개발과제 요약문 ...144
    28. 제2장 제1세부연구개발과제의 목적 ...145
    29. 2.1. 제1세부연구개발과제의 목적 ...146
    30. 2.2. 제1세부연구개발과제의 목표달성도 ...146
    31. 제3장 제1세부연구개발과제의 내용 및 방법 ...147
    32. 3.1. 연구 내용 ...148
    33. 3.2. SARA (Statistical Analyzer for Risk Assessment)의 개발환경 ...190
    34. 제4장 제1세부연구개발과제의 결과 및 고찰 ...196
    35. 4.1. 개발목적 ...197
    36. 4.2. SARA 설치 ...197
    37. 4.3. SARA를 위한 데이터 파일(*.sara) 준비 ...199
    38. 4.4. SARA 시작하기 ...201
    39. 4.5. SARA를 통한 자료분석 ...204
    40. 제5장 제1세부참고문헌 ...228
    41. IV. 제2세부연구개발과제 연구결과 ...230
    42. 제1장 제2세부연구개발과제의 요약문 ...230
    43. 제2장 제2세부연구개발과제의 목적 ...232
    44. 제3장 제2세부연구개발과제의 내용 및 방법 ...233
    45. 3.1. 평균초과함수에 의한 분포 선택 ...233
    46. 3.2. 꼬리가 두터운 분포에 대한 통계적 방법 ...235
    47. 3.3. Hill 그림과 평균초과함수의 이용한 모형의 선택 ...239
    48. 3.4. 노출평가의 수량적 방법 ...244
    49. 제4장 제2세부연구개발과제의 결과 및 고찰 ...249
    50. 4.1. 국민건강영양조사의 식품섭취량 자료 ...249
    51. 4.2. 위해물질 모니터링 자료 ...255
    52. 4.3. 노출평가를 위한 통계적 방법의 적용 ...258
    53. 4.4. 결과 및 고찰 ...263
    54. 4.5. SARA 매뉴얼(꼬리가 두터운 분포를 위한 통계적 분석 부분) ...265
    55. 제5장 제2세부참고문헌 ...269
  • 참고문헌

    1. 전체(0)
    2. 논문(0)
    3. 특허(0)
    4. 보고서(0)

 활용도 분석

  • 상세보기

    amChart 영역
  • 원문보기

    amChart 영역