본문 바로가기
HOME> 논문 > 논문 검색상세

논문 상세정보

한국콘텐츠학회논문지 = The Journal of the Korea Contents Association v.12 no.4, 2012년, pp.40 - 51   피인용횟수: 2
본 등재정보는 저널의 등재정보를 참고하여 보여주는 베타서비스로 정확한 논문의 등재여부는 등재기관에 확인하시기 바랍니다.

온라인 게시글의 조회수 분석을 통한 인기도 예측
Prediction Model for Popularity of Online Articles based on Analysis of Hit Count

김수도    (부산대학교 사회급변현상연구소   ); 조환규    (부산대학교 컴퓨터공학과  );
  • 초록

    한국의 온라인 토론게시판은 의견 공유뿐 아니라 여론 형성과 참여를 위한 공간으로 활발히 사용되고 있다. 토론게시판에서 어떤 글은 사회적 정치적 이슈를 몰고 다니기도 하고 어떤 글은 사용자의 관심을 끌지 못하기도 한다. 본 논문에서는 한국의 유명 토론게시판인 다음 아고라와 서프라이즈에서 수집한 글의 통계적 정보를 이용하여 글의 인기를 분석하고 인기글을 예측하기 위한 예측모델을 제안한다. 분석결과 아고라는 87.52%의 글이 게시판에 제출된 후 하루가 지나기 전에 글의 인기가 끝나고 있었지만 서프라이즈는 39%의 글이 4일 이상 인기가 지속되고 있었다. 그렇지만 글의 인기기간과 조회수의 상관관계는 낮았다. 조회수 증가가 오랫동안 지속된다고 해서 최종 조회수가 높다는 것을 의미하지는 않는다. 본 논문에서는 분류와 예측 분야에서 잘 알려진 SVM 모델과 유사매칭 모델, 그리고 새롭게 제안한 예측 모델 '베이스 라인'을 이용하여 인기글을 예측하고 평가하였다. SVM 모델이 F-measure와 정밀도에서 유사매칭과 베이스라인보다 우수하였으며, 베이스라인이 실행시간에서 가장 우수한 성능을 보였다.


    Online discussion bulletin in Korea is not only a specific place where user exchange opinions but also a public sphere through which users discuss and form public opinion. Sometimes, there is a heated debate on a topic and any article becomes a political or sociological issue. In this paper, we propose how to analyze the popularity of articles by collecting the information of articles obtained from two well-known discussion forums such as AGORA and SEOPRISE. And we propose a prediction model for the article popularity by applying the characteristics of subject articles. Our experiment shown that the popularity of 87.52% articles have been saturated within a day after the submission in AGORA, but the popularity of 39% articles is growing after 4 days passed in SEOPRISE. And we observed that there is a low correlation between the period of popularity and the hit count. The steady increase of the hit count of an article does not necessarily imply the final hit count of the article at the saturation point is so high. In this paper, we newly propose a new prediction model called 'baseline'. We evaluated the predictability for popular articles using three models (SVM, similar matching and baseline). Through the results of performance evaluation, we observed that SVM model is the best in F-measure and precision, but baseline is the best in running time.


  • 주제어

    예측 .   인기 .   인터넷 게시글 .   온라인 커뮤니티.  

  • 참고문헌 (22)

    1. 송경재, "네트워크 시대와 시민운동의 정치사회적 함의", 한국 인터넷 문화의 특성과 발전방안 심포지엄, pp.199-231, 2008. 
    2. 이윤정, 지정훈, 우균, 조환규, "인터넷 게시물의 댓글 분석 및 시각화", 한국콘텐츠학회논문지, 제9권, 제7호, pp.45-56, 2009.     
    3. G. Szabo and B. A. Huberman, "Predicting the Popularity of Online Content," Communication of the ACM, Vol.53, No.8, pp.80-88, 2010. 
    4. N. Agarwal, H. Liu, L. Tang, and P. S. Yu, "Identifying the influential bloggers in a community," Proc. of Web Search and Data Mining, pp.207-218, 2008. 
    5. 김수도, 김소라, 조환규, "웹게시판에서 가상온도를 이용한 게시글의 인기 예측", 한국콘텐츠학회논문지, 제11권, 제10호, pp.19-29, 2011.     
    6. K. Lerman, "Social Information Processing in Social News Aggregation," IEEE Internet Computing:special issue on Social Search, Vol.11, No.6, pp.16-28, 2007. 
    7. DIGG, http://digg.com 
    8. YouTube, http://www.youtube.com 
    9. M. Cha, H. Kwak, P. Rodriguez, Y. Y. Ahn, and S. Moon, "Analyzing the video popularity characteristics of large-scale user generated content systems," IEEE/ACM Transaction on Networking, Vol.17, No.5, pp.1357-1370, 2009. 
    10. F. Figueiredo, F. Benevenuto, and J. M. Almeida, "The tube over time : Characterizing popularity growth of youtube videos," Proc. of Web Search and Data Mining, pp.745-754, 2011. 
    11. K. Lerman and T. Hogg, "Using a Model of Social Dynamics to Predict Popularity of News," Proc. of World Wide Web, pp.621-630, 2010. 
    12. S. Jamali and H. Rangwala, "Digging Digg: Comment Mining, Popularity Prediction, and Social Network Analysis," Proc. of Web Information Systems Modeling, pp.32-38, 2009. 
    13. J. G. Lee, S. Moon, and K. Salamatian, "An Approach to Model and Predict the Popularity of Online Conntents with Explanatory Factors," Proc. of Intelligent Agent Technology, Vol.1, pp.623-630, 2010. 
    14. AGORA, http://bbs1.agora.media.daum.net/gaia/do/debate/list?bbsId=D003 
    15. SEOPRISE, http://www.seoprise.com/board/list.php?table=seoprise_13 
    16. S. D. Kim, S. H. Kim, and H. G. Cho, "Predicting the Virtual Temperature of Web-Blog Articles as a Measurement Tool for Online Popularity," Proc. of Computer and Information Technology, pp.449-454, 2011. 
    17. S. D. Kim, S. Y. Kim, and H. G. Cho, "A model for popularity dynamics to predict hot articles in discussion blog," Proc. of Ubiquitous Information Management and Communication, 2012. 
    18. H. Abdi, Kendall rank correlation. n.j. salkind(ed.), Encyclopedia of Measurement and Statistics, 2006. 
    19. J. Durbin and A. Stuart, "Inversions and rank correlation coefficients," J. of Royal Statistical Society, Vol.13, No.2, pp.303-309, 1951. 
    20. SVM light, http://svmlight.joachims.org 
    21. B. Boucheham, "Reduced data similarity-based matching for time series patterns alignment", Pattern Recognition Letters, Vol.31, pp.629-638, 2010. 
    22. Wikipedia, http://en.wikipedia.org/wiki 
  • 이 논문을 인용한 문헌 (2)

    1. Choi, Jeong Min ; Bae, Kwanpyo ; Choi, Seong-Rak 2013. "Policy-making Process of Artists Welfare Law: Based on Kingdon's Policy Streams Model" 한국콘텐츠학회논문지 = The Journal of the Korea Contents Association, 13(5): 243~252     
    2. Park, Jong-Won ; Koo, Chulmo ; Yang, Sung-Byung 2016. "Influencing Factors on Knowledge Adoption of Administrator in an Online Idea Proposal Community: Focusing on the Tourism Idea Bank of Korea Tourism Organization" 한국콘텐츠학회논문지 = The Journal of the Korea Contents Association, 16(10): 1~17     

 저자의 다른 논문

 활용도 분석

  • 상세보기

    amChart 영역
  • 원문보기

    amChart 영역

원문보기

무료다운로드
유료다운로드

유료 다운로드의 경우 해당 사이트의 정책에 따라 신규 회원가입, 로그인, 유료 구매 등이 필요할 수 있습니다. 해당 사이트에서 발생하는 귀하의 모든 정보활동은 NDSL의 서비스 정책과 무관합니다.

원문복사신청을 하시면, 일부 해외 인쇄학술지의 경우 외국학술지지원센터(FRIC)에서
무료 원문복사 서비스를 제공합니다.

NDSL에서는 해당 원문을 복사서비스하고 있습니다. 위의 원문복사신청 또는 장바구니 담기를 통하여 원문복사서비스 이용이 가능합니다.

이 논문과 함께 출판된 논문 + 더보기