2014/08/08 썸네일형 리스트형 Social Tagging 데이터 셋 (Datasets) 새로운 알고리즘 방법에 대하여 연구를 할때 그 방법론을 실험적으로 분석 평가를 해야한다. 특히 CS분야에서 유명한 학회나 저널의 논문을 작성할때는 규모가 큰 실 데이터로 실험하는 것을 선호한다. 도메인에 따라 조금 틀리지만 대체적으로 소셜 태깅 관련 논문에서 가장 많이 사용되는 실 데이터 셋은 딜리셔스, 플리커, Last.fm, CiteULike 데이터 인것 같다. 딜리셔스 (웹페이지 북마크), 플리커 (사진), Last.fm (음악)은 각 사이트에서 공식적으로 제공되는 데이터가 없다. 따라서 연구자들은 각자 API를 이용해 일부 데이터 crawling을 해서 사용한다. 그리고 그 데이터를 웹에 제공하기도 한다. 이에 반해 CiteULike (논문) 데이터는 CiteULike 사이트에서 연구의 목적하에 .. 더보기 이전 1 다음