1.개요

오아시스 웹트렌드는 시간의 흐름에 따라 웹사이트에서 나타난 특정 단어들의 관심도(웹페이지에 나타난 특정 단어의 출현율) 변화 추이와 단어들간의 상관 관계를 알 수 있도록, 국립중앙도서관에서 수집한 2012년 이후의 웹 아카이브 자료에 대한 검색과 시각화 분석도구를 제공해 주는 서비스입니다. 본 페이지에서는 웹트렌드 서비스 활용 예시를 통해, 활용 흐름을 설명하겠습니다.

2.키워드 검색

먼저, 추이를 확인하고 싶은 키워드(단어)를 선정하여 검색창에 입력합니다. 최대 5개까지 입력하실 수 있으며, 본 예제에서는 "경제" 라는 단어를 선택하였습니다. 같이 검색하고 싶은 단어들을 쉼표(,) 구분하여 추가해 봅니다. 예제에서는 "취업", "창업" 이라는 단어를 추가한 후 검색버튼을 클릭합니다.

다음과 같이 웹아카이브 내 해당 연도 수집 자료 중 "경제","취업","창업" 이라는 단어들이 출현한 비율을 (출현횟수 / 자료수) 연도별로 표현한 그래프가 페이지에 표시됩니다.

웹트렌드 활용예제
3.그래프 분석 및 활용

전체 그래프는 맨 위의 "메인그래프", 하단의 "키워드비중", "수집년도 구분", "도메인 구분" 으로 나뉩니다. 각각 그래프는 마우스의 움직임에 대해 반응하도록 구현되어 있습니다.

웹트렌드 활용예제

메인그래프에서 확인할 수 있듯 "경제" 키워드는 다른 키워드에 비해 많은 출현률을 보이고, 시간이 지날수록 출현률이 낮아지는 경향을 보이고 있으며, 또한 "취업" 과 "창업" 키워드는 시대별로 서로 상반되는 출현률을 보이고 있습니다. 이렇게 키워드들이 지닌 각각의 의미와 특징을 토대로 이용자의 지식과 결합하여 다양한 사건들을 추론해 볼 수 있습니다.

"경제" 키워드의 기울기는 "취업" 키워드의 기울기와 비교적 유사한 성향을 보이고 있습니다. 여기에서 "경제" 키워드의 기울기가 낮아짐은 실제 경제 지수가 나빠지거나 좋아짐을 의미하는 것이 아니며, 웹사이트에서 "경제" 라는 단어의 사용 빈도가 점차 낮아짐을 의미합니다. (수많은 단어들이 섞여있는 웹아카이브 자료 중 "경제" 단어가 작년에 비해 사용되는 빈도가 줄어듦 → 사람들이 "경제" 단어에 대한 관심이 줄어듦을 유추) 2014년을 기점으로 사람들이 "경제","취업" 단어에 대한 관심이 점차 줄고 "창업" 이라는 단어에 관심이 소폭 증가함을 확인할 수 있습니다.

웹트렌드 활용예제

그래프는 "도표내려받기" 버튼을 클릭하여 이미지 형태로 내려 받으실 수 있습니다, 또한 "엑셀내려받기" 버튼을 클릭하여 수치데이터만 내려 받는 것도 가능합니다.

4.외부자료 혼합

검색된 자료를 그래프로 분석한 자료들에 개인의 지식, 또는 각종 리서치 자료, 공공데이터 등 다른 데이터들을 연계하면 더 풍부한 의미를 부여할 수 있습니다. 가령 위의 경우 단순하게 지난 몇 년간의 흐름을 파악할 수는 있었지만 그것의 원인이 무엇인가를 유추할 수는 없습니다. 이 경우 "경제지표", "직장인 급여통계", "근로시간 통계" 등 원인이 될 수 있는 데이터들을 연계해 보고, 상관관계를 파악해 볼 수 있습니다. 예제에서는 "임금근로자 근로시간"을 연계해 보겠습니다. (자료는 국가주요지표 사이트[http://www.index.go.kr]에서 발췌했습니다.)

웹트렌드 활용예제

방법은 메인그래프 상단의 "내자료올리기" 기능을 사용합니다. 연도별 입력창에 수치 데이터를 입력하고 "내자료올리기" 버튼을 클릭합니다. (이 때 누락된 연도의 수치는 전년도 수치를 사용하며, 데이터가 있는 부분만 보고 싶으시면 메인 그래프에서 마우스를 드래깅 해 주시면 됩니다.)

웹트렌드 활용예제

근로시간 자료를 그래프에서 합성하면 "근로시간"의 그래프 기울기 성향이, "창업" 의 그래프 기울기 성향과 매우 유사하게 보이고 있습니다. 따라서, 근로자의 근로시간이 "취업", "창업" 과 어느 정도 영향 관계에 있는 것은 아닐지 추론해볼 수 있습니다. 이 외에도 다양한 공공데이터들을 연계하여 수많은 상황과 의견을 추론해 볼 수 있습니다.

웹트렌드 활용예제
5.상세검색결과

그래프 하단에는 입력된 키워드에 대한 웹페이지 검색 결과가 표시됩니다. 예제에서는 약 190만 여건의 검색결과가 표시됩니다. 여기서 "키워드비중", "수집년도구분", "도메인구분" 그래프를 클릭하시면 각각 키워드, 수집년도, 도메인을 기준으로 검색결과를 줄여나갈 수 있습니다. 예제에서는 "취업" 키워드를 클릭하여 63만 건으로 , "2015년도"를 클릭하여 8만 건으로, ".go.kr" 도메인을 클릭하여 1만 건으로, 마지막으로 결과내 재검색에서 "고용" 키워드를 검색하여 최종 3천 건으로 줄어든 결과를 확인할 수 있습니다.

웹트렌드 활용예제
6.기타

앞으로 대한민국 웹사이트의 망라적 수집이 확대되고 누적되면, 웹트렌드 검색결과와 다양한 데이터들을 융합함으로써 과거에서 현재에 이르는 키워드 관심도 추이 변화를 통해 사회현상에 대한 근거자료나 미래 동향 분석을 하는데 더욱 도움이 될 수 있을 것으로 기대합니다.