SNS-based Anxiety Analysis

구 데이터 (2016-2017) 버전 이동

About SNS-based Anxiety Analysis

1. 개요

SNS-based Anxiety Analysis는 크롤러를 통해 수집된 트위터 메시지를 기반으로 각 지역 및 기간별 불안지수를 시각화하여 보여주는 시스템입니다.

지역은 광역시도 및 시군구 단위까지 지원하며, 기간은 1주일 단위로 조절할 수 있습니다.

2020년 5월 18일 기준 약 3,800,000여 개의 트위터 메시지를 기반으로 산출된 데이터를 표시하고 있습니다.

2. 기능별 설명

2-1. Anxiety Map

Anxiety Map은 각 지역 및 기간별로 산출된 불안지수를 시각화하여 보여주는 메뉴입니다.

불안지수는 상대불안지수, 절대불안지수의 두 가지 종류가 있습니다.

절대불안지수는 선택된 기간과 지역에서 작성된 전체 트위터 메시지 중 불안 감정을 내포하고 있다고 판별된 메시지의 비율입니다. 절대불안지수는 0에서 1 사이의 값을 갖습니다.

상대불안지수는 선택된 기간 내에서 선택된 지역의 절대불안지수를 전국 광역시도/시군구의 절대불안지수의 표준편차를 이용해 정규화시킨 값입니다. 0보다 값이 높을수록 전국 광역시도/시군구 대비 불안지수가 높다는 뜻이며, 0보다 값이 낮을수록 불안지수가 낮다는 의미입니다.

상단 바의 토글 버튼을 누르면, 지도에 표시되는 불안지수의 종류를 전환할 수 있습니다. 토글 버튼 옆에 Normalized가 표시되어 있다면 상대불안지수, Absolute가 표시되어 있다면 절대불안지수가 지도 상에 표시되어 있다는 의미입니다.

지도상에 표시된 각 광역시도/시군구 영역 위에 마우스를 올리면 해당 지역의 인구 수, 트위터 메시지 수, 불안 감정을 내포하고 있다고 판별된 메시지 수, 불안지수를 확인할 수 있습니다.

각 광역시도/시군구 영역을 클릭하면 해당 지역에서 작성된 트위터 메시지를 기반으로 그려진 WordCloud 및 트위터 메시지 원본을 확인할 수 있습니다.

Anxiety Map 아래의 슬라이드 바 양쪽 버튼을 움직이면 조회 기간을 변경할 수 있습니다. 원하는 기간을 선택한 후, 적용 버튼을 누르면 해당 기간에 작성된 트위터 메시지를 기반으로 계산된 불안지수의 분포 지도와 WordCloud 및 트위터 메시지 원본을 확인할 수 있습니다.

2-2. WordCloud

WordCloud는 선택된 지역 및 기간에 쓰여진 트위터 메시지에 대해 많이 쓰인 단어들을 시각화하여 보여줍니다.

상단 바의 토글 버튼을 누르면, WordCloud를 생성하는 데 쓰이는 트위터 메시지의 종류를 전환할 수 있습니다. 토글 버튼 옆에 All Tweets가 표시되어 있다면 선택된 지역과 기간에 작성된 모든 트위터 메시지에 포함된 단어를 이용해 WordCloud를 생성했다는 의미입니다. 토글 버튼 옆에 Anxious Tweets가 표시되어 있다면 선택된 지역과 기간에 작성된 트위터 메시지 중 불안 감정을 내포하고 있다고 분류된 트위터 메시지에 포함된 단어를 이용해 WordCloud를 생성했다는 의미입니다.

2-3. Tweets List

Tweets List는 선택된 지역 및 기간에 쓰여진 전체 트위터 메시지를 보여줍니다.

WordCloud의 상단 바 토글 버튼을 누르면, WordCloud를 작성하는 데 쓰인 트위터 메시지의 종류가 전환됨과 동시에 Tweets List에 표시되는 트위터 메시지의 종류도 전환됩니다. 토글 버튼 옆에 All Tweets가 표시되어 있다면 선택된 지역과 기간에 작성된 모든 트위터 메시지를 보여줍니다. 토글 버튼 옆에 Anxious Tweets가 표시되어 있다면 선택된 지역과 기간에 작성된 트위터 메시지 중 불안 감정을 내포하고 있다고 분류된 트위터 메시지를 보여줍니다.

불안 감정을 내포하고 있다고 분류된 트윗의 경우에는, 불안 감정 분류기가 어떠한 특정 단어를 근거로 해당 트위터 메시지를 불안 감정을 내포하고 있다고 분류했는지 표시됩니다. 색깔이 빨간색에 가까울 수록 해당 단어가 불안 감정과 연관이 높다고 판단했다는 의미입니다.

상단 검색 창을 통해 특정한 단어가 포함된 트위터 메시지만 검색하여 확인할 수 있습니다.

3. 불안 감정 분류기

본 시스템에 사용된 불안 감정 분류기는 딥러닝 기술을 기반으로 개발되었습니다. 최신 언어 모델인 BERT를 기반으로 개발되었으며 추가로 Attention Mechanism 기술도 사용되었습니다.