2016년 8월 29일 월요일

R을 활용한 기상 데이터 시각화 및 활용 - 사례연구

출처: 국립기상연구소

기상 데이터는 대기의 상태를 포함한 기상현상을 과학적 방법으로 관찰하거나 측정해서 지역별로 일기나 날씨를 예측하여 국민들에게 제공되고 있다(그림6). 국립기상연구소는 종합기상정보시스템을 통해 유관기관과 국민에게 직관적인 정보를 제공하고자 R을 활용하여 기상 데이터를 시각화하여 제공하고 있다.


<그림6> 기상 데이터 흐름도


국내 자동 기상 관측망인 AWS/ASOS를 통해 전국 573개 지점, 수평 해상도 13km, 1분 단위의 데이터 수집을 통해 기상 데이터를 수집하여 분석되며, 홈페이지를 통해 실황 자료, 초단기 예보, 단기 예보가 제공되고 있다. 그림7은 풍속, 풍향에 대한 예제를 보여주고 있으며, R의 coord_polar() 함수를 통해 시각화하고 있다.


<그림7> 풍속, 풍향 데이터 시각화 예제




인포그래픽(Infographic)



정보 그래픽이라고도 하는 인포그래픽은 정보와 데이터, 지식을 시각적으로 표현하는데 복잡한 정보를 빠르고 명확하게 전달하는 것이 핵심이다. 교통 표지판이나 복잡한 지하철 노선도 등이 대표적이다. 하나의 도표나 이미지에 수많은 정보를 요약해서 전달하기 때문에 신문이나 방송 같은 미디어나 교육 분야에서 활용이 많이 되고 있다. 그림3은 그림1의 “한눈에 보는 2012년 서울시 예산”을 인포그래픽으로 표현한 것이다. 그림1도 직관적으로 해석을 할 수 있지만 그림3은 분야별 예산 비교가 좀더 명확하게 표현되어 있다.


<그림3> 인포그래픽의 예
출처: 연합뉴스 데이터


빅데이터 시각화

앞에서 언급된 데이터 시각화, 정보 시각화, 인포그래픽은 빅데이터를 시각화하는 방법이라고 할 수 있다. 빅데이터 시각화는 보는 사람의 흥미를 유발 시키고, 정보를 습득하는 시간을 단축 시켜 빠른 상황 판단을 할 수 있다. 그리고, 정보를 빠르게 확산할 수 있고, 한번 보고도 자료를 오래 기억할 수도 있다. 무엇보다 정보에 대해 효과적으로 커뮤니케이션 할 수 있다. 빅데이터 시각화는 크게 2 가지로 분류된다. 하나는 객관적인 정보를 전달하는 “정보형”, 또 다른 하나는 주장하는 것을 알리는 “설득형” 이다. 빅데이터 시각화는 설득형보다는 정보형에 약간 더 가깝기 때문에 객관적인 데이터에 기반한 정보를 제공한다(그림4).


<그림4> 정보 디자인에서 빅데이터 시각화의 영역
출처: 숙명여자대학교의 빅데이터 분석



정보 시각화(Information Visualization)



데이터 시각화를 위해서는 수집된 정보를 분류하고 배열하여 조직화한 후, 효율적인 정보 전달을 위해 시각, 청각 등의 감각 기관에 최적의 자극을 제시한다. 마지막으로, 정보를 사용자가 잘 인지할 수 있도록 사용자 상호작용(User Interaction or User experience)를 제공한다(그림2).


<그림2> 정보 시각화 절차

그림2에서 나타난 절차에 대한 자세한 설명은 아래 사이트의 정보 시각화 단락을 참고한다.