2016년 10월 25일 화요일

빅데이터 활성화를 위한 메타데이터 플랫폼 구축



ICT 산업에서 빅데이터는 최근 몇 년 동안 가장 관심을 끌었던 분야 중 하나였고, 다양한 산업 분야에서 빅데이터와의 연계를 위한 연구가 활발하게 진행되고 있다. 하지만, 아직까지 빅데이터를 활용하는 체계적인 방법이나 표준화된 가이드가 없는 것이 사실이다. 더구나, 데이터의 속성정보라 할 수 있는 메타데이터를 빅데이터에서는 어떻게 적용할 것인지에 대한 연구는 더 없는 실정이다. 이번 회에서는 빅데이터에서 찾고 있는 정보를 효율적으로 이용하기 위한 메타데이터에 대해 CJ O쇼핑 해외사업부 개발팀 곽대기 팀장을 만나 자세한 사항을 들어본다. 

Q: 본격적인 이야기 전에 메타데이터에 대해 설명을 부탁 드립니다. 

메타데이터는 다른 데이터를 설명해주는 구조화된 데이터라고 할 수 있습니다. 흔히, 우리가 영화를 하나 보려고 할 때, 영화의 제목, 상영시간, 등급, 주연, 줄거리 같은 것을 살펴보게 되는데 이러한 정보를 메타데이터라고 할 수 있습니다. 우리가 지금까지도 사용하는 관계형 데이터베이스(Relation Database)에서는 저장해놓은 데이터를 어떻게든 빨리 찾으려고 했습니다. 이럴 때 메타데이터를 활용하게 되는데, 예를 들면 인덱스(Index)를 지정해서 찾는 방법도 한 종류라 할 수 있지요. 사전적인 의미로 정리하자면, 일반적인 데이터는 실제 데이터를 말하는 것이고, 메타데이터는 데이터를 구성하는 속성이나 정보를 말하는 것입니다(그림1). 


 <그림1> 마스터 데이터와 메타데이터 

 출처: Gartner 


댓글 없음 :

댓글 쓰기