본문 바로가기

이전 글 보기

많은 정보 vs 필요한 정보: 빅데이터시대의 큐레이션 서비스

336x280(권장), 300x250(권장), 250x250, 200x200 크기의 광고 코드만 넣을 수 있습니다.
사람들은 지금을 정보화시대라고 말한다. 나 역시도 같은 생각이다. 수 많은 정보가 오고가며 많은 사람들이 이러한 정보를 보는데 자유롭고 또 익숙해져간다. 이런 가운데 자신이 필요한 정보, 돈이 되고, 힘이 되는 정보들은 말 그대로 POWER 가 된다. 그렇다. 지금의 정보화시대에서의 권력과 힘은 바로 정보에서 나오는 것이다. 하지만 단점도 있다. 이렇게 셀 수 없이 많은 정보들이 오고가는 가운데 정장 자신에게 필요하고 힘이 되는 정보를 찾는 것은 여간 어려운 일이 아닐 수 없다.

바로 이러한 부분 때문에 빅데이터(Big Data)라는 것이 등장했다. 이러한 기술(?)과 원리에 등장으로 그에 파생되는 서비스도 발생하게 되었고 그 대표적인 사례가 바로 큐레이션 서비스가 아닌가 생각이 된다. 아 여기서 잠시 큐레이션과 빅데이터는 대체 무엇일까?


순서가 조금 바뀐 듯 하다. 우선 빅데이터와 큐레이션 서비스에 대해서 설명부터 하고 넘어가자.


Big Data & 
Curation

우선은 빅데이터(
Big Data)에 대해서 설명하도록 하겠다. 빅데이터를 단순하게 "큰 정보"라고 생각하면 안 된다. 빅데이터는 이미 존재하여 있는 데이터베이스의 관리도구의 여러기능<수집, 저장, 관리, 분석 등>을 뛰어넘어 많은 정형과 비정형의 데이터에서 가치를 추출하며 이를 결과로 분석하는 기술을 의미한다. 

이런 빅데이터 기술은 지금 위에서 말했던 정보화시대에 들어서면서 부터 더욱 각광받기 시작했고 이를 통해서 과거에는 어렵다고 생각했었던 심지어는 불가능하다고 했던 기술들도 실현이 가능하게 되었다. 이런 효과성 때문에 사회 전반에 걸쳐서 이 빅데이터 기술을 이용하고 있고 또 주목받고 있다. 

2012년 세계경제 포럼에서는 위 빅데이터 기술을 10대 기술 중 하나로 선정하기도 하였으니 그 이용 값어치가 향후 얼마나 더 될지는 몹시도 기대가 되는 부분이다.


그럼 이제는 큐레이션(
Curation)에 대해서 설명하도록 하겠다. 큐레이션 서비스에서 "딱" 생각나는 직업은 바로 큐레이터이다. 큐레이터는 박물관, 미술관 등에서 작품 등을 수집, 전시 기획 등을 하는 직업인데 이들이 하는 작업을 큐레이션이라고 하지 않을까? 생각된다. 즉, 작품을 전시, 기획, 수집하여 전시장을 방문한 손님들이 보다 편하고 보기 쉽게 전시를 하는 일을 큐레이션이라고 하는 것 같다. IT에서의 큐레이션이란 이와 비슷하다고 생각하면 된다. 

그러니까 큐레이션 서비스는 "다양한 그리고 많은 정보를 수집해서 어떤 특정 부분에 관심이 있는 사람들이 이를 더 보기 편하고 쉽게 하기 위한 서비스"라고 생각하면 된다. 또한 큐레이션에서 뒤쪽 서비스를 뺀다면 큐레이션 이라고 하는 하나의 행동으로써 수집된 그리고 전시된 정보를 배포하는 개인 배포자가 될 수 도 있다. 즉, 빅데이터라고 하는 것이 특정 DB를 다룰 수 있는 전문가들이 할 수 있는 것이라면 큐레이션은 각 개인도 쉽게 할 수 있는 것이 된다.


빅데이터(Big Data) & 큐레이션(Curation) 의미가 있나?


그럼 이제 본론으로 넘어가 보자. 내가 이렇게 빅데이터와 큐레이션에 대해서 말하고자 하는 것은 처음에 말했던 셀수 없이 많은 정보를 정리하고 보여줌으로 그 가치를 더 높게 창출할 수 있는 부분이 있기 때문이다. 정보의 바다라고 불리는 지금의 인터넷(웹)상에서는 가치있는 정보 뿐 아니라 잘못된 정보도 매우 많다. 또한 자신에게 필요한 정보일 수도 있지만 반대로 자신에게 별 도움이 되지 않은 정보일 수도 있다.

그럴듯한 낚시기사의 제목, 부정확한 지식인의 답변, 내용없는 기사 우리는 이런 것들에 항상 노출되어 있고 마치 이것이 진실이고 사실인냥 오인하는 수도 있다. 여기서 오류가 생기고 문제가 발생하기도 하고 말이다. 이런 상황가운데 내가 말했던 빅데이터 기술가 큐레이션 서비스는 큰 도움이 될 수 있다. 

큐레이션 서비스를 예로들어 보자. 대표적인 것들은 네이버의 오픈케스트, TNM의 서비스, 최근에 론칭한 인터레스트미, 다음의 다음뷰 서비스등은 어떤 주제나 포커스에 맞추어 수집된 콘텐츠를 보여준다. 이를 통해서 A라는 주제에 관심이 있는 사람은 A 큐레이션 항목에서 내용을 확인할 수 있고 B에 관심이 있는 사람은 B에서 보면 된다. 

빅데이터를 예로 들어 보자면 A, B, C 라는 데이터를 추출하고 이를 통해서 알파벳이라는 결론이 지어지고 알파벳이라는 것으로 새로운 가치를 낼 수 있는 다른 정보를 다시 이용자에게 보여줄 수 있다. 이런식으로 우리는 이 두가지 기술력으로 보다 <개인적으로> 가치있는 정보와 데이터를 확인하고 다룰 수 있게 되는 것이다. 이로써 더 높은 부가가치를 창출 할 수 있기도 하고 말이다.

 
빅데이터(Big Data) & 큐레이션(Curation) 주의 할 것은 없나?


하지만 이렇다고 하더라도 분명 주의해야 할 것은 있다. 바로 오류와 관리/감독이다. 이 두 서비스는 분명 정보를 가치있게 만드는 작업을 하는 역할을 한다. 하지만 이 두 기술이 받아보는 정보가 100% 확실하고 정확한 것이라고는 할 수 없다. 이와 같은 부분 때문에 이러한 서비스를 제작하고 관리하는 업체는 관리와 감독 그리고 오류 최소화에 힘을써야 할 것이다.

한글이라는 것에 대한 정보를 찾는 중에 제목에 한글이 들어가 있어서 데이터를 집어 오는 경우가 있다고 생각해보자. 그런데 여기서 수집한 콘텐츠의 제목이 "한글과는 다른 알파벳 그 역사를 돌이켜보자" 라고 하여서 수집을 했다고 한다면 한글에 대한 내용은 없고 알파벳의 역사에 대한 부분만 있을 것이다.

예시와 같이 이러한 부분에 대해서 오류를 찾아내고 수집된 콘텐츠를 사용자<이용자>에게 보여줄 시 수집된 정보 혹은 데이터 꾸러미를 검사하고 확인할 수 있는 즉, 관리/감독 시스템도 고려를 해보아야 한다고 생각한다. 

또한 큐레이션 서비스에 정보를 올려 놓는 각 개인의 경우에는 자신의 큐레이션의 콘셉트나 포커싱을 정확하게 하고 이를 본 타 사용자들이 원하는 정보에 최대한 가까워 질 수 있도록 하는 것이 좋을 듯 싶다. 예를 들어서 음악 리스트를 째즈라고 해놓고 쌩뚱맞게 "강남스타일" 곡이 들어가 있다면 이는 깨끗한 큐레이션은 아니란 것이다. 


그래도 
빅데이터(Big Data) & 큐레이션(Curation)는 가치있는 일


분명 아직까지 
빅데이터(Big Data) & 큐레이션(Curation) 은 발전해야하고 개선해야할 부분들이 있다. 하지만 처음부터 온전하고 완벽한 서비스는 없다. 지속적이고 점진적인 그러면서도 긍정적인 발전을 계속해 나아간다면지금의 데이터 홍수라 불리는 시대에 자신에게 필요한 정보를 원하는 이들로 하여금 큰 만족을 불러 일으킬 수있지 않을까?