인류 5000년 축적된 데이터가 단 하루만에 생산되다

인류 5000년 축적된 데이터가 단 하루만에 생산되다

지난 2회분 기사를 통해 4차 산업혁명의 3가지 키워드와 사물인터넷(IoT, Internet of Things)의 세계에 대해 살펴봤습니다. 이번 시간에는 사물인터넷과 필연적으로 연결될 수밖에 없는 빅 데이터에 관해 알아보고자 합니다.
지난 기사에서 냉장고에 IT와 인터넷이 담기면, 즉 냉장고가 IoT화 되면 어떤 변화들이 생길 수 있는지 살펴봤지요? 음식물의 신선도 관리는 물론이고, 부족한 식품이 인터넷 쇼핑을 통해 자동으로 채워질 거라고 했습니다. 그런데 과연 변화는 이뿐일까요?
 
냉장고는 각종 센서와 카메라, 칩을 통해 집주인이 1년 동안 어떤 식재료를 많이 구매했는지 파악이 가능할 겁니다. 주인의 식재료 구매 패턴으로 봤을 때 현재 주인 신체의 영양소 상태가 어떠할 것인지도 예측할 수 있겠죠? 눈에 띄게 부족한 영양소가 있다면 냉장고는 어떤 식재료를 사면 좋을 것인지 추천해 줄 수 있을 겁니다. 더 나아가 식재료 구매 패턴을 통해 주인의 건강 상태에 대해서도 파악이 가능할 겁니다.
 
예를 들어 채소의 소비는 적은데 육류의 소비는 평균보다 지나치게 많다면 과체중이나 고혈압, 고지혈증 등의 질병에 걸릴 확률이 높다는 분석이 나올 겁니다. 그럴 경우 적절한 병원을 미리 소개하거나 운동법, 운동기구 등을 추천할 수 있겠죠? 1년 동안 끼니때 냉장고 문이 열리지 않은 횟수가 집계되면, 주인이 바깥에서 식사하는 횟수도 같이 집계될 수 있을 겁니다. 즉, 주인의 외식이나 다이어트 횟수까지도 짐작해 외식을 좀 줄이고 적정 영양분을 섭취하라는 잔소리를 냉장고가 할 수도 있습니다.
 
이처럼 사물인터넷이 가져올 변화는 개인의 상상을 초월할 정도로 무궁무진합니다. 전 세계 판매된 냉장고 개수는 몇 개일까요? 냉장고는 한국에서만 적어도 수백만 대가 판매돼 있을 겁니다. 사물인터넷 시대의 냉장고 회사는 이들 수백만 대로부터 식재료 구매 패턴, 외식 패턴, 영양소 관리 상태, 건강 상태 등의 데이터를 전송받을 수 있습니다. 이를 통해 냉장고 회사는 단순히 냉장고 판매에 그치지 않고, 판매 이후 데이터 수집을 통해 다양한 맞춤형 서비스를 제공할 수 있게 됩니다. 쇼핑, 헬스, 미디어 등 제공할 수 있는 서비스는 상상 그 이상입니다. 사물인터넷이 데이터 수집으로 연결이 되면 우리는 ‘빅 데이터’를 만나게 됩니다.
 
물론 빅 데이터의 개념이 사물인터넷에서 파생된 건 아닙니다. 빅 데이터는 과거 아날로그 시대와는 비교할 수 없을 정도로 데이터가 늘어난, 디지털 시대의 대규모 데이터를 이르는 용어입니다. 아날로그 시대의 데이터가 주로 숫자였던 반면, 디지털 시대의 데이터는 숫자를 넘어 문자, 그래픽, 영상 등 형태가 다양하고 규모가 방대한 것이 특징입니다. PC와 인터넷의 활성화로, 즉 디지털 시대의 도래로 이미 빅 데이터는 주목을 받고 있었지만 사물인터넷 시대가 성큼 다가오면서 가히 데이터 규모가 가늠할 수 없을 정도로 폭발적인 증가세를 보일 것으로 예측돼 더욱 주목을 받을 수밖에 없는 상황이 된 것이죠. 삼성전자는 이미 자사의 모든 제품을 사물인터넷화 하겠다고 선언한 바 있습니다. 앞서 냉장고 사례에서 살펴봤던 것처럼 세상의 모든 전자기기가 매일, 매시간, 매분, 매초 데이터를 뿜어낸다고 생각해 보세요. 실로 어마어마한 데이터가 쏟아지지 않을까요?
 
실제로 사물인터넷 시대의 데이터 발생량에 대해 언급된 자료가 있습니다. KT경제경영연구소 등에 따르면 인류가 파피루스든, 종이든 기록을 남기기 시작한 이래로 2000년대 초반까지 생산된 정보의 총량은 약 20엑사바이트에 달하는 것으로 추정된다고 합니다. 엑사바이트는 1 다음에 0이 18개가 붙는 단위입니다. 조 단위를 넘어 100경을 일컫습니다. 그러니까 20엑사바이트는 2000경바이트를 의미합니다. 그런데 본격적인 디지털 시대의 진입으로 2010년대에 들어서는 매일 3엑사바이트의 정보량이 생산된다는 견해가 주류라고 합니다. 인류가 2000년 넘게 걸려 생산해 낸 정보의 양을 2010년대에는 1주일 만에 만들어낸다는 겁니다. 어마어마하죠.
 
앞으로 정보의 양은 더 급격히 늘어나 2020년이 되면 거의 90제타바이트에 달할 것이란 예측 자료도 있습니다. 1제타바이트는 1024엑사바이트(1조1000억기가바이트), 즉 2시간짜리 HD급 영화가 2500억 개 저장되는 용량입니다. 불과 4~5년 뒤에 100제타바이트의 데이터가 생산한다고 하니 그야말로 ‘빅’ 데이터의 시대가 코앞에 다가온 느낌입니다. 이렇게 데이터가 짧은 시간에 급증할 것으로 예측된 배경에는 사물인터넷이 있습니다. 사물인터넷 시대에는 데이터가 실시간으로 마구마구 쏟아지기 때문이죠. 그 데이터가 누군가에게 의미가 있든, 없든 말이죠.
 
여담입니다만, 디지털 시대가 오기 전에 이미 데이터 축적의 중요성을 간파한 사람들도 있습니다. 기록 습관이 있던 어떤 샐러리맨이 자신의 직장 생활 동안 먹은 점심 메뉴 목록을 하루도 빠지지 않고 평생 기록했다고 합니다. 한 외식업체가 이 데이터에 눈독을 들여 한 해 연봉이 넘는 거금을 주고 샀다는 뉴스가 몇 년 전 보도됐었죠. 외식업체 입장에서는 이 데이터를 통해 직장인들의 선호 메뉴와 점심식사 패턴을 알고 싶었을 겁니다. 점포 입점이나 메뉴 선택 및 개발에 있어 매우 유용한 정보였을 테니까요. 하지만 요즘 같은 디지털 홍수 시대에 그런 아날로그 정보를 고가에 매입하는 경영자는 별로 없을 겁니다. 그런데 불과 몇 년 전만 해도 이런 아날로그 정보가 고가에 팔렸다는 점, 그리고 어느 시대에나 데이터의 중요성은 매우 컸다는 점은 주목할 만한 지점이 아닌가 싶습니다.
 
빅데이터를 잘 활용한 기업 사례로는 미국의 동영상 스트리밍 서비스 기업 ‘넷플릭스’가 꼽힙니다. 지난해에는 한국에도 진출했었죠. 넷플릭스는 한국에서 한 때 동네 곳곳에 존재했던 비디오대여점과 비슷한 서비스를 제공하던 기업입니다. 온라인에서 DVD 렌탈 서비스로 사업을 시작했죠. 하지만 이들은 현실에 안주하지 않고 새로운 시대의 흐름을 잘 탔습니다. 디지털 시대에 맞춰 2004년 동영상 스트리밍 서비스 기업으로 변신했고, 2012년에는 ‘하우스 오브 카드’ 등 영화와 드라마를 제작하는 콘텐츠 기업으로 다시 변신했습니다.
 
넷플릭스가 짧은 시간에 미디어 업계의 절대 강자로 성장하게 된 배경에는 ‘데이터’가 있습니다. 자체 컴퓨터 프로그램을 활용, 마케팅 비용과 효과를 철저하게 데이터에 기반해 수립하고 분석했습니다. 회원 1명을 확보하는데 들어가는 비용과 이 회원이 일으키는 매출액을 끊임없이 조사하고 분석한 거죠. 데이터가 아닌 업계 관행이나 경영진의 감각에 기댄 경쟁업체들이 넷플릭스를 이길 리는 만무했죠. 그리고 ‘시네매치’라는 알고리즘을 개발해 회원들에게 동영상 추천 서비스를 제공했는데요, 이 알고리즘이 얼마나 회원들의 데이터를 정밀하게 분석했는지 추천 동영상의 시청비율이 자그마치 75%에 달했다고 합니다. 100명에게 추천하면 75명이 돈을 내고 시청을 했다는 거죠.
 
넷플릭스는 동영상 유통에서 한 걸음 더 나아가 콘텐츠 제작에 나섭니다. 여기에도 어김없이 ‘빅데이터’를 활용했죠. 영국의 BBC 프로그램을 리메이크 한 ‘하우스 오브 카드’라는 작품이 대표적입니다. 넷플릭스는 회원 데이터 분석을 통해 BBC 시청자들이 배우 케빈 스페이시와 데이비드 핀처 감독을 좋아한다는 사실을 알아냈습니다. 이들은 해당 배우와 감독이 포함된 제작진을 구성했고, 무려 1억 달러를 투자해 엄청난 흥행 성적을 거뒀습니다. 데이터로부터 성공에 대한 확신을 얻지 못했다면 아마 1억 달러라는 거금을 투입하기 어려웠을 겁니다.
 
빅데이터는 미디어 분야뿐만 아니라 우리 사회 거의 전 분야에 활용되고 있습니다. 온라인 유통업체인 아마존은 구매 이력, 검색 키워드, 쇼핑카트 목록 등 고객의 데이터를 활용해 맞춤형 상품 추천 서비스를 제공하고 있습니다. 구글은 실시간 자동번역 시스템에 빅데이터를 적용한 데 이어, 의료 영역에도 이를 활용했습니다. 독감과 관련된 검색어 빈도를 조사해 ‘구글 독감 동향(Google Flu Trends)’이라는 조기경보 체계를 구축한 것입니다. 이 경보 체계는 미국 질병통제예방센터보다 1~2주 빠르게 확산 경로를 예측했다고 하니 빅데이터의 힘이 어느 정도인지 실감이 나게 합니다. 빅데이터는 정치 영역에서도 힘을 발휘합니다. 지난해 미국 대통령 선거에서 신뢰도 높은 각종 기관의 여론조사가 판판이 빗나간 데 반해 빅데이터에 기반한 분석에서는 ‘도널드 트럼프’의 당선이 여러 곳에서 예측됐다고 하죠. 이제 선거에서도 빅데이터를 읽어야 승리하는 시대가 된 것 같습니다.
 
여러분은 빅데이터 시대에 어떤 데이터를 분석해 내 삶과 가족, 우리 사회를 보다 윤택하게 만들고 싶으신가요?
0 0 votes
Article Rating
Subscribe
Notify of
guest
0 댓글목록
Oldest
Newest
Inline Feedbacks
View all comments
error: 기억 잘하는 10가지 훈련😃기억력스포츠를 시작하세요
0
Would love your thoughts, please comment.x
()
x
0
    0
    장바구니
    장바구니가 비었습니다쇼핑 계속하기