도서 소개
미국의 정보 기술 연구 회사 가트너는 2015년 신기술 마케팅 트렌드 보고서에서 '빅데이터'라는 키워드를 삭제했다. 이는 빅데이터의 가치 상실이 아니라 이제는 단순히 ‘데이터’로 불려도 무방할 정도로 기본적인 개념으로 자리잡았음을 뜻하는 것이다. 저자 역시 이 책에서 빅데이터를 (빅)데이터라고 표기하곤 한다. 빅데이터는 더 이상 특수계층만을 위한 선택이 아니라 필수라는 의미이다.
이 책에는 20년 넘게 관련 업계에서 데이터 분석으로 100억 달러에 이르는 비즈니스 의사결정을 도운 저자의 경험과 지식이 담겨있다. 빅데이터를 잘 모르는 사람들을 위해 1부에서 개념 설명을, 빅데이터를 활용하고 싶은 사람들을 위해 2부에서 아마존, 넷플릭스, 구글 등 글로벌 초일류 기업들이 빅데이터를 어떻게 다루었는지 풍부한 실패와 성공 사례에 근거해 적절한 조언을 제시하고 있다.
빅데이터는 비즈니스의 성과와 결과를 혁신적으로 바꿀 수 있다. 그러나 이를 위해서는 효과적인 활용이 무엇보다 중요하다. 이 분야 최고 전문가, 데이비드 스티븐슨의 조언에 귀를 기울여보는 것을 권장한다. 아래와 같은 효과를 거쳐 빅데이터가 당신의 회사를 획기적으로 바꾸고, 다양한 사업부의 핵심성과지표를 높이고, 응용프로그램의 성능을 개선하는 것을 보며 깜짝 놀라게 될 것이다.
출판사 리뷰
제2의 성공신화를 꿈꾸는 CEO들의 필독서!
미국의 정보 기술 연구 회사 가트너는 2015년 신기술 마케팅 트렌드 보고서에서 '빅데이터'라는 키워드를 삭제했다. 이는 빅데이터의 가치 상실이 아니라 이제는 단순히 ‘데이터’로 불려도 무방할 정도로 기본적인 개념으로 자리잡았음을 뜻하는 것이다. 저자 역시 이 책에서 빅데이터를 (빅)데이터라고 표기하곤 한다. 빅데이터는 더 이상 특수계층만을 위한 선택이 아니라 필수라는 의미이다.
이 책에는 20년 넘게 관련 업계에서 데이터 분석으로 100억 달러에 이르는 비즈니스 의사결정을 도운 저자의 경험과 지식이 담겨있다. 빅데이터를 잘 모르는 사람들을 위해 1부에서 개념 설명을, 빅데이터를 활용하고 싶은 사람들을 위해 2부에서 아마존, 넷플릭스, 구글 등 글로벌 초일류 기업들이 빅데이터를 어떻게 다루었는지 풍부한 실패와 성공 사례에 근거해 적절한 조언을 제시하고 있다.
빅데이터는 비즈니스의 성과와 결과를 혁신적으로 바꿀 수 있다. 그러나 이를 위해서는 효과적인 활용이 무엇보다 중요하다. 이 분야 최고 전문가, 데이비드 스티븐슨의 조언에 귀를 기울여보는 것을 권장한다. 아래와 같은 효과를 거쳐 빅데이터가 당신의 회사를 획기적으로 바꾸고, 다양한 사업부의 핵심성과지표를 높이고, 응용프로그램의 성능을 개선하는 것을 보며 깜짝 놀라게 될 것이다.
- 지금 수집하면 가장 쓸모가 있는 데이터가 무엇인지, 그리고 데이터 수집이 왜 중요한지 이해하게 된다.
- 빅데이터와 데이터 과학, 인공지능을 이해하고 비즈니스 목표 달성과 경쟁우위 확보에 어떤 도움이 되는지 알 수 있다.
- 클라우드 기반 시스템의 활용 여부를 포함하여 빅데이터 시스템 선택시 고려해야 하는 사항에 대해 파악할 수 있다.
- 효과적 데이터 전략과 데이터 기반의 비즈니스를 지원하는 빅데이터팀을 조직할 수 있다.
경영자에겐 이윤을, 실무자에겐 효율을
빅데이터는 더 이상 빅데이터가 아니다.
책 소개에서도 나와있듯이 빅데이터는 이제 기업 경영에 있어 선택이 아니라 필수 요소로 자리잡았다. 이 책은 우선 어떤 경위를 거쳐 빅데이터가 우리의 삶에 밀접한 관계를 맺게 되었는지 기술의 발달과 사회의 인식 변화에 대한 역사를 알기 쉽게 설명하며 시작한다.
인간 사회에 있어 빅데이터가 어떻게 불가분의 관계가 되었는지 머릿속에 개념 정립이 되는 순간, 저자는 갑자기 독자의 업무 패턴이나 운영하는 회사에 대해 날카로운 메스를 들이대도록 강요한다. 독자가 알고 있는 빅데이터에 대한 막연한 환상과 잘못된 정보를 제거하는 대수술을 감행하는 것이다.
그러나 두려워할 필요는 없다. 이 책을 전부 읽었을 때 쯤이면 독자는 빅데이터에 대해, 누구보다도 잘 알고 누구보다도 더 갈망하는 사람으로 다시 태어날 수 있기 때문이다. 저자는 글로벌 일류 기업들이 초일류 기업으로 거듭나게 된 과정을 풍부한 시각자료와 예시로 설명해주고, 각 장 말미에 핵심정리와 생각해보기를 삽입해 독자와의 문답을 시도하고 있다. 또한 100여 건에 달하는 참고 정보를 QR 코드로 첨부해 접근성을 극대화했다.
데이터 저장 공간 문제는 항상 골칫거리였다. 불과 얼마 전까지만 해도 우리는 휴가지에서의 즐거운 시간을 장당 1달러짜리 폴라로이드 사진으로 남겼다. 최고의 TV쇼와 음악 프로그램은 오래된 비디오테이프에 반복 녹화해서 봐야만 했다. 컴퓨터 메모리 역시 항상 부족했다. 그러나 더 새롭고 더 저렴한 기술이 개발되면서, 수도꼭지에서 물이 나오듯 데이터가 콸콸 쏟아지기 시작했다. 사람들은 디지털 카메라를 장만했고 컴퓨터를 네트워크에 연결했으며 싼 가격에 전자기기를 구입해 대용량의 데이터를 저장했다. 그럼에도 불구하고 여전히 데이터를 저장하고 폐기하는 일은 계속됐다. 남길 데이터를 선별해야만 했다. 데이터의 양이 점점 많아짐에 따라 기술 개발의 흐름에도 박차가 가해졌다. 덕분에 모두가 아주 손쉽게 데이터를 생산할 수 있게 되었다. 필름 카메라는 디지털 비디오 카메라를 거쳐 종국에는 스마트폰 카메라로 대체됐다. 이 최신기기를 이용해 우리는 일평생 다시 보지도 않을 동영상을 녹화하고 있다.
- 빅데이터 이야기
인공지능을 학습시킬 때는 라벨이 달린 방대한 데이터가 반드시 필요하다. 충분하게 학습되지 않은 인공지능은 실수를 할 가능성이 크다. 이미 자율주행차가 드문 (예를 들어, 학습되지 않은) 조건에서 치명적인 오류를 일으키는 사례가 목격되었다. 이렇게 인공지능이 오류를 일으키면, 사람들은 이를 그냥 두고 넘어가지 않는다. 그래서 인공지능에는 가치 시스템이 필요하다. 즉, 자율주행차에 탑재된 인공지능은 사람을 치는 것이 도로를 벗어나는 것보다 더 나쁜 일임을 알아야 한다. 그리고 상업 시스템은 고객 만족과 매출과 리스크 감소의 균형을 유지할 수 있어야 한다.
- 인공지능, 머신러닝 그리고 빅데이터
타깃의 분석가들은 매출 기록, 출생 신고 그리고 제3자 제공 정보 등 활용할 수 있는 모든 데이터를 꼼꼼하게 살폈다. 몇 달 이내에 그들은 이전 구매 내역을 기본으로 임산부를 식별해내는 통계 모델을 개발했다. 이 통계 모델의 정확도는 상당했다. 그리고 심지어 출산 예정일까지 거의 정확하게 예측해냈다. 통계모델이 개발되고 1년 뒤 어느 날, 화가 잔뜩 난 한 남자가 타깃의 미니애폴리스 지점에 들이닥쳤다. 그는 지점장을 만나게 해달라고 요구하며 “내 딸은 이제 고등학생인데…, 아기 옷과 아기 침대 쿠폰 광고 메일을 보내다니! 지금 그 애한테 임신이라도 하라고 부추기는 거야?”라고 소리를 질렀다. 그러나 그 아버지는 곧 자기 딸이 진짜 임신했다는 사실을 알게 되었다. 이 이야기가 신문에 실렸고 세상은 타깃이 ‘금광’과 ‘PR 지뢰밭’을 동시에 찾은 것에 놀라워했다.
- 빅데이터는 왜 유용한가
작가 소개
지은이 : 데이비드 스티븐슨
전 세계적으로 활동하는 IT 컨설턴트이자 연사이다. 주요 분야는 데이터 과학과 빅데이터 애널리틱스이며 코넬 대학교에서 박사 학위를 받은 후 펜실베이니아 대학교에서 교수로 재직했다. 공과대학과 와튼 스쿨에서도 강의를 했다. 유럽 및 미국에서 20년 넘게 관련 업계에 종사하며 데이터 분석 결과와 분석 툴로 100억 달러에 이르는 비즈니스 의사결정을 도왔고 일류 투자, 사모펀드, 경영 컨설팅 회사 등에서 전문 고문을 역임했다. 다수의 글로벌 비즈니스 기업에서 애널리틱스 프로젝트를 이끌었다. 미국 출신으로 2006년부터 암스테르담에 거주 중이며 본인이 운영하는 애널리틱스 사이트 <dsianalytics>를 통해 더 많은 정보를 확인할 수 있다.
목차
머리글 4
개요 10
제1부 빅데이터의 이해
1장 빅데이터 이야기 16
2장 인공지능, 머신러닝 그리고 빅데이터 40
3장 빅데이터는 왜 유용한가? 53
4장 (빅)데이터 애널리틱스의 사례 69
5장 빅데이터 생태계의 이해 94
제2부 빅데이터 생태계의 조성
6장 빅데이터와 비즈니스 전략 116
7장 빅데이터와 데이터 과학 전략의 수립 141
8장 데이터 과학의 활용 애널리틱스, 알고리즘, 머신러닝 - 167
9장 빅데이터 기술의 선택 200
10장 팀의 구성 218
11장 데이터 거버넌스와 법률 준수 246
12장 빅데이터 프로젝트의 성공적 도입을 위해 261
감사의 글 278
용어해설 279