홈 > 부모님 > 부모님 > 소설,일반 > 컴퓨터,모바일
현장에서 바로써먹는 데이터 분석 with R 이미지

현장에서 바로써먹는 데이터 분석 with R
심통 | 부모님 | 2021.08.05
  • 정가
  • 28,000원
  • 판매가
  • 25,200원 (10% 할인)
  • S포인트
  • 1,400P (5% 적립)
  • 상세정보
  • 25.7x18.8 | 0.745Kg | 392p
  • ISBN
  • 9791197529504
  • 배송비
  • 2만원 이상 구매시 무료배송 (제주 5만원 이상) ?
    배송비 안내
    전집 구매시
    주문하신 상품의 전집이 있는 경우 무료배송입니다.(전집 구매 또는 전집 + 단품 구매 시)
    단품(단행본, DVD, 음반, 완구) 구매시
    2만원 이상 구매시 무료배송이며, 2만원 미만일 경우 2,000원의 배송비가 부과됩니다.(제주도는 5만원이상 무료배송)
    무료배송으로 표기된 상품
    무료배송으로 표기된 상품일 경우 구매금액과 무관하게 무료 배송입니다.(도서, 산간지역 및 제주도는 제외)
  • 출고일
  • 1~2일 안에 출고됩니다. (영업일 기준) ?
    출고일 안내
    출고일 이란
    출고일은 주문하신 상품이 밀크북 물류센터 또는 해당업체에서 포장을 완료하고 고객님의 배송지로 발송하는 날짜이며, 재고의 여유가 충분할 경우 단축될 수 있습니다.
    당일 출고 기준
    재고가 있는 상품에 한하여 평일 오후3시 이전에 결제를 완료하시면 당일에 출고됩니다.
    재고 미보유 상품
    영업일 기준 업체배송상품은 통상 2일, 당사 물류센터에서 발송되는 경우 통상 3일 이내 출고되며, 재고확보가 일찍되면 출고일자가 단축될 수 있습니다.
    배송일시
    택배사 영업일 기준으로 출고일로부터 1~2일 이내 받으실 수 있으며, 도서, 산간, 제주도의 경우 지역에 따라 좀 더 길어질 수 있습니다.
    묶음 배송 상품(부피가 작은 단품류)의 출고일
    상품페이지에 묶음배송으로 표기된 상품은 당사 물류센터에서 출고가 되며, 이 때 출고일이 가장 늦은 상품을 기준으로 함께 출고됩니다.
  • 주문수량
  • ★★★★★
  • 0/5
리뷰 0
리뷰쓰기

구매문의 및 도서상담은 031-944-3966(매장)으로 문의해주세요.
매장전집은 전화 혹은 매장방문만 구입 가능합니다.

  • 도서 소개
  • 출판사 리뷰
  • 작가 소개
  • 목차
  • 회원 리뷰

  도서 소개

데이터 분석 현장 전문가가 데이터 분석 이론과 현장에서 필요한 실무 활용법과 노하우를 설명한다. 데이터 분석에 대해 자세히 이해할 수 있도록 데이터 분석의 개념, 발달 과정, 분석 과정을 알아보고 R 문법을 배운다. 가상의 1인 기업의 김대표를 등장시켜 병아리가 부화하고 성장하고 성별과 품종을 구분하고 닭의 체중을 예측하는 과정을 통해 통계 분석과 기본 그래프, 상관 분석과 회귀 분석, 분류 및 군집 분석 등의 이론과 실제를 학습할 수 있다.

  출판사 리뷰

현장에서 R을 다룰 때 필요한 이론과 활용법 수록!
가상의 1인 기업의 데이터 분석 스토리로, 프로젝트 전 과정을 배울 수 있다!


데이터 분석 현장 전문가가 데이터 분석 이론과 현장에서 필요한 실무 활용법과 노하우를 설명한다. 데이터 분석에 대해 자세히 이해할 수 있도록 데이터 분석의 개념, 발달 과정, 분석 과정을 알아보고 R 문법을 배운다.
가상의 1인 기업의 김대표를 등장시켜 병아리가 부화하고 성장하고 성별과 품종을 구분하고 닭의 체중을 예측하는 과정을 통해 통계 분석과 기본 그래프, 상관 분석과 회귀 분석, 분류 및 군집 분석 등의 이론과 실제를 학습할 수 있다. 인공 신경망과 딥러닝, 텍스트 마이닝까지 다룬다.




저자의 현업 데이터 분석 발전과정을 관찰할 수 있다는 것이 본 서적의 최고 강점이 아닐까 생각합니다. ‘김대표’라는 가상의 인물이 양계농장을 운영하면서 다양한 형태의 데이터를 접하고, 이를 분석해 해결해 나가는 것을 자연스럽게 따라간다면 그 수준의 편차는 존재할지라도 독자의 가슴 속에 데이터 분석의 마인드는 쉽게 장착될 것이라 확신합니다.
이 책은 저자가 실제로 R을 사용하며 겪었던 문제 상황과 R을 처음 다루면 누구나 겪을 수 있는 문제들을 정리하여 설명해 주고 있어서 책 한 권으로 데이터 분석의 기본을 쉽고 빠르게 배울 수 있습니다. 데이터라는 용어 그 자체에 대한 이론적 설명, R을 활용한 통계분석을 거쳐 최근 화두가 되고 있는 딥 러닝 및 텍스트마이닝을 한 권의 서적을 통해 정돈된 방법으로 설명하고 있습니다.
문일경/서울대학교 산업공학과 교수

개인적으로, R을 사용해 데이터를 분석하는 책 중에서 가장 재밌게 읽었습니다. 많은 양을 꼼꼼하고 유머러스하게 설명했습니다. 깊이 있는 어려운 전문 내용과 얕고 쉬운 일반적인 내용 사이에서 전문가와 비전문가가 모두 만족할 만한 적절한 난이도를 가진 책이라고 생각됩니다. 적절한 요약과 연습문제는 필요하면 다시 찾아볼 수 있도록 잘 정리되어 있습니다. 번역서가 아니라는 점에서 저자의 전문성을 엿볼 수 있습니다. 지식을 소화해서 잘 전달하기란 여간 어려운 일이 아닌데 저자는 한 권의 책으로 자연스러운 흐름을 따라 데이터 분석에 대한 전반적인 내용을 잘 정리했습니다. 독자는 김 대표의 분석 스토리를 따르면 어느새 자신의 스토리를 만들고 싶다고 생각하게 될 것입니다.
오세민/부산대학교 빅데이터 기반 금융·수산·제조 혁신 산업수학센터 연구교수, 이학박사

  작가 소개

지은이 : 김임용
데이터로 밥 먹고 산지 10년이 조금 넘었습니다. 대학에서 산업공학을 전공하고, 철강회사에서 통계를 기반한 데이터 분석 업무를 수행하며 생산성 향상, 품질 부적합 예방, 원가절감 등 수익성 개선을 위한 다양한 업무를 수행했습니다. 이후 오퍼레이션 컨설팅 회사로 옮겨 타국에 위치한 국내 대기업 공장의 수익성 향상을 위한 컨설팅 업무도 경험했습니다.이러한 경험을 바탕으로 현재는 발전 공기업인 한국동서발전에서 인더스트리 4.0 전담 조직인 디지털기술융합원의 데이터 과학자로 근무하고 있습니다. 다양한 데이터 분석 방법론을 실제 현장에 적용해 문제를 해결하고, 새로운 가치를 창출하는 업무를 수행하고 있습니다. 뿐만 아니라 데이터 기반 의사결정 문화 확산을 위해 데이터 분석 강의 및 컨설팅 업무도 수행하고 있습니다. 세상에 정답은 없지만 그나마 데이터 안에 답이 있다고 믿으며 오늘도 쿼리를 짜고, PT 자료를 만듭니다.

  목차

Chapter 1 데이터 분석의 이해

1 데이터란?
1-1 데이터의 정의
1-2 데이터 → 정보 → 지식 → 지혜
1-3 빅데이터의 등장
1-4 빅데이터가 만들어 내는 변화
1-5 빅데이터의 활용
1-6 빅데이터와 인공지능

2 데이터 분석이란?
2-1 데이터 과학? 데이터 분석? 데이터 마이닝?
2-2 데이터 분석가와 데이터 과학자
2-3 도메인 지식

3. 데이터 분석의 발달 과정
3-1 통계학의 등장
3-2 사람들이 통계를 어려워하는 이유
3-3 컴퓨터의 등장과 인공지능
3-4 인공지능, 머신러닝 그리고 딥 러닝

4 데이터 분석 과정
4-1 데이터 분석의 결과물
4-2 데이터 분석 과정

5 데이터 분석 가이드 맵
[요약]
[연습문제]

Chapter 2 데이터 분석을 위한 준비

1 데이터 수집
1-1 데이터 수집 방법
1-2 데이터베이스에서의 데이터 수집 방법?SQL
1-3 웹에서의 데이터 수집 방법?웹 크롤링
1-4 API에서의 데이터 수집 방법

2 데이터 셋 준비 시 주의해야 할 점
2-1 분석에 적합한 데이터 형태
2-2 이항 데이터
2-3 범주형 데이터를 수치화시키는 방법?One?Hot Encoding

3 R & RStudio 설치하기
3-1 R이 무엇인가요?
3-2 R의 특징
3-3 R을 배울까요? 파이썬을 배울까요?
3-4 R 설치하기(Windows 기반)
3-5 R 설치하기(Mac OS 기반)
3-6 RStudio 설치하기(Windows 기반)
3-7 RStudio 화면 구성

4 Studio 새 프로젝트 만들기
4-1 새 프로젝트 만들기
4-2 프로젝트 저장하기
4-3 새 소스 탭 추가하기
4-4 소스 파일 불러오기

5 패키지 설치하기
5-1 패키지란?
5-2 패키지 설치하기(인터넷 연결 환경)
5-3 패키지 설치하기(Off-Line 환경)
[요약]
[연습문제]

Chapter 3 데이터 다루기

1 R 문법에 대한 이해
1-1 R 문법 체계
1-2 변수
1-3 주석 사용하기
1-4 도움말 및 예제 불러오기

2 데이터 프레임 다루기
2-1 데이터 프레임이란?
2-2 데이터 프레임 다루기
2-3 나머지 데이터 타입

3. 데이터 정제
3-1 결측치(NA)
3-2 이상치(Outlier)
3-3 스케일링(Scaling)
[요약]
[연습문제]

Chapter 4 통계 분석과 기본 그래프

1 어제까지 몇 마리의 병아리가 부화했을까?(기초 통계량)
1-1 데이터 불러오기
1-2 데이터 확인하기
1-3 기초 통계량 구하기
1-4 데이터 정렬하기
1-5 막대 그래프 그려보기
1-6 그래프 색상 바꿔보기
1-7 그래프 위에 텍스트 추가하기
1-8 그래프 위에 선 추가하기
1-9 파이 차트 그려보기

2 부화한 병아리들의 체중은 얼마일까?(정규분포와 중심극한정리)
2-1 데이터 불러와서 구조와 유형 확인하기
2-2 통계량으로 분포 확인하기
2-3 히스토그램으로 분포 확인하기
2-4 상자그림으로 분포 확인하기
2-5 다중 그래프로 분포 확인하기

3 사료 제조사별 성능 차이가 있을까?(가설검정)
3-1 데이터 불러와서 확인하기
3-2 상자그림으로 분포 비교하기
3-3 정규분포인지 검정하기
3-4 t-test로 두 집단 간 평균 검정하기
[요약]
[연습문제]

Chapter 5 상관 분석과 회귀 분석
1 병아리의 성장에 영향을 미치는 인자는 무엇일까?(상관분석)
1-1 상관분석이란?
1-2 데이터 불러와서 확인하기
1-3 상관분석을 위한 별도 데이터 셋 만들기
1-4 상관분석 실시
1-5 상관분석 결과 표현하기

2 병아리의 체중을 예측할 수 있을까?(회귀분석)
2-1 회귀분석이란?
2-2 단순 선형 회귀분석
2-3 다중 회귀분석
2-4 다중공선성
2-5 비선형 회귀분석
[요약]
[연습문제]

Chapter 6 분류 및 군집 분석
1 병아리의 성별을 구분할 수 있을까?(로지스틱 회귀)
1-1 로지스틱 회귀란?
1-2 데이터 불러와서 확인하기
1-3 로지스틱 회귀분석
1-4 분류 알고리즘의 성능 평가 방법
1-5 로지스틱 회귀모델의 성능 평가
2 병아리의 품종을 구분할 수 있을까?(분류 알고리즘)
2-1 다양한 분류 알고리즘
2-2 나이브 베이즈 분류
2-3 k-최근접 이웃
2-4 의사결정나무
2-5 배깅
2-6 부스팅
2-7 랜덤 포레스트
2-8 서포트 벡터 머신
2-9 XGBoost와 하이퍼 파라미터 튜닝
2-10 분류 알고리즘 결과 정리

3 효과적인 사육을 위해 사육환경을 분리해보자!(군집 알고리즘)
3-1 군집 알고리즘
3-2 k-평균 군집 알고리즘
[요약]
[연습문제]

Chapter 7 인공 신경망과 딥 러닝

1 성장한 닭의 체중을 예측할 수 있을까?(회귀)
1-1 인공신경망이란?
1-2 데이터 확인 및 분할하기
1-3 상관계수 확인 및 간단한 신경망 구현
1-4 회귀모델의 성능 평가
1-5 딥 러닝이란?
1-6 H2O 활용 딥 러닝 구현(회귀)

2 딥 러닝을 이용해 병아리 품종을 다시 구분해 보자!(분류)
2-1 Keras 활용 딥 러닝 구현(분류)
2-2 과적합을 줄이는 방법(드롭아웃)
[요약]
[연습문제]

Chapter 8 텍스트 마이닝
1 고객 리뷰에서 어떻게 핵심을 파악할 수 있을까?(워드 클라우드)
1-1 워드 클라우드란?
1-2 Rtools 설치하기
1-3 패키지 설치하기
1-4 세종사전 및 데이터 불러오기
1-5 텍스트 데이터 가공하기

2 고객들은 정말로 만족했을까?(감성 분석)
2-1 감성 분석이란?
2-2 감성 사전 준비
2-3 데이터 가공 3
2-4 감성 분석
2-5 결과 시각화
[요약]
[연습문제]

Chapter 9 참고할 만한 내용들
1 데이터베이스 연결 및 SQL 사용법
1-1 데이터베이스 연결 방법
1-2 데이터베이스 테이블의 데이터 조회(Select)
1-3 데이터베이스 테이블의 데이터 입력(Insert)
1-4 데이터베이스 테이블의 데이터 삭제(Delete)

2 비대칭 데이터
2-1 비대칭 데이터란?
2-2 언더 샘플링
2-3 오버 샘플링

3 차원축소와 주성분 분석(PCA)
3-1 차원축소란?
3-2 주성분 분석(PCA)

4 데이터 재구조화(Melt & Cast)
4-1 데이터 재구조화
4-2 열을 행으로 변환(Melt)
4-3 행을 열로 변환(Cast)

5 학습을 위한 대표적인 데이터 셋 소개
5-1 R 내장 데이터 셋
5-2 MNIST
5-3 학습용 데이터 셋 취득

6 데이터 분석 학습 사이트 소개
6-1 생활코딩
6-2 데이터 사이언스 스쿨
6-3 코세라
6-4 캐글
연습문제 정답

  회원리뷰

리뷰쓰기