책소개
우리 모두를 위한 데이터 과학을 꿈꾸며
이 책은 ‘우리 모두를 위한 데이터 과학’을 이야기한다. 필자가 전달하고자 하는 주된 메시지는 우리 주변에 이미 데이터를 수집하고 분석할 수 있는 다양한 수단이 존재하며, 데이터를 활용하여 삶과 업무를 개선하는 일은 결코 복잡하지 않다는 것이다. 이 책은 초보적인 수준의 통계와 컴퓨터 지식을 갖춘 보통 사람이 데이터 과학을 시작할 수 있는 방법을 제시하고, 이런 방법을 개인의 삶과 업무에 활용하는 다양한 사례를 소개한다. 비전문가도 책을 읽고 나서 활용할 수 있도록 엑셀을 사용한다. 따라서 이 책을 읽고 나면 개인 데이터, 생활 데이터 같은 스몰 데이터에 데이터 과학을 접목하여 분명 여러분도 자신의 문제를 해결할 수 있을 것이다.
목차
1장 데이터 과학 입문
삶과 비즈니스를 바꾸는 데이터의 가능성
__의학을 보완하는 개인 데이터의 힘 : 마크 드랭숄트
__스타트업의 성장 신화를 뒷받침하는 데이터의 힘 : 에어비앤비
__이들은 데이터를 어떻게 활용했나
데이터 과학과 테이블
__데이터는 테이블이다
__데이터 과학은 테이블 놀이다
데이터 과학에 대한 오해와 진실
__스몰데이터로 시작하라
__단순한 도구와 기술로 시작하라
데이터 과학을 시작하는 방법
__데이터 마인드를 가져라
__데이터 습관을 길러라
__관련 지식과 기술을 익혀라
맺음말
2장 데이터 과학에 유용한 도구
데이터 과학을 위한 도구 선택하기
__처리 용량 및 속도
__지원 데이터형 및 프로그래밍 환경
__데이터 분석 및 시각화 기능
__문제 특성에 맞는 도구의 선택
__문제 해결 단계에 맞는 도구 선택
엑셀로 시작하는 데이터 과학
__코드가 아닌 데이터가 중심이다
__올인원 솔루션이다
__결과물을 쉽게 공유할 수 있다
언제부터 엑셀 대신 R을 사용해야 할까
__워크시트에서 변수로
__메뉴에서 함수로
__분석에서 예측으로
〈실습〉 엑셀의 기초
__데이터 불러오기
__데이터 준비하기
__데이터 분석 및 시각화하기
__데이터 집계하기
〈실습〉 R 맛보기
__R 작업을 위한 환경 구축
__R의 기본 기능
__데이터 준비하기
__데이터 분석하기
맺음말
3장 문제 정의와 데이터 수집 및 준비
데이터 문제 정의하기
__데이터 문제 해결 단계
__데이터 분석 단계
〈사례〉 직원 만족도 개선을 위한 데이터 분석
__데이터 문제 정의하기
〈사례〉 넷플릭스 프라이즈 문제 정의
__유의사항
데이터 수집하기
__데이터 수집의 기본
__수집 방법 결정하기
〈심화학습〉 측정 기술
__어떤 대상도 측정할 수 있는가
__어떤 대상도 측정할 수 있는 방법
__수집 환경 결정하기
〈심화학습〉 실험 디자인
__무작위 디자인
__블록 디자인
__수집할 데이터양 결정하기
__데이터 품질 점검하기
__유의사항
__데이터 준비하기
__데이터 선택, 추가, 집계하기
〈실습〉 엑셀을 이용한 데이터 준비
맺음말
4장 데이터 분석과 스토리텔링
현상 이해하기 : 탐색적 데이터 분석
__탐색적 분석 단계
〈사례〉 엑셀로 해보는 탐색적 데이터 분석
__개별 속성 분석하기
__속성 간의 관계 분석하기
__유의사항 : 관점은 갖되 편견은 금물이다
현상 일반화하기 : 통계적 추론
__통계적 추론의 원리
__통계적 추론의 유형
〈실습〉 엑셀로 해보는 통계적 추론
__탐색적 데이터 분석
__데이터 가공하기
__통계적 추론
__유의사항 : 데이터에서 도출하는 결론의 가치와 한계
현상 예측하기 : 기계학습
__기계학습 유형
__기계학습 개념
__기계학습 절차
〈사례〉 스몰데이터로 해보는 기계학습
데이터 스토리텔링
__데이터 스토리텔링 방법
__효과적인 데이터 스토리텔링 원칙
〈사례〉 FiveThirtyEight
__서론
__본론
__결론
맺음말
5장 개인 데이터로 공부하는 데이터 과학
개인 데이터 활용으로 삶을 바꾸는 사람들
__개인 데이터 활용의 유형과 목표
__개인 데이터 활용 방법
〈사례〉 건강 및 식생활 지표화
__문제 정의하기
__건강 데이터화 및 개선하기
__식사 및 운동량 측정하기
__마치며
〈사례〉 정성적인 현상(행복) 지표화
__행복 측정 프로젝트
__행복을 측정하는 방법
__행복 측정의 결과
__마치며
개인 데이터 수집 및 분석 시작하기
__문제 탐색하기
__데이터 수집하기
__분석 및 결과 실천하기
__자신의 경험 공유하기
__마치며
맺음말
6장 공개 데이터로 공부하는 데이터 과학
공공 데이터를 통한 탐색적 분석
__문제 정의하기
__데이터 수집하기
__탐색적 데이터 분석
__유의사항 : 데이터를 검정하고 목표에 집중하라
경연 데이터를 통한 실전 예측 모델링
__경연 준비하기 : 나도 할 수 있을까
__캐글 참가자들의 성공 비결
__캐글 참여하기 : 타이타닉호 생존자 예측
비즈니스 성장을 위한 데이터 과학
〈가상 사례〉 식당 운영을 위한 데이터 과학
__식당 창업에 도전한 김 사장의 고민
__데이터 과학자인 조카의 조언
__메뉴의 변화가 매출에 미치는 영향
__고객의 만족도를 알아내는 방법은 무엇인가
__고객의 만족도를 알아내기 : 고객 행동 분석
__실험을 통한 신 메뉴 개발
__데이터 활용의 숨은 장벽들
__고객 유입의 단계별 데이터 활용
야구 통계를 통해 지표 개발 배우기
__야구 통계의 흐름
__야구 통계의 기초와 전통적인 지표들
__현대적인 야구 통계가 가져온 혁신
__마치며
맺음말 328
7장 입문을 넘어서 : 데이터 과학자의 길
데이터 과학자로 살아가기
__검색엔진 분야에서의 데이터 과학
__데이터 과학 프로젝트의 시작과 끝
__데이터 과학자의 일상
데이터 과학자가 되는 길
__나에게 어울리는 길인가
__무엇을 목표로 해야 하나
__어떻게 공부해야 하나
__어떻게 취업을 준비할 것인가
데이터 과학의 미래
__데이터 관련 기술적인 진보의 가속화
__데이터 과학의 더욱 폭넓은 활용
__데이터 과학자 수요 증가
맺음말