[BOOK] 헬로 데이터 과학

[BOOK] 헬로 데이터 과학 – 김진영 지음

[BOOK] 헬로 데이터 과학

[BOOK] 헬로 데이터 과학

빅데이터, 머신러닝, 딥러닝… 요즘 IT관련 기사에 빠지지 않는 내용들이다. 이 것들의 공통점이 있다면 데이터를 기반으로 한다는 것! 데이터가 주목받다 보니 따라서 주목 받고 있는 직업이 데이터 과학자이다. MS에서 데이터 과학자로 일하고 있는 저자가 데이터에 대해서 이야기를 풀었다.

일반적으로 개인이 쌓을 수 있는 작은 데이터를 분석하여 활용하는 방법을 설명한다. 분석에 사용하는 툴도 파이썬, R과 같은 거창한 툴이 아니다. 엑셀로 데이터를 정리해서 분석하는 방법을 친절하게 설명한다. 4장을 읽다보면 통계와 관련된 내용이 쏟아지며 조금 어려울 수 있으나 4장을 빼면 정말 쉬운 책이다. (Head First Statistics, Head First Data Analysis보다 쉬운 책이다!!) 쉽게 쌓을 수 있는 데이터와 쉬운 툴을 이용해서 누구나 데이터를 활용할 수 있도록 방법을 알려준다.

학교에서 실험을 해도 데이터가 나오고, 다이어트를 위해서 칼로리와 운동량을 기록해도 데이터가 나온다. 어떻게 활용하면 좋을지 데이터를 다뤄야 하는 사람이라면 일단 읽자.


  1. 데이터 과학은 테이블 놀이라고 할 수 있다. (p. 43)
  2. 데이터라는 렌즈를 통해 복잡다단한 현상에 대한 바르고 정확한 지식을 얻고, 이를 지렛대 삼아 주어진 문제를 해결하려는 사고방식이다. (p. 51)
  3. 데이터 문제는 문제 해결의 단계에 따라 적절한 도구를 조합해서 사용하는 능력을 요구한다. (p.69)
  4. 데이터에 기반한 문제 해결의 일반적인 단계. (p. 111)
  5. 데이터를 다양한 각도에서 관찰하고 이해하는 과정을 탐색적 데이터 분석이라고 부른다. (p.158)
  6. 표본을 바탕으로 모집단의 특성에 대한 결론을 유도하는 것을 통계적 추론이라고 부른다. (p.183)
  7. 기계 학습은 실제로 주어진 현상의 단편을 예측할 수 있는 통계적인 모델을 만드는 과정에 지나지 않는다. (p. 211)
  8. 위대한 업적을 남긴 이들은 자신의 역량에 대한 철저한 측정과 관리를 실천해왔다. (p.233)
  9. 공공 데이터의 특성상 사회 문제를 다루기에 적합하다. (p. 277)
  10. 데이터 과학자의 업무에서 세 가지 도전을 뽑는다면 모호함, 변화, 협업일 것이다. (p. 340)

Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out / Change )

Twitter picture

You are commenting using your Twitter account. Log Out / Change )

Facebook photo

You are commenting using your Facebook account. Log Out / Change )

Google+ photo

You are commenting using your Google+ account. Log Out / Change )

Connecting to %s