본문 바로가기
Book

책리뷰: 헬로 데이터 과학(★★☆☆☆)

by 곰돌이풉 2018. 5. 30.

기상과 관련된 업무를 하면서 RAW DATA 활용에 대해 궁금할 때가 있었는데, 그때 읽은 책이었다. 처음 도입부에는 재미있었다가 실무쪽으로 심화되면서 재미없어진 책. 아직은 본인 뇌구조가 인문학도인가보다. 문송합니다... 그런 의미에서, 책 별점은 2개.

 아래는 괜찮았던 책 문구를 적어보았다.

p.32

 "데이터가 새로운 과학이다. 빅데이터는 모든 해답을 담고 있다." _팻 잴싱어

 "정량적 데이터만으로 위대한 마케팅 의사결정이 내려진 경우는 한번도 없었다."_존 스컬리, 펩시& 애플 CEO.

 대부분의 사람이 인터넷 기능을 갖춘 모바일 기기를 사용하고, 하루가 멀다하고 데이터 관련 기사가 언론에 등장하는 오늘날, 데이터의 중요성을 부인하는 사람은 거의 없을 것이다. 하지만 위의 두 인용구처럼 데이터에 대한 다양한 시각이 존재한다. 한 쪽에서는 데이터가 모든 문제를 해결해줄 것처럼 이야기하고, 다른 쪽에서는 아직도 인간의 판단력과 직관력을 신봉하고 있다. 

p.39

 데이터는 이렇게 사용한다.
 -자신에게 절실한 문제에서 출발한다.
 -데이터를 의사결정과 실천으로 직결시킨다.
 -데이터 수집 및 활용을 일상화한다.

p.51

 플로렌스 나이팅게일은 19세기 말 크림전쟁 당시 전선보다 후방 병원에서 훨씬 많은 환자가 죽어간다는 사실을 발견했다. 그녀는 자신의 발견을 다른 사람에게 알리기 위해 오늘날의 파이 차트와 유사한 데이터 시각화 기법 등을 고안했고, 이런 그녀의 노력으로 후방 의료시설의 위생 상태가 개선되면서 후방에서의 사망률을 1/10으로 낮출 수 있었다.


▲ 나이팅게일이 제작한 시각화. 1855년에 이런 그래프가 여성의 손에서 탄생했다.

p.276

 "공개 데이터는 과학 및 사회 전체를 발전시키는데 매우 중요하다. 연구 데이터는 다른 용도로 사용되면 그 가치가 늘어난다. 연구의 투명성은 결과에 대한 대중의 신뢰를 위해서도 중요하다. 연구 데이터 관리는 연구자, 발주자, 연구 기관, 도서관, 그리고 공공의 책임이다." _공개 데이터 선언 중에서.

 ...예전에는 관계자 이외에는 볼 수 없었던 다양한 공공 데이터가 일반에 공개되고 있으며, 일부 기업들도 비즈니스 프로세스의 일부로, 수집한 데이터를 개인정보 암호화 등의 일정한 절차를 거쳐 공개하고 있다....넷플릭스 사용자들의 영화 선호도 데이터의 공개로 추천 및 기계학습 알고리즘의 발전을 가져왔던 일이나 메이저리그 사무국에서 경기 데이터를 공개한 결과로 빌 제임스를 비롯한 현대 야구통계학자들의 혁신적인 연구가 가능했던 것이 대표적인 사례다.


by 곰돌이풉

댓글