본문 바로가기

book

파이썬 라이브러리를 활용한 머신러닝(번역개정2판)

 

이 책의 내용을 리뷰하기 전에, 2가지 keyword가 생각이 났습니다.
1. 원서를 넘는 번역서의 좋은 사례,노력이 결실
원서 vs 번역초판 → 번역개정 → 번역개정2판
2. 박해선님 (저자 및 역자)의 네임밸류

 

 

 

 

 책의 두께 : p.503로 구성되어 있으며, All-Color책입니다.

 

 책의 연혁 

2017년 07월 : 번역서 최초 출간 (현재 절판)

2019년 03월 : 번역개정판 (현재 절판)

2022년 02월 : 번역개정2판

번역개정2판까지 나오는 경우가 흔치 않은데, 이책은 같은 원서로 3개의 책이 출간되었습니다. 보통 오픈소스의 버전이 출간시점에는 최신버전이지만, 시간이 지나면서, Version-Up되고, 책에 있는 내용과 Version차이가 많이 발생하여서 실습 및 테스트에 어려움을 겪게 되는데, 이런 문제가 자연스럽게 해결되어서 너무 좋은 책이 출간된 것 같습니다.

 

저자

  → 안드레아스 뮐러 : (scikit-learn)핵심기여자, 관리자

  → 세라 가이도

  

 

 

■ 혹시 저처럼 책의 제목만 보시고 혼돈되시는 분들이 있으실까요?

책의 제목에 상당히 비슷합니다. 
빨강색) 파이썬 라이브러리를 활용한 데이터 분석
자주색) 파이썬 라이브러리를 활용한 머신러닝

책의 제목만 보고서는 어떠한 기술이 책에서 설명되어지는지 조금은 혼돈이 되실것 같아서 정리해보려고 합니다.

 

 

책 제목 내용 저자
파이썬 라이브러리를 활용한 데이터 분석 numpy, pandas이 주요내용 웨스 맥키니 : (pandas 프로젝트 창시자)
파이썬 라이브러리를 활용한 머신러닝 Scikit-Learn이 주요내용 안드레아스 뮐러 : (scikit-learn 핵심기여자)

두책 모두, 머신러닝에서 가장 많이 사용하는 기술인 pandas, Scikit-Learn에 기여한 분들이 저자여서 책을 통해서 얻을수 있은 것들이 많이 있습니다.

저자직강이라는 말이 있습니다. 이것은 해당 기술/오픈소스에 기능을 설명을 제일 명확하기 잘하는것은 기본이고

만든 의도 및 해당 오픈소스를 통해서 기존에 없었던 무언가를 개선하기 위한 목적,의도를 가장 명확히 설명해줄수 있는 장점이 있습니다.

 

두책 모두 다 저자직강입니다.!!

개인적으로 pandas에 대해서 좀더 학습을 하고 싶은경우에도 "파이썬 라이브러리를 활용한 데이터 분석" 해당 책이 많은 도움이 되었습니다.

 

책 둘러보기, 역자님 의견 둘러보기

  • 목차를 보면, (한국어판 부록)부분이 있어서 원서에는 없는 부분도 추가되어서 추가 설명이 보강되어 있습니다.

  • 박해선 역자님의 페이스북의 내용을 참고하시면, 조금 더 개정2판에 대해서 의미가 전달될 것 같아서 옮겨왔습니다.

 내용 살펴보기

  머신러닝 분야에 대표적인 라이브러리인 "사이킷런"은 기본적으로 알고 있어야 하는 라이브러리라고 생각이 됩니다.

  사이런을 학습하면서, 자연스럽게 머신러닝을 자연스럽게 익히게 될 것이라고 생각이 됩니다.

 

  책의 Chapter는 아래와 같습니다.

  CHAPTER 1 소개

  CHAPTER 2 지도 학습

  CHAPTER 3 비지도 학습과 데이터 전처리

  CHAPTER 4 데이터 표현과 특성 공학

  CHAPTER 5 모델 평가와 성능 향상

  CHAPTER 6 알고리즘 체인과 파이프라인

  CHAPTER 7 텍스트 데이터 다루기

  CHAPTER 8 마무리

  

  머신러닝에서 지도,비지도 학습에 대해서 설명을 하고 자연스럽게 데이터를 다루는 원핫인코딩 및 데이터를 가공하고, 학습한 모델을 평가    하는 내용을 다루는 책은 어느정도 있는데, 조금 부족한 생각이 들 수도 있습니다.

  그러한 부족한 부분에 내용이 이 책에서는 예제코드 별로 좀더 상세하게 설명이 잘 되어 있습니다.

다른곳에서 잘 다루지 않는 6,7,8장에 내용은 사이킷런 사용시, 경험할 수 있는 경우가 많이 제공되어서 서비스 적용시

도움이 많이 될 것 같습니다.

 

 

 

 책 실습환경 / 대상독자

  • 실습환경은 이번에 코랩으로 구성되어서 제공됩니다. (환경구성에 일관성이 제공되어서 실습에 편리함을 제공합니다.)
    지금 시점의 코랩에서는 최신 Stable 사이킷런이 설치되어 있습니다.

  • 소스 코드도 별도로 github에서 제공되고, 변경사항은 지속적으로 관리됩니다. (박해선님의 github에서 관리)
  • 대상독자
    • 머신러닝, 딥러닝을 시작하시는 분들
    • 다른책에서 사이킷런을 조금 경험해보셨는데, 좀 더 구체적으로 학습하시려고 하는 분들
    • 사이킷런 1.0 정식버전의 코드를 경험해보고 싶으신 분들
    • 머신러닝을 좀 더 깊게 학습을 하고 싶으신 분들
    • 박해선 저자/역자님을 좋아하시는 분들

 책에 대한 소감

  • 대부분의 머신러닝,딥러닝 책에서 기본적으로 사이킷런이 소개되어지고 설명되어집니다.
    ex) 최소한 지도/비지도학습에 대해서  분류(classification - KNeighborsClassifier),회귀 (regression-KNeighborsRegressor)등을 사용해서 언급 되어집니다.
    이 책을 통해서 본격적으로 사이킷런을 학습할 수 있고, 최신버전으로 제공되는 예제는 실습 및 학습에 많은 도움이 됩니다.
  • 현업에서 머신러닝으로 해결가능하고, 조금 더 의미있는 결과를 낼 수 있는 다양한 경우가 많습니다. 
    머신러닝에서 사이킷런은 매우 중요한 위치에서 많은 편리한 기능을 제공합니다.
    사이킷런의 핵심개발자가 출간한 책을 믿고 많은 부분을 학습할 수 있습니다.
  • 1.0으로 릴리즈된 버전을 실습해보고, 코드를 경험할 수 있습니다.

  • 조금 더 구체적으로 머신러닝을 다루고 싶고, 사이킷런을 좀더 학습을 하고 싶은 경우에 많은 도움이 될 것 같습니다.
    이 책은 사이킷런을 이용해서 머신러닝에 대한 내용을 다루어 지고 있기 때문입니다.
"한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다."