본문 바로가기

book

머신러닝 실무 프로젝트(2판)

요즘은 프로그램 언어 개발서적보다 머신러닝/딥러닝 관련책들이 더 많이 출간되고 있는것 같습니다.

 

현 시점에 많은 관심이 있고, 기존에 없던 영역이라 더욱 그런 것 같습니다.

 

예전에 수집된 Database에서 데이터를 분류하고 하우징하고, 클러스터링 하는 것은 대부분 사람이 큰 그림을 바탕으로 

진행을 하였습니다.

 

요즘 머신러닝을 통해서, 예전보다 조금 더 새로운 데이터의 접근법을 시도해볼수 있는 시대인거 같습니다.

해당 기술을 학습하고, 공부하는 이유는 실제 업무에 적용하기 위해서 입니다.

 

실무에 적용하기 위한 방법이 궁극적이 목적입니다.

회사에 이미 조직이 구성되어 있거나, 도움을 받을수 있는 팀원이 있으면 더욱 좋겠지만

그렇지 않은 환경이나 관련 조직이 있어도 실제 서비스에 적용하기에는 미리 누군가 경험해본 Reference가 있으면

많은 시행착오를 줄이게 되고, 더욱 효율적으로 접근할 수 있습니다.

 

◎ 책의 제목에도 "머신러닝 실무" 라는 단어가 들어가 있습니다.

이론적인 부분보다, 실제 업무에 참조가 되는 부분이 어느내용이 있고,

     무슨 내용으로 구성되어 있는지 살펴보려고 합니다.

◎ 책의 내역

    일본에서 출간된 책입니다.

    저자분이 3분으로 공동저자로 구성되어 있습니다.

    2018년에 초판이 출간되고, 2022년 4년이 지난 시점에 

    최신 트랜트가 반영되어서 2판이 출간되었습니다.

◎ 책 두께

    317페이지인데, 그렇게 두꺼운 책은 아닙니다.

 

 

 

저자분 서문 내용

서문에 내용에 책의 방향성에 대해서 좋은 내용이 있습니다.
저의 생각에
"저자분이 머신러닝 전문가 이시지만 , 관련된 분야는 하나의 분야일 확률이 높습니다
  실무의 범위는 넓어서 다양한 분야가 책에 설명되는 것이 어려울 수도 있을거 같다는 생각이 들었습니다."

내용을 보면 저자분 말고 다양한 전문가의 도움을 받았다고 적혀있다.
우선 공동저자 3분의 경험이 기본적으로 책을 구성하고 
 + 인터넷 광고 실무 경험 전문가 (A/B 테스트의 효과검증)
 + MLOps전문가 (6장 검토)
 + 슬롯알고리즘 전문가 (11장 검토)
 + 그밖에 다양한 커뮤니티 및 개발자 분들

실무 경험이라는 것이 다양한 분야의 다양한 소리가 책에 잘 포함되어 있을것 같다는 생각을 하게 됩니다.

 

▩ 책의 구성

크게 2개로 구성되어 있습니다. 

책에서는 파이선 머신러닝 라이브러리인 사이킷런을 사용합니다.

목차보다 해당 내용이 조금 더 요약이 잘 되어 있어서 첨부합니다.

 

 

▩ 책의 내용

PMP자격증 관련 책을 보면 프로젝트 관리에 대해서 상세히 정의합니다.

이 책을 읽어보면, 프로젝트의 생명주기와 구성요소를 파악하듯이 머신러닝의 생명주기를 PMP 처럼 정리해놓았다는 생각이 들었습니다.

 

 

 

 

사진으로 첨부한 화면은 1장의 내용입니다. 1부에서는 이러한 머신러닝 Proj진행시 필요한 다양한 관점들이 소개되어 집니다.

소스 코드에 대한 부분은 많이 있지 않습니다.

어느정도 머신러닝의 기술에 대한 경험이 있는 독자를 대상으로, 실제 업무에서 필요한 사항을 

다시한반 Reminder하고, 중요한 포인트를 집어준다는 느낌이 들었습니다.

 

1장에서 처음시작할때, 순서 및 Process / 시스템 구성을 어떻게 하는지 가이드 합니다.

1부의 2장부터 8장까지 전체적인 실무에서 머신러닝을 도입하기 위한 큰 Process 및 구성요소에 대해서 설명되어 집니다.

  → 4장에서 기존서비스 환경에서 통합하는 과정은 누구나 고민하는 부분이라고 생각이 되어집니다.

  → 7장의 A/B테스트 모델을 머신러닝에 적용한 내용도 도움이 많이 될 것 같습니다.

 

 

▩ 2부에서는 조금 더 실제 사례를 바탕으로 내용이 기술됩니다.
    코드가 있기는 하지만, 코드 관점보다는 고려해야 하는 방향등에 대한 관점의 설명입니다.

  • 오픈 API를 통해 수집한 테이트를 기반으로 엑셀를 통한 데이터 분석 및 보고서 작성
    • json데이터 csv로 변환 / 피벗테이블 활용
  • 업리프트 모델링을 통한 무작위 비교 시험 데이터 분석 사례
  • 슬롯머신 알고리즘을 활용한 강화학습 입문
  • 온라인 광고에서의 머신러닝
    • 광고영역을 얼마에 판매하고, 어떤 광고를 표시해야 할지 결정
    • 광고 가격과 예측

이 책은 자신이 경험한 만큼 더 많이 보이고, 많은 것을 얻어갈수 있는 책이라는 생각이 듭니다.

자신이 업무에서  동일한 고민을 해본 독자분이라면, 조금더 현실적인 답을 얻을 수 있는 책이라고 생각합니다.

 

"한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다."