본문 바로가기
생각기록/도서리뷰

[도서리뷰] AI 엔지니어가 읽은 "직장인의 교양 데이터 과학"

by judy@ 2023. 8. 12.

목차

    도서 정보

    • 제목: 직장인의 교양 데이터 과학
    • 저자: 타카하시 이치로
    • 대상: 전문적인 데이터 과학자..가 아닌 일반적인 비즈니스맨
    • 내용
      1. 왜 지금 시점에 데이터 과학이 필요한지, 데이터 과학이 무엇인지
      2. 데이터 과학의 장단점, 실현 과정
      3. 데이터 과학 사례
      4. 데이터 과학이 만드는 미래

    느낀점

    추천 대상

    그간 나는 "비전공자"의 입장에서 데이터 과학에 가까이 다가가기 위해서, 부족한 기초 이론들과 새롭게 등장하는 기술을 따라가려 부단히 노력하였다. 하지만, 막상 데이터로 어떤 문제를 해결할 수 있을지에 대해서는 많이 생각해보지 못한 것 같다. 나와 비슷한 시각으로 데이터 과학을 접해온 사람이라면, 한 번쯤은 읽어보아도 좋을 것 같다.

     

    걸린 시간

    자기전에 잠깐 짬내 읽었더니 약 4일 정도 걸렸다. 시간을 좀 더 낸다면, 하루만에도 후루룩 읽을 듯!

     

    주요 내용

    처음에는 데이터 과학이 무엇이고, 비즈니스에서 왜 필요한지에 대해 말한다. 이후 데이터 과학의 간단한 방법론과 실제로 적용하여 성공적인 결과를 불러온 사례를 몇 가지 제시한다. 데이터 과학이 향후 가질 의미에 대해 언급하며 책은 마무리된다.

     

    얻은 점

    "데이터 과학자"가 아니라 AI 엔지니어는 일반적으로 비즈니스 문제를 직접 도출하기 보다는 기존에 도출된 문제를 해결하기 위한 모델링을 주로 수행하게 된다. 특히 내가 몸담고 있는 회사는 디지털 치료제를 연구 개발한 뒤, 해당 제품을 납품하여 수익을 내는 구조로, 특정한 비즈니스 문제(플랫폼 내 콘텐츠의 추천)를 해결하기 위한 모델을 연구하여, 지속적으로 개선하는 것을 목표로 하고 있다. 특정 문제를 해결하기 위한 기술적 트렌드를 파악하고 적용하는 데에 시간을 쏟다보니, AI로 해결할 수 있는 또 다른 문제에 대해서는 잘 생각하지 않게 되는 것이 사실이다. 이번 기회를 통해, industry에서 마주할 수 있는 다양한 문제를 해결할 수 있는 데이터 과학의 힘을 상기하게 되었다. 뿐만 아니라, 복잡한 방법론, 많은 리소스를 투자하는 것 이전에, 비즈니스 문제를 해결하기 위해 필요한 것이 무엇인지 제대로 파악하는 것이 중요하며, 그렇게 하면 아주 간단하고 전통적인 방법만으로도 좋은 성과를 낼 수 있다는 것을 깨닫게 되었다.


    살면서 부딪히게 될, 수 많은 현실의 문제들을 "데이터 과학자"스럽게 접근하여 해결해보려고 노력해야지!


    기억하고 싶은 내용

    1장

    비즈니스 관점에서 데이터 과학이란, 데이터를 기반으로 컴퓨터 과학 또는 통계학 등으로 도메인(데이터를 활용하는 영역)에서 활용할 수 있는 유익한 지식을 도출해내고 이를 도메인에 실제로 사용하는 접근 방법.

    2장

    데이터 과학은 기적이 아니라 노력의 성과이다.

     

    데이터가 없으면 아무것도 할 수 없는 것이 데이터 과학이다.

    데이터 과학은 무에서 유(0에서 1)를 창조할 수 없지만, 1에서 10으로 스케일링할 수는 있다.

     

    데이터 과학에서는 목적을 명확히 하는 것이 매우 중요하며, 활용 목적, 스토리, 분석 스토리가 명확하고 성과가 크고 쉬운 테마를 선택하는 것이 좋은 성과를 내는 방법이다.

     

    3장

    작게 시작하는 것이 가장 성과가 좋다.

     

    조하로의 창은 나와 다른 사람이 아는 것과 모르는 것으로 4개의 창으로 나눌 수 있다. 이 때, 나도 알고 다른 사람도 아는 "열린 창"으로 시작하여 신뢰를 얻고 다른 것들을 시도하는 것이 좋다.

     

    3장의 다양한 예제를 통해, 큰 리소스를 들여 데이터 과학을 시작하는 것보다, 현장에서 원하는 것을 조금씩 제공하면서 확장해나가는 것이 거부감을 줄이고 성과를 확장시키는 데에 보다 적합한 방법임을 알 수 있었음.

     

    4장

     

    데이터 포터빌리티(data portability)권: 지금까지 기업이 수집해서 저장하고 있던 개인 데이터를 각각의 개인이 직접 관리하고 제어할 수 있게 하는 권리 ex) Google Takeout 을 이용하면 내 데이터를 내려받을 수 있음

     

    미래에는 특정 기업과 단체가 데이터를 갖고 있는 시대에서 공유하는 시대로 접어들 수 있고, 이렇게 되면 데이터를 수집하는 것보다 데이터와 도메인을 연결해서 가치를 만들어내는 데이터 과학이 지금보다 훨씬 중요하게 될 것.

     

    잘못된 데이터가 혼재되어 있는 상태에서 도메인과 연결할 수밖에 없는 상황이 있는데, 이 때 데이터 과학자의 역할이 중요함. 데이터 문해력이 높은 비즈니스맨과의 협력이 필요함

     

    데이터 문해력이란 데이터를 읽고, 처리하고, 분석하고, 논의하고 활용하는 것과 같은 데이터를 다루는 기술들을 의미


    마무리

    다음 책으로는 데이터 문해력을 읽어야지~~

    반응형

    '생각기록 > 도서리뷰' 카테고리의 다른 글

    [Book review] 원씽 (THE ONE THING)  (0) 2023.02.24
    [book review] 김미경의 마흔 수업  (0) 2023.02.22