새로운 회사에서의 내 주요 무대는 강화학습! 사실 상 알고리즘의 업데이트보다는 클라이언트의 요구에 맞게 데이터를 가공하는 것에 가깝겠지만, 알고리즘 및 제품 업데이트에 기여하면 그것만큼 큰 성과가 없을 거다. 나아가, 원래 관심있던 도메인인 추천에 강화학습을 어떻게 적용할 수 있는지 생각해보고 직접 구현해보는 게 이번 년도 목표 중 하나이니, 천천히 공부한다는 마음으로 한 걸음씩 다가가보자.
어떻게 공부할지 모르겠어서 냅다 구글에 "강화학습 튜토리얼"을 검색했고, RL Korea라는 페이스북 커뮤니티에서 유용한 Git Repo를 운영하고 있는 걸 알게 됐다. 공통적으로 김성훈 교수님의 모두를 위한 RL 강좌로 입문했으므로, 나 또한 지금으로부터 한 달 동안 이 강의를 들으면서 기본적인 개념을 익히면 될 것 같다!
그래서 세우는 매우 대략적인 강화학습 학습 목표
1-2월: 모두를 위한 RL 강좌
3-6월: David Silver 강의
회사에서 제공할? 제공하지 않아도 공부해야 할 것이 분명이 따로 있을테니, 우선 이 정도만 정해두고 하나씩 해나가자!
반응형