본문 바로가기

회고 🤔/네부캠 AI Tech12

[네부캠 AI Tech] 10주차 학습 정리 🤓 학습 정리 & 배운점 # 240108 학습 정리 및 배운점 📚 3강 정리 - 시퀀스 데이터는 집계, FE하여 일반 정형 데이터처럼 또는 트랜젝션 데이터 그대로 사용할 수 있는데, 전자의 경우 정보의 손실이 불가피함 - Tabular Approach/Sequential Approach 를 통해 시퀀스 모델링이 가능함. - Tabular Approach 정형 데이터로 가정하고 접근. - FE - 문제를 푼 시점에서 사용자의 적중률 - 문제 및 시험 별 난이도 (전체 정답수)/(전체 풀이수) - Train/valid data split: leakage 발생 없이 쪼개려면 시퀀스를 쪼갤 때, 유저 별로 묶어야 제대로 된 평가가 된다. train/test 데이터의 ID 공유 여부를 확인하고, 공유하지 않는다면 유.. 2024. 1. 12.
[네부캠 AI Tech] 9주차 학습 정리 🤓 학습 정리 & 배운점 # 240103 학습 정리 및 배운점 📚 1월 일정 파악 및 학습 계획 - 1월, 4주 기간 동안 DKT 태스크 관련 대회 프로젝트를 level2,3 멤버들과 함께 진행할 것. 지난 프로젝트에서 깨달은 것을 바탕으로, 이번 플젝의 관리 방향을 조정해볼 예정 - 지난 프로젝트에서 강의를 모두 수강하지 못한 것이 아쉬워, 차주까지 모든 강의를 수강하는 것을 목표로 둠. 하지만 이는 절대적인 것이 아니며, 나의 판단하에 학습 진행 - 지난 주 수강하지 못한 강의들은 추가 학습을 통해 수강하자 DKT 이해하기 - 교육과 관련한 추천 활용 분야. 학생의 지식 상태를 시간에 따라 예측하는 작업 - DKT: Deep Knowledge Tracing의 약자로 지식 상태를 추적하는 딥러닝 방법론. .. 2024. 1. 5.
[네부캠 AI Tech] 8주차 학습 정리 🤓 학습 정리 & 배운점 # 231226 학습 정리 및 배운점 📚 # 231227 학습 정리 및 배운점 📚 # 231228 학습 정리 및 배운점 📚 # 231229 학습 정리 및 배운점 📚 2023. 12. 29.
[네부캠 AI Tech] 7주차 학습 정리 🤓 학습 정리 & 배운점 # 231218 학습 정리 및 배운점 📚 - stratified k-fold cross validation 기능을 구현하였는데, 코드가 매우 지저분해지고 개별적으로 개발하는 게 어려워서 Pull Request를 포기하였는데, 좀 더 보완해서 그냥 적용할 걸 그랬다. 실무에서는 잘 안써도 생각보다 대회에서는 이 방법을 매우 많이 사용한다고 함. - 랩업 리포트 작성 시작; 기능 개발, 실험 관리는 모두 함께 진행하였지만, 그 결과를 공유 페이지에서 기록하지는 않아서 취합을 시작함. 적으면서, 아 어떤 부분은 꼼꼼하게 했고 어떤 부분은 꼼꼼하게 안했구나를 깨달음 - FM, FFM은 성능이 안나오는데 WDN, NCF는 성능이 잘 나오는 것을 보고 DeepFM을 구현해봐야겠다는 생각을 하게.. 2023. 12. 22.
[네부캠 AI Tech] 6주차 학습 정리 🤓 목차 학습 정리 & 배운점 # 231211 이날 하루는 포스팅을 했다. # 231212 학습 정리 및 배운점 📚 - 3강 듣기 - latent factor model: 유저나 아이템을 축약된 벡터 공간에 표현할 수 있다는 아이디어. - SVD는 수학적으로 분해, MF는 SVD의 일반화된 버전으로 유저와 아이템 행렬의 선형적인 관계를 SGD로 캡처하여 학습하는 방법. MF를 ALS로 학습하면, loss가 parameter에 대해 convex 형태가 되어 학습이 더 쉬워지며, 병렬 처리가 가능해져 더 효율적인 학습 가능함 - hybrid 접근법: weighted, switching, mixed 까지는 이해가 가는데, Feature combination, augmentation 등은 이해가 잘 안됨 - GBT.. 2023. 12. 15.
[네부캠 AI Tech] 6주차 첫째 날 학습 정리 + 일기 목차 그냥 일기 + 배우면서 생각한 것들 기록 오늘 한 일 - Book Rating EDA 따라가기 - 도메인 기초 대회 계획하기 - 1,2강 강의 수강 - 최종 프로젝트 팀업 관해 생각하기 Book Rating EDA 따라가기 - 추천 트랙의 데이터는 오픈소스 데이터라 코드만 조금 조심하면 되어 다행..(인가?)이다! - kaggle에서의 누구보다 빠른 EDA 파일 올리기! 를 시도하고 싶었는데, 이 플랫폼에는 노트북 업데이트 기능이 따로 없고, 이미 well-established EDA 파일이 있어서 머쓱하게 따라가보는 중이다. 나는 데이터를 유랑하며 발굴하는 것을 매우매우 즐기는 사람인데, 남이 EDA 해놓은 것을 보니, 새로운 메서드와 인사이트가 보여 개척하는 맛과는 다르게 배울 수 있어서 좋았다.. 2023. 12. 12.