ํ๊ณ ๐ค/๋ค๋ถ์บ AI Tech12 [๋ค๋ถ์บ AI Tech] 10์ฃผ์ฐจ ํ์ต ์ ๋ฆฌ ๐ค ํ์ต ์ ๋ฆฌ & ๋ฐฐ์ด์ # 240108 ํ์ต ์ ๋ฆฌ ๋ฐ ๋ฐฐ์ด์ ๐ 3๊ฐ ์ ๋ฆฌ - ์ํ์ค ๋ฐ์ดํฐ๋ ์ง๊ณ, FEํ์ฌ ์ผ๋ฐ ์ ํ ๋ฐ์ดํฐ์ฒ๋ผ ๋๋ ํธ๋์ ์ ๋ฐ์ดํฐ ๊ทธ๋๋ก ์ฌ์ฉํ ์ ์๋๋ฐ, ์ ์์ ๊ฒฝ์ฐ ์ ๋ณด์ ์์ค์ด ๋ถ๊ฐํผํจ - Tabular Approach/Sequential Approach ๋ฅผ ํตํด ์ํ์ค ๋ชจ๋ธ๋ง์ด ๊ฐ๋ฅํจ. - Tabular Approach ์ ํ ๋ฐ์ดํฐ๋ก ๊ฐ์ ํ๊ณ ์ ๊ทผ. - FE - ๋ฌธ์ ๋ฅผ ํผ ์์ ์์ ์ฌ์ฉ์์ ์ ์ค๋ฅ - ๋ฌธ์ ๋ฐ ์ํ ๋ณ ๋์ด๋ (์ ์ฒด ์ ๋ต์)/(์ ์ฒด ํ์ด์) - Train/valid data split: leakage ๋ฐ์ ์์ด ์ชผ๊ฐ๋ ค๋ฉด ์ํ์ค๋ฅผ ์ชผ๊ฐค ๋, ์ ์ ๋ณ๋ก ๋ฌถ์ด์ผ ์ ๋๋ก ๋ ํ๊ฐ๊ฐ ๋๋ค. train/test ๋ฐ์ดํฐ์ ID ๊ณต์ ์ฌ๋ถ๋ฅผ ํ์ธํ๊ณ , ๊ณต์ ํ์ง ์๋๋ค๋ฉด ์ .. 2024. 1. 12. [๋ค๋ถ์บ AI Tech] 9์ฃผ์ฐจ ํ์ต ์ ๋ฆฌ ๐ค ํ์ต ์ ๋ฆฌ & ๋ฐฐ์ด์ # 240103 ํ์ต ์ ๋ฆฌ ๋ฐ ๋ฐฐ์ด์ ๐ 1์ ์ผ์ ํ์ ๋ฐ ํ์ต ๊ณํ - 1์, 4์ฃผ ๊ธฐ๊ฐ ๋์ DKT ํ์คํฌ ๊ด๋ จ ๋ํ ํ๋ก์ ํธ๋ฅผ level2,3 ๋ฉค๋ฒ๋ค๊ณผ ํจ๊ป ์งํํ ๊ฒ. ์ง๋ ํ๋ก์ ํธ์์ ๊นจ๋ฌ์ ๊ฒ์ ๋ฐํ์ผ๋ก, ์ด๋ฒ ํ์ ์ ๊ด๋ฆฌ ๋ฐฉํฅ์ ์กฐ์ ํด๋ณผ ์์ - ์ง๋ ํ๋ก์ ํธ์์ ๊ฐ์๋ฅผ ๋ชจ๋ ์๊ฐํ์ง ๋ชปํ ๊ฒ์ด ์์ฌ์, ์ฐจ์ฃผ๊น์ง ๋ชจ๋ ๊ฐ์๋ฅผ ์๊ฐํ๋ ๊ฒ์ ๋ชฉํ๋ก ๋ . ํ์ง๋ง ์ด๋ ์ ๋์ ์ธ ๊ฒ์ด ์๋๋ฉฐ, ๋์ ํ๋จํ์ ํ์ต ์งํ - ์ง๋ ์ฃผ ์๊ฐํ์ง ๋ชปํ ๊ฐ์๋ค์ ์ถ๊ฐ ํ์ต์ ํตํด ์๊ฐํ์ DKT ์ดํดํ๊ธฐ - ๊ต์ก๊ณผ ๊ด๋ จํ ์ถ์ฒ ํ์ฉ ๋ถ์ผ. ํ์์ ์ง์ ์ํ๋ฅผ ์๊ฐ์ ๋ฐ๋ผ ์์ธกํ๋ ์์ - DKT: Deep Knowledge Tracing์ ์ฝ์๋ก ์ง์ ์ํ๋ฅผ ์ถ์ ํ๋ ๋ฅ๋ฌ๋ ๋ฐฉ๋ฒ๋ก . .. 2024. 1. 5. [๋ค๋ถ์บ AI Tech] 8์ฃผ์ฐจ ํ์ต ์ ๋ฆฌ ๐ค ํ์ต ์ ๋ฆฌ & ๋ฐฐ์ด์ # 231226 ํ์ต ์ ๋ฆฌ ๋ฐ ๋ฐฐ์ด์ ๐ # 231227 ํ์ต ์ ๋ฆฌ ๋ฐ ๋ฐฐ์ด์ ๐ # 231228 ํ์ต ์ ๋ฆฌ ๋ฐ ๋ฐฐ์ด์ ๐ # 231229 ํ์ต ์ ๋ฆฌ ๋ฐ ๋ฐฐ์ด์ ๐ 2023. 12. 29. [๋ค๋ถ์บ AI Tech] 7์ฃผ์ฐจ ํ์ต ์ ๋ฆฌ ๐ค ํ์ต ์ ๋ฆฌ & ๋ฐฐ์ด์ # 231218 ํ์ต ์ ๋ฆฌ ๋ฐ ๋ฐฐ์ด์ ๐ - stratified k-fold cross validation ๊ธฐ๋ฅ์ ๊ตฌํํ์๋๋ฐ, ์ฝ๋๊ฐ ๋งค์ฐ ์ง์ ๋ถํด์ง๊ณ ๊ฐ๋ณ์ ์ผ๋ก ๊ฐ๋ฐํ๋ ๊ฒ ์ด๋ ค์์ Pull Request๋ฅผ ํฌ๊ธฐํ์๋๋ฐ, ์ข ๋ ๋ณด์ํด์ ๊ทธ๋ฅ ์ ์ฉํ ๊ฑธ ๊ทธ๋ฌ๋ค. ์ค๋ฌด์์๋ ์ ์์จ๋ ์๊ฐ๋ณด๋ค ๋ํ์์๋ ์ด ๋ฐฉ๋ฒ์ ๋งค์ฐ ๋ง์ด ์ฌ์ฉํ๋ค๊ณ ํจ. - ๋ฉ์ ๋ฆฌํฌํธ ์์ฑ ์์; ๊ธฐ๋ฅ ๊ฐ๋ฐ, ์คํ ๊ด๋ฆฌ๋ ๋ชจ๋ ํจ๊ป ์งํํ์์ง๋ง, ๊ทธ ๊ฒฐ๊ณผ๋ฅผ ๊ณต์ ํ์ด์ง์์ ๊ธฐ๋กํ์ง๋ ์์์ ์ทจํฉ์ ์์ํจ. ์ ์ผ๋ฉด์, ์ ์ด๋ค ๋ถ๋ถ์ ๊ผผ๊ผผํ๊ฒ ํ๊ณ ์ด๋ค ๋ถ๋ถ์ ๊ผผ๊ผผํ๊ฒ ์ํ๊ตฌ๋๋ฅผ ๊นจ๋ฌ์ - FM, FFM์ ์ฑ๋ฅ์ด ์๋์ค๋๋ฐ WDN, NCF๋ ์ฑ๋ฅ์ด ์ ๋์ค๋ ๊ฒ์ ๋ณด๊ณ DeepFM์ ๊ตฌํํด๋ด์ผ๊ฒ ๋ค๋ ์๊ฐ์ ํ๊ฒ.. 2023. 12. 22. [๋ค๋ถ์บ AI Tech] 6์ฃผ์ฐจ ํ์ต ์ ๋ฆฌ ๐ค ๋ชฉ์ฐจ ํ์ต ์ ๋ฆฌ & ๋ฐฐ์ด์ # 231211 ์ด๋ ํ๋ฃจ๋ ํฌ์คํ ์ ํ๋ค. # 231212 ํ์ต ์ ๋ฆฌ ๋ฐ ๋ฐฐ์ด์ ๐ - 3๊ฐ ๋ฃ๊ธฐ - latent factor model: ์ ์ ๋ ์์ดํ ์ ์ถ์ฝ๋ ๋ฒกํฐ ๊ณต๊ฐ์ ํํํ ์ ์๋ค๋ ์์ด๋์ด. - SVD๋ ์ํ์ ์ผ๋ก ๋ถํด, MF๋ SVD์ ์ผ๋ฐํ๋ ๋ฒ์ ์ผ๋ก ์ ์ ์ ์์ดํ ํ๋ ฌ์ ์ ํ์ ์ธ ๊ด๊ณ๋ฅผ SGD๋ก ์บก์ฒํ์ฌ ํ์ตํ๋ ๋ฐฉ๋ฒ. MF๋ฅผ ALS๋ก ํ์ตํ๋ฉด, loss๊ฐ parameter์ ๋ํด convex ํํ๊ฐ ๋์ด ํ์ต์ด ๋ ์ฌ์์ง๋ฉฐ, ๋ณ๋ ฌ ์ฒ๋ฆฌ๊ฐ ๊ฐ๋ฅํด์ ธ ๋ ํจ์จ์ ์ธ ํ์ต ๊ฐ๋ฅํจ - hybrid ์ ๊ทผ๋ฒ: weighted, switching, mixed ๊น์ง๋ ์ดํด๊ฐ ๊ฐ๋๋ฐ, Feature combination, augmentation ๋ฑ์ ์ดํด๊ฐ ์ ์๋จ - GBT.. 2023. 12. 15. [๋ค๋ถ์บ AI Tech] 6์ฃผ์ฐจ ์ฒซ์งธ ๋ ํ์ต ์ ๋ฆฌ + ์ผ๊ธฐ ๋ชฉ์ฐจ ๊ทธ๋ฅ ์ผ๊ธฐ + ๋ฐฐ์ฐ๋ฉด์ ์๊ฐํ ๊ฒ๋ค ๊ธฐ๋ก ์ค๋ ํ ์ผ - Book Rating EDA ๋ฐ๋ผ๊ฐ๊ธฐ - ๋๋ฉ์ธ ๊ธฐ์ด ๋ํ ๊ณํํ๊ธฐ - 1,2๊ฐ ๊ฐ์ ์๊ฐ - ์ต์ข ํ๋ก์ ํธ ํ์ ๊ดํด ์๊ฐํ๊ธฐ Book Rating EDA ๋ฐ๋ผ๊ฐ๊ธฐ - ์ถ์ฒ ํธ๋์ ๋ฐ์ดํฐ๋ ์คํ์์ค ๋ฐ์ดํฐ๋ผ ์ฝ๋๋ง ์กฐ๊ธ ์กฐ์ฌํ๋ฉด ๋์ด ๋คํ..(์ธ๊ฐ?)์ด๋ค! - kaggle์์์ ๋๊ตฌ๋ณด๋ค ๋น ๋ฅธ EDA ํ์ผ ์ฌ๋ฆฌ๊ธฐ! ๋ฅผ ์๋ํ๊ณ ์ถ์๋๋ฐ, ์ด ํ๋ซํผ์๋ ๋ ธํธ๋ถ ์ ๋ฐ์ดํธ ๊ธฐ๋ฅ์ด ๋ฐ๋ก ์๊ณ , ์ด๋ฏธ well-established EDA ํ์ผ์ด ์์ด์ ๋จธ์ฑํ๊ฒ ๋ฐ๋ผ๊ฐ๋ณด๋ ์ค์ด๋ค. ๋๋ ๋ฐ์ดํฐ๋ฅผ ์ ๋ํ๋ฉฐ ๋ฐ๊ตดํ๋ ๊ฒ์ ๋งค์ฐ๋งค์ฐ ์ฆ๊ธฐ๋ ์ฌ๋์ธ๋ฐ, ๋จ์ด EDA ํด๋์ ๊ฒ์ ๋ณด๋, ์๋ก์ด ๋ฉ์๋์ ์ธ์ฌ์ดํธ๊ฐ ๋ณด์ฌ ๊ฐ์ฒํ๋ ๋ง๊ณผ๋ ๋ค๋ฅด๊ฒ ๋ฐฐ์ธ ์ ์์ด์ ์ข์๋ค.. 2023. 12. 12. ์ด์ 1 2 ๋ค์