๋ชฉ์ฐจ
ํ์ต ์ ๋ฆฌ & ๋ฐฐ์ด์
# 231211
์ด๋ ํ๋ฃจ๋ ํฌ์คํ ์ ํ๋ค.
# 231212
ํ์ต ์ ๋ฆฌ ๋ฐ ๋ฐฐ์ด์ ๐
- 3๊ฐ ๋ฃ๊ธฐ
- latent factor model: ์ ์ ๋ ์์ดํ ์ ์ถ์ฝ๋ ๋ฒกํฐ ๊ณต๊ฐ์ ํํํ ์ ์๋ค๋ ์์ด๋์ด.
- SVD๋ ์ํ์ ์ผ๋ก ๋ถํด, MF๋ SVD์ ์ผ๋ฐํ๋ ๋ฒ์ ์ผ๋ก ์ ์ ์ ์์ดํ ํ๋ ฌ์ ์ ํ์ ์ธ ๊ด๊ณ๋ฅผ SGD๋ก ์บก์ฒํ์ฌ ํ์ตํ๋ ๋ฐฉ๋ฒ. MF๋ฅผ ALS๋ก ํ์ตํ๋ฉด, loss๊ฐ parameter์ ๋ํด convex ํํ๊ฐ ๋์ด ํ์ต์ด ๋ ์ฌ์์ง๋ฉฐ, ๋ณ๋ ฌ ์ฒ๋ฆฌ๊ฐ ๊ฐ๋ฅํด์ ธ ๋ ํจ์จ์ ์ธ ํ์ต ๊ฐ๋ฅํจ
- hybrid ์ ๊ทผ๋ฒ: weighted, switching, mixed ๊น์ง๋ ์ดํด๊ฐ ๊ฐ๋๋ฐ, Feature combination, augmentation ๋ฑ์ ์ดํด๊ฐ ์ ์๋จ
- GBTM ๋ฐฉ์ ์ค GBM์ ๋ฐ์ ์ํจ ์ธ ์ข ๋ฅ์ ๋ชจ๋ธ(XGBoost, lightGBM, CatBoost)์ ๋ํด ํ์ตํจ. ์ธ ๋ชจ๋ธ์ ์ถ์ฒ ๋ฌธ์ ์์๋ robustํ๋ฉฐ, ๋์ ์ฑ๋ฅ์ ๋ด๋ ํธ์ด๋ผ๊ณ ํจ -> ์ด๋ฒ ๋ํ์๋ ์ ์ฉํด๋ด.
- ๋ถ์บ ์ด๋กฑ์ ํตํด ๋ค๋ฅธ ์บ ํผ๋ค๊ณผ ๊ด์ฌ์ฌ๋ฅผ ์๋ก ๊ณต์ ํจ. ๋ช ํ์ด ๊ฒฐ์ฑ๋จ์ ๋ฐ๋ผ ์กฐ๋ฐ์ฌ๋ ๋๊ณ , ์ ์คํด์ผํ ๊ฒ ๊ฐ๊ธฐ๋ ํ๊ณ ๊ณ ๋ฏผ์ด ๋ง์๋ ๋ ์ด์์
# 231213
ํ์ต ์ ๋ฆฌ ๋ฐ ๋ฐฐ์ด์ ๐
- ๋ฌด์ฌํ ํ์ ์ ์๋ฃํจ. ๊ฐ์ด ์ํด๋ณด์์ ๐ฅฐ
- Book Rating ๋ํ์ ๋ฆฌ๋๋ณด๋๊ฐ ์คํ๋ ๋ . ์ํ ๋์ ๋ง์ ๊ณ ๋ฏผ์ ํ์ง๋ง, GPU์๋ฒ๋ฅผ ๋ฐ์ ์ธํ ํ๋ ์๊ฐ์ด ๋ง์ด ํ๋ ๋ค.
- ์ฐ์ ์ ์์ฑ๋์ด ์๋ ๋ฒ ์ด์ค ์ฝ๋ ์ค ๋ฐฐ์ ๋ ๊ฒ๋ค์ ์์ฃผ๋ก ๋ฏ์ด๋ณด๊ณ , ์ฌ๊ตฌ์ฑํด๋ณด๊ธฐ๋ก ํ๊ณ ๋ฐค ๋ฆ๊ฒ๊น์ง ๋ฏ์ด๋ณด๋ฉฐ 1ํ ์ ์ถ์ ํด๋ณด์๋ค. ๊ณต์งํด์ฃผ์ loss ๋๋น ๋๊ฒ ๋์จ ๊ฐ์ด ์์ด ์์ผ๋ก ์ด๋ป๊ฒ ์คํ ๊ด๋ฆฌ๋ฅผ ํด์ผํ ์ง ๊ณ ๋ฏผ์ด ๋๋ ๋ ์ด์๋ค.
- ๋ด๊ฐ ๋ถ์ํ ๋ชจ๋ธ์ CNN-FM๋ก, ๋ฐฐ์ด ๊ฐ๋ ์ ์์ฃผ ์ฝํ๊ฒ ์์ฉํ ๋ชจ๋ธ์ด์์. ์ฑ ํ์ง ์ด๋ฏธ์ง์์ CNN์ ํตํด ํน์ฑ์ ์ถ์ถํ๊ณ ID ์๋ฒ ๋ฉ๊ณผ ๋ด์ ์ ํตํด rating์ ์์ธกํ๋ ๋ชจ๋ธ์ด์์. ๋ด์์ผ๋ก ๋ค์ ๋ชจ๋ธ์ ๊ตฌํํ๋ ค๊ณ ๋ณด๋ np.cumsum ๋ฑ์ ํ์ฉํ๋ ๊ณณ์์ ์ต์ํ์ง ์์๋๋ฐ, ์ด๋ฒ ๊ธฐํ๋ฅผ ํตํด FM vs. FFM์ ๊ฐ๋ ์ ๊ตฌํ์ ํตํด ๋ค์ ํ ๋ฒ ์ ์ ์๊ฒ ๋จ
# 231214
ํ์ต ์ ๋ฆฌ ๋ฐ ๋ฐฐ์ด์ ๐
- ํ์๋ค๊ณผ Git์ ํตํ ํ๋ก์ ํธ ๊ด๋ฆฌ ๋ฐฉ๋ฒ์ ๋ํด ์ค๋ ์๊ฐ ๋ ผ์ํ๊ณ , ์์ผ๋ก ์ด๋ค ์คํ์ ํ ๊ฒ์ด๋ฉฐ, ๊ณต์ ๋ฅผ ์ด๋ป๊ฒ ํ ์ง ๋ ผ์ํจ.
- ํผ์ํ๋ ๊ฒ๋ณด๋ค ์๋๋ ๋ ๋์ง๋ง, ๊ฐ์ด ํ๊ฒ ๋์ด ์๋ก์ ์ง์์ ๊ณต์ ํ๊ณ , ํ์ ์ ์ํด์ ์ด๋ป๊ฒ git์ ๊ด๋ฆฌํ ๊ฒ์ธ์ง์ ๋ํด ์ถฉ๋ถํ ์๊ฐํด๋ณผ ์ ์๋ ์๊ฐ์ด ๋์ด ์ข์์.
- ํ์ ์ค ํ ๋ช ์ด manual parameter tuning์ผ๋ก ๋น์ผ ๋ฆฌ๋๋ณด๋ 1์๋ฅผ ํ๋๋ฐ, ๋๋ ๊ทธ๋ฌ๊ณ ์ถ๋ค + ์..์ ๋ชจ๋ธ์ด ์ฌ๊ธฐ์ ์ ๋์ํ๋ ์ด์ ๋ ๋ญ๊น ์๊ฐํด๋ณด๊ฒ ๋จ.
- ๋ค์์ฃผ๊น์ง cheatsheet draft๋ฅผ ๋ง๋ค๊ณ ๊ตฌ์ฒดํํด์ 1์ ๋ด๋ก ์ ์ฒด์ ๋ฐฐํฌํด๋ด์ผ๊ฒ ๋ค๋ ๋ค์ง(๊ณผ ์คํ)์ ํ ๋
- ๊ทธ๋ฆฌ๊ณ ์์ผ๋ก ์ด๋ค ์์ผ๋ก ๋ํ์ ์ํด๋ณผ์ง ๊ณํํด๋ณด์๋ค. ์์ง์ ๋ํ ์ค์ด๋ ๋ง์ ์๊ปด์ผ๊ฒ ์ง๋ง, ๊ณํํ ๊ฑฐ ๋คํ๋ฉด ๊ทธ๊ฒ๋ง์ผ๋ก๋ ๋ ์ค์ค๋ก ์ ๋ง ์ํ๋ค๊ณ ํ ์ ์์ ๊ฒ ๊ฐ๋ค.
# 231215
ํ์ต ์ ๋ฆฌ ๋ฐ ๋ฐฐ์ด์ ๐
- ์ง๋ ๋ฐค์ ํ์์ ๋ค๋ ์์ ๋ฐ๋ก ํด๋ณด๊ณ ์ถ์ ์๋๋ฅผ ํด๋ดค๊ณ , ๊ฐ๋ฅ์ฑ์ด ๋ณด์๋ค.
- ์ค์ ์ FM vs. FFM๊ณผ nn.Parameter vs. nn.Embedding์ ๊ตฌํ์ ๋ํด์ ์ดํด๊ฐ ๊ฐ๋๋ก ํ์๋ค์๊ฒ ์ค๋ช ํด์ฃผ์๋๋ฐ, ๋ชจ๋ ์ดํด๊ฐ ์ ๊ฐ๊ณ ์ข์๋ค๊ณ ํด์ ๋ฟ๋ฏํ๋ค! ์์ผ๋ก๋ ๋์๊ฐ๋ฉด์ ๋๋ ๊ณต๋ถ ๋ํ๊ณ ๊ทธ๋ ๊ฒ ๊ณ์ ํด๋ณด์!!
- ์คํ๊ด๋ฆฌ ํด์ ์ธํ ํ๋ ํ์คํ ๊ฒฐ๊ณผ๋ฅผ ์๊ฐ์ ์ผ๋ก ํ์ธํด๋ณผ ์ ์์ด์ ๋งค์ฐ ํธํ ๊ฒ ๊ฐ์๋ค.
- Git issue, pull request ๊ณ์ํด๋ conflict ๋ ๋๊ณ ๊ผฌ์ด๊ณ ํ์ง๋ง, ๊ทธ๋๋ ํ๋์ฉ ์ป์ด๊ฐ๋ ๊ฒ ๊ฐ์ ์ฌ๋ฏธ์๋ค.
- ๋งค์ผ ๋ฌด๋ ๋ฌด์์ผ๋ก git pull... ํ๋๋ฐ ์ด์ ๋ git fetch.. git merge or rebase.. ์ ์ต๊ด์ผ๋ก ๋ฐ๋์ด๊ฐ๋ค.
- git checkout vs. git switch + git restore ์ ํํ๋ ์ดํด๋์ง ์์์ง๋ง, ๋ธ๋์น๊ฐ ์ ํ์๋ switch, ์ํน ๋๋ ํ ๋ฆฌ์ ํ์ผ ์์ ์ฌํญ์ head commit์ผ๋ก ๋ฐ๊ฟ ์ ์๋ค๋ ์ ๋๋ง ์์๋ค. ์ ์ด์ checkout์ ์ด ์ฉ๋๋ก๋ง ์ด ๊ฒ ๊ฐ์๋ฐ ํน์ ๋ค๋ฅธ ๊ธฐ๋ฅ์ด ๋ ์์๋ ๊ฑด๊ฐ..?
5์ฃผ์ฐจ ์ดํ ๐ค
๊ทน๋น๋ ์์ผ๋๊น ์ด๋ฒ์ฃผ๋ ์กฐ์ฉํ ๋ง๋ฌด๋ฆฌ, ๋ค์์ฃผ ๋ฉ์ ๋ฆฌํฌํธ ์ ์ ์ถํ๊ธฐ ์ํด ์ง๊ธ๊น์ง ํ ์์ ๋ค์ ์ฐจ๊ณก์ฐจ๊ณก ์ ์ ๋ฆฌํด๋์ด์ผ๊ฒ ๋ค. ํผ์๋ ์์ ๋ํ ๋ช ๋ฒ ์ฐธ์ฌํด๋ดค์ผ๋, ๊ฐ์ด ํ๋ ๋ํ๋ ๋ ์ฒ์์ด๋ผ ์ด๋ ต๊ธฐ๋ ์ฌ๋ฏธ์๊ธฐ๋ ํ๋ค. ๊ฐ์ด ๋ง์ ๋ง์ถฐ์ ์ฑ์ฅ๋ ์ํ๊ณ , ์ข์ ์ฑ๋ฅ๊น์ง ๋ค์ผ๋ก ๋ฐ๋ผ์ค๋ฉด ์ข๊ฒ ๋ค!
'ํ๊ณ ๐ค > ๋ค๋ถ์บ AI Tech' ์นดํ ๊ณ ๋ฆฌ์ ๋ค๋ฅธ ๊ธ
[๋ค๋ถ์บ AI Tech] 8์ฃผ์ฐจ ํ์ต ์ ๋ฆฌ ๐ค (1) | 2023.12.29 |
---|---|
[๋ค๋ถ์บ AI Tech] 7์ฃผ์ฐจ ํ์ต ์ ๋ฆฌ ๐ค (1) | 2023.12.22 |
[๋ค๋ถ์บ AI Tech] 6์ฃผ์ฐจ ์ฒซ์งธ ๋ ํ์ต ์ ๋ฆฌ + ์ผ๊ธฐ (2) | 2023.12.12 |
[๋ค๋ถ์บ AI Tech] 5์ฃผ์ฐจ ํ์ต ์ ๋ฆฌ ๐ค (1) | 2023.12.08 |
[๋ค๋ถ์บ AI Tech] 4์ฃผ์ฐจ ํ์ต ์ ๋ฆฌ ๐ค (0) | 2023.12.01 |