ํ์ต ์ ๋ฆฌ & ๋ฐฐ์ด์
# 240108
ํ์ต ์ ๋ฆฌ ๋ฐ ๋ฐฐ์ด์ ๐
3๊ฐ ์ ๋ฆฌ
- ์ํ์ค ๋ฐ์ดํฐ๋ ์ง๊ณ, FEํ์ฌ ์ผ๋ฐ ์ ํ ๋ฐ์ดํฐ์ฒ๋ผ ๋๋ ํธ๋์ ์ ๋ฐ์ดํฐ ๊ทธ๋๋ก ์ฌ์ฉํ ์ ์๋๋ฐ, ์ ์์ ๊ฒฝ์ฐ ์ ๋ณด์ ์์ค์ด ๋ถ๊ฐํผํจ
- Tabular Approach/Sequential Approach ๋ฅผ ํตํด ์ํ์ค ๋ชจ๋ธ๋ง์ด ๊ฐ๋ฅํจ.
- Tabular Approach ์ ํ ๋ฐ์ดํฐ๋ก ๊ฐ์ ํ๊ณ ์ ๊ทผ.
- FE
- ๋ฌธ์ ๋ฅผ ํผ ์์ ์์ ์ฌ์ฉ์์ ์ ์ค๋ฅ
- ๋ฌธ์ ๋ฐ ์ํ ๋ณ ๋์ด๋ (์ ์ฒด ์ ๋ต์)/(์ ์ฒด ํ์ด์)
- Train/valid data split: leakage ๋ฐ์ ์์ด ์ชผ๊ฐ๋ ค๋ฉด ์ํ์ค๋ฅผ ์ชผ๊ฐค ๋, ์ ์ ๋ณ๋ก ๋ฌถ์ด์ผ ์ ๋๋ก ๋ ํ๊ฐ๊ฐ ๋๋ค. train/test ๋ฐ์ดํฐ์ ID ๊ณต์ ์ฌ๋ถ๋ฅผ ํ์ธํ๊ณ , ๊ณต์ ํ์ง ์๋๋ค๋ฉด ์ ์ ๊ธฐ๋ฐ ์คํ๋ฆฟ
- Hyperparameter tuning ํ๊ธฐ ํด์ผ๋์ง๋ง ๋๋ฌด ๋ง์ ์๊ฐ์ ํฌ์ํ๋ฉด ์๋๊ณ , Feature importance๊ฐ ๋ชจ๋ธ์ ์ ๋ถ๋ฅผ ๋ณด์ฌ์ฃผ๋ ๊ฑด ์๋๊ธด ํ์ง๋ง ๋ณผ ์ ์์
- Sequential data: DKT, DSB๋ ์ฃผ๋ก many-to-one!
- LSTM, Transformer๋ batch_size, seq_len, input_size ์ ์
๋ ฅ ํํ๋ฅผ ๊ฐ์ง
- LSTM, Transformer์์ continuout ๋ฐ์ดํฐ๋ ์๋ฒ ๋ฉ ๋ ์ด์ด๋ฅผ ํตํด b,s, i, h ์ ํฌ๊ธฐ๋ก ๋ฐ๋๊ณ , i, h๋ฅผ ๊ณฑํด ํ๋์ ์ฐจ์์ผ๋ก ๋ณ๊ฒฝํด์ค. ์ดํ linear transformation์ ํตํด hidden_size//2 ์ ํฌ๊ธฐ๋ก ๋ฐ์ดํฐ๋ฅผ ์ค์ฌ์ฃผ๊ณ , layernorm ์ดํ hidden_size//2 ํฌ๊ธฐ์ continuous ๋ฐ์ดํฐ์ concatํ๋ค.
- ์ฆ, ์ฌ์ฉ์ ๋จ์๋ก ์ํ์ค๋ฅผ ์์ฑํ๋ค.
[๋ด๊ฐ ๋ง๋ gbdt baseline]
- default ์ธํ
์์ xgboost, lightgbm, catboost ์ค catboost๊ฐ ๊ฐ์ฅ ๋์ ์ฑ๋ฅ์ ๋
- ์์ฃผ ๊ฐ๋จํ ์์ง๋์ด๋ง๋ง ํ์๋๋, ์นดํ ๊ณ ๋ฆฌ ๋ฐ์ดํฐ๊ฐ ๋ง์์ ๊ทธ๋ด ๊ฒ์ผ๋ก ๋ณด์
# 240109
ํ์ต ์ ๋ฆฌ ๋ฐ ๋ฐฐ์ด์ ๐
- ์ง์ง๋์ฃผ ์ฌํ์ ์ฌํ๋ก ๋ฃ์ง ๋ชปํ ๊ฐ์ ์ค์ ์ ์๊ฐ (linux, docker)
- 4๊ฐ. Sequence Data ๋ฌธ์ ์ ์์ ๋ง๋ Transformer Architecture ์ค๊ณ ์๊ฐ: DSB, Riiid!, Predicting Molecular Properties, MoA ๋ฐ์ดํฐ ์ธํธ๊ฐ ์์์ผ๋ฉฐ, ํธ๋์คํฌ๋จธ ๊ตฌ์กฐ๊ฐ ์ ๋ฆฌํ์. ํน์ดํ๋ ์ ์ ๋ถ์ ๊ฒฐํฉ ์ ๋ณด์ ๊ฒฝ์ฐ ์์๊ฐ ์๊ธฐ๋ ํ์ง๋ง ์ผ๋ถ ์์๊ฐ ๋ฐ๋์ด๋ ๋์ผํ ๊ฒฐ๊ณผ๊ฐ ๋์์ผ ํ๋ ํน์ฑ์ด ์์ด positional encoding์ ์ฌ์ฉํ์ง ์์๋ ๊ฒ. MoA ๋ํ์ ๊ฒฝ์ฐ, ์ํ์ค ๋ฐ์ดํฐ๊ฐ ์๋์ง๋ง ๋ฐ์ดํฐ๋ฅผ FC๋ฅผ ํตํด ํผ์น๊ณ ์ํ์ค์ ๊ฐ์ด ์ทจ๊ธํ์ฌ 1D-CNN์ ์ ์ฉํ ๊ฒ์ด ์ธ์๊น์์.
# 240110
ํ์ต ์ ๋ฆฌ ๋ฐ ๋ฐฐ์ด์ ๐
1์ ์ผ์ ํ์ ๋ฐ ํ์ต ๊ณํ
# 240111
ํ์ต ์ ๋ฆฌ ๋ฐ ๋ฐฐ์ด์ ๐
5๊ฐ ์๊ฐ: ํธ๋์คํฌ๋จธ, ์ธํ ํํ๊ณผ ์์ํ ๊ตฌํ ๋ฐฉ๋ฒ
- ๋ฒํธ๋ฅผ ์ฌ์ฉํ์๋๋ฐ, ์ฌ์ ํ์ต ๋๋ฌธ์ ์๋๊ณ ํธ๋์คํฌ๋จธ ์ธ์ฝ๋ ๊ตฌ์กฐ๋ฅผ ์์ฝ๊ฒ ๋ถ๋ฌ์ค๊ธฐ ์ํจ
- ํธ๋์คํฌ๋จธ ๋ ์ด์ด๋ฅผ ๋ช ๊ฐ ์์ ๊ฒ์ธ์ง? - 1๊ฐ ์์๋ค! ๋ณดํต DKT์์๋ 1๊ฐ๋ง ์ฌ์ฉํ๋ค๊ณ ํจ
LSTM, RNN ๊ตฌํ
- RNN์ ์ํ์ค ๊ธธ์ด์ง๋ฉด ์ฅ๊ธฐ ๊ธฐ์ต๋ ฅ์ด ์์ข์์ ธ์, ์ฑ๋ฅ์ด ๋จ์ด์ ธ์ผํ๋๋ฐ, ์คํ๋ ค ์ข์
- ์ด ๋ฌธ์ ๋ ์ ์ฒด๋ฅผ ๊ธฐ์ตํ๋ ๊ฒ๋ณด๋ค๋ ์ต๊ทผ ๋ฐ์ดํฐ์ ๋ํ ์ ํ์ฑ์ด ๋ ์ค์ํด์ ์ฑ๋ฅ์ ํฐ ์ํฅ์ด ์์ง ์์๊น?
- RNN, CatBoost ์์๋ธ: ๋ ๋ชจ๋ธ์ ์ถ๋ ฅ ๋ถํฌ๊ฐ ๋งค์ฐ ๋ค๋ฅด๊ณ , CatBoost์ ๊ฐ์ค์น๋ฅผ ๋ ์คฌ์ ๋ ์ฝ๊ฐ ๋ ์ข์์ง
# 240112
ํ์ต ์ ๋ฆฌ ๋ฐ ๋ฐฐ์ด์ ๐
6๊ฐ ์ ๋ฆฌ: Kaggle Riiid Competition Winner's Solution ํ์
- ์ค์ํ ๋ ๋ค๋ฅธ ํน์ง. multi-head attention์ head ์๋ฅผ ๋ฌ๋ฆฌํ์ฌ ์์๋ธํ ๊ฒ
- ** ๋ง์ง๋ง ์ฟผ๋ฆฌ๋ง ์ฐ๋ ๊ฒ์ ๋ํ ๋
ผ๋ฌธ ์ฐธ๊ณ ์์ฒดํด์: ๋ง์ง๋ง ๋ฌธ์ (question)์ ๋ํ ์ ๋ตํ๋ฅ ์ ์์ธกํ๋ ๊ฒ์ด๋ฏ๋ก, ์ ์ฒด ์ํ์ค์ ๋ํด ์ดํ
์
์ ๊ตฌํ ํ์๊ฐ ์๋ค + last query ๋ง ์ฌ์ฉํ๋ฉด ์๊ฐ ๋ณต์ก๋๋ ์ค์ด๋๋๋ฐ ์ฑ๋ฅ ์ฐจ์ด๋ ๋ณ๋ก ์๋ค. ๊ตฌํ ์ดํ
์
์ skip-connection์ ํตํด ๋ชจ๋ ์ํ์ค value์ ๋ค์ ๋ํด์ฃผ๋๋ฐ, ์ฌ์ค์ last query์ ๋ํด์๋ง ์ ๋ฌ๋์ด์ผ ํ๋ ๊ฒ ์๋๊ฐ ์ถ์. query์ ๋ํด ๊ตฌํ ์ดํ
์
์ ์ ์ฒด ์ํ์ค์ ๋ค์ ๋ํด์ฃผ๋ ๊ฒ์ ์ ์ดํด๊ฐ ๋์ง ์์.
10์ฃผ์ฐจ ์ดํ ๐ค
์ํ ์
- GBDT series ํ์ต๊ณผ ๋ฐ์ดํฐ ์ค๋น๋ฅผ from scratch๋ก ํ์ฌ ์ ์ถํด๋ณธ ๊ฒ
- LSTM, RNN ๋ชจ๋ธ๊ณผ ๋ฐ์ดํฐ์ , ๋ก๋ ๊ตฌํ์ from scratch๋ก ๊ตฌํํ ๊ฒ
- ์ง๋ ๋ฒ ์ ์ฉํ์ง ๋ชปํ๋ learning rate scheduler๋ฅผ ๋ฃ์ด ํ๋์์ด๋ ์ด๋ ์ ๋์ ์ฑ๋ฅ์ ํ๋ณดํ ๊ฒ
- config๋ฅผ yamlํ์ผ๋ก ๊ด๋ฆฌํด๋ณธ ๊ฒ
- ๊ฐ์ ๋ฃ๊ณ ๋์ ํญ์ ๋ญ๋ฐฐ์ ๋์ง ์ ๋ฆฌํ๊ณ , ๋๋์ธ ๋ค, ํฅํ ๋ฐฉํฅ์ ์ฐธ๊ณ ํ ๊ฒ
๋ชปํ ์
- ๋งค์ผ๋งค์ผ ์ผ์ฐ ์ผ์ด๋์ ๊ณต๋ถํ๋ ค๊ณ ํ๋๋ฐ, 3์ผ๋ฐ์ ์ผ์ฐ ๋ชป์ผ์ด๋ฌ๋ค ใ ใ
- ๊ฐ์ 9๊ฐ๊น์ง ๋ค์ผ๋ ค๊ณ ํ๋๋ฐ, 7๊ฐ๊น์ง๋ง ๋ค์(๋ฃ๊ณ ์)๋ค. ๊ทธ๋ฌ๋๊น, ์ง๋๊ฐ ๋๋ฆฌ๋ค.
๋ฐฐ์ด์
- ์ง๊ณํ ๋ฐ์ดํฐ, ์ํ์ค ๋ฐ์ดํฐ๋ฅผ ์ด๋ป๊ฒ ๋ชจ๋ธ์ ์ ๋ ฅ์ผ๋ก ์ฒ๋ฆฌํ ์ ์์์ง ์ง์ ๊ตฌํํด๋ณด๋ฉฐ, ์๋ก์ด ๋ฐ์ดํฐ๊ฐ ์ฃผ์ด์ ธ๋ ๋ชฉํํ๋ ํํ๋ก ๋ง๋ค์ด๋ผ ์ ์๋ค๋ ์์ ๊ฐ+๋ฅ๋ ฅ(?)์ด ์๊น
- ์์ง ๊ตฌํ์ ๋ง์ด ๋ชปํด๋ณด์์ง๋ง, ํธ๋์ญ์ ๋ฐ์ดํฐ๋ฅผ ๋ค์ํ ๋ฐฉ๋ฒ์ผ๋ก ์์ง๋์ด๋งํ๋ ๋ฐฉ๋ฒ์ ๋ํด ์ตํ๊ณ , ์ ์ฉํ๋ฉด ์ฑ๋ฅ์ ํฅ์์ด ๊ฐ๋ฅํ ๋ฏํจ
๋ ํด๋ณผ ๊ฒ
- ๋ค์ํ ๊ฐ์ค ๊ธฐ๋ฐ์ FE ๋ฐฉ์์ ์ ์ฉํด๋ณด๊ธฐ
- ๋ฐ์ดํฐ ์ฆ๊ฐ
- ์๋ก์ด ๋ชจ๋ธ ๊ตฌ์กฐ ์ค๊ณ ๋ฐ ๊ตฌํํด๋ณด๊ธฐ
- ๋ฉ์ ๋ฆฌํฌํธ ํ์๊ณผ ์ด์ ๋ง๋ค๊ธฐ
- CV ๊ตฌํํ๊ธฐ
'ํ๊ณ ๐ค > ๋ค๋ถ์บ AI Tech' ์นดํ ๊ณ ๋ฆฌ์ ๋ค๋ฅธ ๊ธ
[๋ค๋ถ์บ AI Tech] 9์ฃผ์ฐจ ํ์ต ์ ๋ฆฌ ๐ค (1) | 2024.01.05 |
---|---|
[๋ค๋ถ์บ AI Tech] 8์ฃผ์ฐจ ํ์ต ์ ๋ฆฌ ๐ค (1) | 2023.12.29 |
[๋ค๋ถ์บ AI Tech] 7์ฃผ์ฐจ ํ์ต ์ ๋ฆฌ ๐ค (1) | 2023.12.22 |
[๋ค๋ถ์บ AI Tech] 6์ฃผ์ฐจ ํ์ต ์ ๋ฆฌ ๐ค (1) | 2023.12.15 |
[๋ค๋ถ์บ AI Tech] 6์ฃผ์ฐจ ์ฒซ์งธ ๋ ํ์ต ์ ๋ฆฌ + ์ผ๊ธฐ (2) | 2023.12.12 |