๐ง Deep Learning
์ฑ๋ฅ ์ต์ ํ ๋ฐ์ดํฐ๋ฅผ ์ฌ์ฉํ ์ฑ๋ฅ ์ต์ ํ ์ผ๋ฐ์ ์ผ๋ก ML/DL ์๊ณ ๋ฆฌ์ฆ์ ๋ฐ์ดํฐ์์ด ๋ง์์๋ก ์ฑ๋ฅ์ด ์ข๊ธฐ ๋๋ฌธ์ ๊ฐ๋ฅํ ๋ง์ ๋ฐ์ดํฐ๋ฅผ ์์ง ๋ง์ ๋ฐ์ดํฐ๋ฅผ ์์งํ ์ ์๋ค๋ฉด ์ง์ ๋ฐ์ดํฐ๋ฅผ ๋ง๋ค์ด ์ฌ์ฉ ํ์ฑํ ํจ์๋ก ์๊ทธ๋ชจ์ด๋(0~1์ ๊ฐ), ํ์ดํผ๋ณผ๋ฆญ ํ์ ํธ(-1~1์ ๊ฐ) ๋ฑ์ ์ฌ์ฉํ์ฌ ๋ฐ์ดํฐ์
๋ฒ์๋ฅผ ์กฐ์ ์ ๊ทํ, ๊ท์ ํ, ํ์คํ ๋ฑ๋ ์ฑ๋ฅ ํฅ์์ ๋์ ์๊ณ ๋ฆฌ์ฆ์ ์ฌ์ฉํ ์ฑ๋ฅ ์ต์ ํ ML/DL์ ์ํ ๋ค์ํ ์๊ณ ๋ฆฌ์ฆ ์ค ์ ์ฌํ ์ฉ๋์ ์๊ณ ๋ฆฌ์ฆ๋ค์ ์ ํํ์ฌ ๋ชจ๋ธ์ ํ๋ จ์์ผ ๋ณด๊ณ ์ต์ ์ ์ฑ๋ฅ์ ๋ณด์ด๋ ์๊ณ ๋ฆฌ์ฆ์ ์ ํํด์ผ ํ๋ค. ์๊ณ ๋ฆฌ์ฆ ํ๋์ ์ํ ์ฑ๋ฅ ์ต์ ํ ๋ชจ๋ธ์ ํ๋ ์ ํํ์ฌ ํ๋ จ์ํค๋ ค๋ฉด ๋ค์ํ ํ์ดํผํ๋ผ๋ฏธํฐ๋ฅผ ๋ณ๊ฒฝํ๋ฉด์ ํ๋ จ์ํค๊ณ ์ต์ ์ ์ฑ๋ฅ์ ๋์ถํด์ผ ํ๋ค. ์ง๋จ : ์ฑ๋ฅ ํฅ์์ด ์ด๋ ์๊ฐ ๋ฉ์ท์..
๐ง Deep Learning
๋งค๊ฐ๋ณ์ ๊ฐฑ์ ํ๋ฅ ์ ๊ฒฝ์ฌ ํ๊ฐ๋ฒ(SGD) ์ ๊ฒฝ๋ง ํ์ต์ ๋ชฉ์ ์ ์์ค ํจ์์ ๊ฐ์ ๊ฐ๋ฅํ ํ ๋ฎ์ถ๋ ๋งค๊ฐ๋ณ์๋ฅผ ์ฐพ๋ ๊ฒ์ผ๋ก ์ด๋ ๊ณง ๋งค๊ฐ๋ณ์์ ์ต์ ๊ฐ์ ์ฐพ๋ ๋ฌธ์ ์ด๋ฉฐ, ์ด๋ฌํ ๋ฌธ์ ๋ฅผ ํธ๋ ๊ฒ์ `์ต์ ํ(optimization)`์ด๋ผ๊ณ ํ๋ค. ์ต์ ์ ๋งค๊ฐ๋ณ์ ๊ฐ์ ์ฐพ๊ธฐ ์ํ ๋จ์๋ก ๋งค๊ฐ๋ณ์์ ๊ธฐ์ธ๊ธฐ(๋ฏธ๋ถ)๋ฅผ ์ด์ฉํ๋๋ฐ, ๋งค๊ฐ๋ณ์์ ๊ธฐ์ธ๊ธฐ๋ฅผ ๊ตฌํด ๊ธฐ์ธ์ด์ง ๋ฐฉํฅ์ผ๋ก ๋งค๊ฐ๋ณ์ ๊ฐ์ ๊ฐฑ์ ํ๋ ์ผ์ ๋ฐ๋ณตํด์ ์ต์ ์ ๊ฐ์ ํฅํด ๋ค๊ฐ๊ฐ๋ ๊ฒ์ด `ํ๋ฅ ์ ๊ฒฝ์ฌ ํ๊ฐ๋ฒ(SGD)`์ด๋ค. SGD๋ ๋ค์๊ณผ ๊ฐ์ ์์์ผ๋ก ํํ์ด ๊ฐ๋ฅํ๋ค. ๊ฒฐ๊ตญ SGD๋ ๊ธฐ์ธ์ด์ง ๋ฐฉํฅ์ผ๋ก ์ผ์ ๊ฑฐ๋ฆฌ๋ง ๊ฐ๊ฒ ๋ค๋ ๋จ์ํ ๋ฐฉ๋ฒ์ด๋ค. SGD๋ฅผ ํ์ด์ฌ ์ฝ๋๋ก ๊ตฌํํ๋ฉด ๋ค์๊ณผ ๊ฐ๋ค. class SGD: def __init__(self, lr=0.01): se..
๐ง Deep Learning/RNN
Sequence-to-sequence model `Seq2Seq` ๋ชจ๋ธ์ words, letters, features of images ๋ฑ์ sequence data๋ฅผ Inputs์ผ๋ก ์ฌ์ฉํ๋ฉฐ Outputs ๋ํ ๋๋ค๋ฅธ sequence data์ด๋ค. ์ฌ๊ธฐ์ ์
๋ ฅ์ ์ฌ์ฉํ๋ sequence์ ํด๋นํ๋ item์ ๊ฐ์์ ์ถ๋ ฅ์ sequence์ ํด๋นํ๋ item์ ๊ฐ์๊ฐ ๋์ผํ ํ์๋ ์๋ค. ์ด๋ฌํ sequence-to-sequence ๋ชจ๋ธ์ ๋ฒ์ญ ๋จธ์ ์ผ๋ก ์ฌ์ฉ๋๋ฉฐ ์ด ๊ฒฝ์ฐ sequence๋ ๋จ์ด๋ค๋ก ๊ตฌ์ฑ๋๋ฉฐ, output ๋ํ ๋ง์ฐฌ๊ฐ์ง๋ก ๋จ์ด๋ค๋ก ๊ตฌ์ฑ๋๋ค. Encoder-Decoder Seq2Seq ๋ชจ๋ธ์ `Encoder`์ `Decoder`๋ก ๊ตฌ์ฑ๋๋ค. ๊ฐ๊ฐ์ ์ญํ ์ ๋ค์๊ณผ ๊ฐ๋ค. Encoder : in..
๐ง Deep Learning/RNN
๊ธฐ์ต์ ๊ฐ๋ ์ ๊ฒฝ๋ง ๋ชจ๋ธ RNN ๊ธฐ์ต์ ์ ๋ฌํ๋ ์ํ ์ ๊ฒฝ๋ง ์๊ฐ๊ณผ ๊ณต๊ฐ์ ์์ ๊ด๊ณ๊ฐ ์๋ ๋ฐ์ดํฐ๋ฅผ `์์ฐจ ๋ฐ์ดํฐ(sequence data)`๋ผ๊ณ ๋ถ๋ฅธ๋ค. ์์ฐจ ๋ฐ์ดํฐ๋ ์๊ณต๊ฐ์ ์์ ๊ด๊ณ๋ก ํ์ฑ๋๋ ๋ฌธ๋งฅ ๋๋ `์ฝํ
์คํธ(context)`๋ฅผ ๊ฐ๋๋ค. ํ์ฌ ๋ฐ์ดํฐ๋ฅผ ์ดํดํ ๋ ์๋ค์ ์๋ ๋ฐ์ดํฐ๋ฅผ ํจ๊ป ์ดํด๋ณด๋ฉด์ ์ฝํ
์คํธ๋ฅผ ํ์
ํด์ผ ํ์ฌ ๋ฐ์ดํฐ์ ์ญํ ์ ์ดํดํ ์ ์๋ค. ์ธ๊ณต ์ ๊ฒฝ๋ง์ด ๋ฐ์ดํฐ์ ์์๋ฅผ ๊ณ ๋ คํ์ฌ ์ฝํ
์คํธ๋ฅผ ๋ง๋ค๋ ค๋ฉด ๋ฐ์ดํฐ์ ์์ฐจ ๊ตฌ์กฐ๋ฅผ ์ธ์ํ ์ ์์ด์ผ ํ๊ณ , ๋ฐ์ดํฐ์ ์ฝํ
์คํธ ๋ฒ์๊ฐ ๋๋๋ผ๋ ์ฒ๋ฆฌํ ์ ์์ด์ผ ํ๋ค. ์ด๋ฐ ์ ๋ค์ ๊ณ ๋ คํ์ฌ ๋ง๋ ์ธ๊ณต ์ ๊ฒฝ๋ง์ด ๋ฐ๋ก `์ํ ์ ๊ฒฝ๋ง(RNN: Recurrent Neural Network)`์ด๋ค. ์๋ฐฉํฅ ์ ๊ฒฝ๋ง์ด๋ ์ปจ๋ฒ๋ฃจ์
์ ๊ฒฝ๋ง๊ณผ๋ ๋ค๋ฅด๊ฒ ์ํ ..
๐ง Deep Learning/RNN
์ํ ์ ๊ฒฝ๋ง ํ์ต ํ์ต์ด๋ ๋ฐ์ดํฐ๋ฅผ ํตํด parameters๋ฅผ ์ถ์ ํ๋ค๋ ๊ฒ์ ์๋ฏธํ๋ค. ์ํ ์ ๊ฒฝ๋ง์ t์์ ๊น์ง์ ๊ณผ๊ฑฐ ์ ๋ณด๋ฅผ ํ์ฉํ์ฌ y๋ฅผ ์์ธกํ๊ฒ ๋๋๋ฐ, ํ์ต ๋์์ด ๋๋ ํ๋ผ๋ฏธํฐ๋ 3๊ฐ์ง์ด๋ค. ์ฒซ ๋ฒ์งธ๋ t ์์ ์ ๋ฐ์ดํฐ๋ฅผ ๋ฐ์ํ W_xh ๊ฐ์ค์น, ๋ ๋ฒ์งธ๋ t ์์ ์ด์ ์ ์ ๋ณด๋ฅผ ๋ฐ์ํ๋ W_hh ๊ฐ์ค์น, ๊ทธ๋ฆฌ๊ณ t ์์ ์ y๋ฅผ ์์ธกํ ๋ ํ์ฉํ๋ W_hy ๊ฐ์ค์น์ด๋ค. ํด๋น ํ๋ผ๋ฏธํฐ๋ ๋งค ์์ ๋ง๋ค ๊ณต์ ํ๋ ๊ตฌ์กฐ์ด๋ฉฐ(parameter sharing), ๋งค ์์ ํ๋ผ๋ฏธํฐ๋ฅผ ๊ตฌ์ฑํ๋ ๊ฐ์ด ๊ฐ๋ค. ๋ํ ์ต์ ์ W๋ W๋ฅผ ๋งค ์์ ์ ์ฉํ์ ๋ Loss๊ฐ ์ต์๊ฐ ๋๋ W์ด๋ค. hidden state์ ์์ธก๊ฐ์ ๋ค์๊ณผ ๊ฐ์ด ๊ณ์ฐ๋๋ค. ์ํ ์ ๊ฒฝ๋ง์ด 3๊ฐ์ง์ ๊ฐ์ค์น๋ฅผ ์ถ๋ก ํ๋ ํ์ต๊ณผ์ ์ ๋ค์๊ณผ ๊ฐ๋ค. Los..
๐ง Deep Learning/RNN
์๊ณ์ด ๋ฐ์ดํฐ ์์ธก ๋ถ์ ๋ฐฉ๋ฒ๋ก ํธ๋ ๋ `์๊ณ์ด ๋ฐ์ดํฐ(Time Series Data)`๋, ์๊ฐ์ ํ๋ฆ์ ๋ฐ๋ผ ์์๋๋ก ๊ด์ธก๋์ด ์๊ฐ์ ์ํฅ์ ๋ฐ๊ฒ ๋๋ ๋ฐ์ดํฐ๋ฅผ ๋งํ๋ค. ์ด๋ฌํ ์๊ณ์ด ๋ฐ์ดํฐ์๋ `์๊ณ์ด ๋จ๋ณ๋ ๋ฐ์ดํฐ(Univariate time series data)`, `์๊ณ์ด ๋ค๋ณ๋ ๋ฐ์ดํฐ(Multivariate time series data)`, `์๊ณ์ด ์ด๋ฏธ์ง ๋ฐ์ดํฐ(Time series image data)` ๋ฑ์ด ์๋ค. ์ ํต ํต๊ณ ๊ธฐ๋ฐ ์๊ณ์ด ๋ฐ์ดํฐ ๋ถ์ ๋ฐฉ๋ฒ๋ก ์ด๋ํ๊ท ๋ฒ(Moving average) ์ง์ํํ๋ฒ(Exponential smoothing) ARIMA(Autoregressive integrated moving average) ๋ชจ๋ธ SARIMA(Seasonal ARIMA) ๋ชจ๋ธ ..
๐ง Deep Learning
๊ฐ์ค์น ์ด๊ธฐํ(Weight Initialization) ์ ๊ฒฝ๋ง์ ํ์ตํ ๋ ์์ค ํจ์์์ ์ถ๋ฐ ์์น๋ฅผ ๊ฒฐ์ ํ๋ ๋ฐฉ๋ฒ์ด ๋ชจ๋ธ `์ด๊ธฐํ(initialization)`์ด๋ค. ํนํ ๊ฐ์ค์น๋ ๋ชจ๋ธ์ ํ๋ผ๋ฏธํฐ์์ ๊ฐ์ฅ ํฐ ๋น์ค์ ์ฐจ์งํ๊ธฐ ๋๋ฌธ์ ๊ฐ์ค์น์ ์ด๊ธฐํ ๋ฐฉ๋ฒ์ ๋ฐ๋ผ ํ์ต ์ฑ๋ฅ์ด ํฌ๊ฒ ๋ฌ๋ผ์ง ์ ์๋ค. ์์ ์ด๊ธฐํ ์ ๊ฒฝ๋ง์ ๊ฐ์ค์น๋ฅผ ๋ชจ๋ 0์ผ๋ก ์ด๊ธฐํํ์ฌ ๋ด๋ฐ์ ๊ฐ์ค์น๊ฐ 0์ด๋ฉด ๊ฐ์ค ํฉ์ฐ ๊ฒฐ๊ณผ๋ ํญ์ 0์ด ๋๊ณ , ํ์ฑ ํจ์๋ ๊ฐ์ค ํฉ์ฐ ๊ฒฐ๊ณผ์ธ 0์ ์
๋ ฅ๋ฐ์์ ๋ ๊ฐ์ ๊ฐ์ ์ถ๋ ฅํ๋ค. ์๋ฅผ ๋ค์ด ํ์ฑ ํจ์๊ฐ ReLU๋ ํ์ดํผ๋ณผ๋ฆญ ํ์ ํธ๋ฉด ์ถ๋ ฅ์ 0์ด ๋๊ณ ์๊ทธ๋ชจ์ด๋๋ฉด ์ถ๋ ฅ์ ํญ์ 0.5๊ฐ ๋๋ค. 0์ด ์๋ ๋ค๋ฅธ ๊ฐ์ ๊ฒฝ์ฐ์๋ ๋ง์ฝ ๊ฐ์ค์น๋ฅผ ๋ชจ๋ ๊ฐ์ ์์๋ก ์ด๊ธฐํํ๋ฉด ์ ๊ฒฝ๋ง์ `๋์นญ์ฑ(symmetry)`์ด ์๊ฒจ..
๐ง Deep Learning
ํ๋ฅ ์ ๊ฒฝ์ฌ ํ๊ฐ๋ฒ ํ๋ฅ ์ ๊ฒฝ์ฌ ํ๊ฐ๋ฒ์ ์์ค ํจ์์ ๊ณก๋ฉด์์ ๊ฒฝ์ฌ๊ฐ ๊ฐ์ฅ ๊ฐํ๋ฅธ ๊ณณ์ผ๋ก ๋ด๋ ค๊ฐ๋ค ๋ณด๋ฉด ์ธ์ ๊ฐ ๊ฐ์ฅ ๋ฎ์ ์ง์ ์ ๋๋ฌํ๋ค๋ ๊ฐ์ ์ผ๋ก ๋ง๋ค์ด์ก๋ค. ๊ทธ๋ฌ๋ ๊ฐ์ ์ด ๋จ์ํ๊ธฐ ๋๋ฌธ์ ๋ค์ํ ์ํฉ์ ์ ๋์ฒํ์ง ๋ชปํ๊ณ ํ์ต ์๋๋ ๋๋ฆฌ๊ธฐ ๋๋ฌธ์ ์ฑ๋ฅ์ ํ๊ณ๊ฐ ์๋ค. ๊ณ ์ ๋ ํ์ต๋ฅ ํ์ต๋ฅ ์ด๋ ์ต์ ํํ ๋ ํ ๊ฑธ์์ ํญ์ ๊ฒฐ์ ํ๋ ์คํ
์ ํฌ๊ธฐ๋ฅผ ๋งํ๋ฉฐ ํ์ต ์๋๋ฅผ ๊ฒฐ์ ํ๋ค. ํ๋ฅ ์ ๊ฒฝ์ฌ ํ๊ฐ๋ฒ์ ์ง์ ๋ ํ์ต๋ฅ ์ ์ฌ์ฉํ๋ ์๊ณ ๋ฆฌ์ฆ์ด๊ธฐ ๋๋ฌธ์ ๊ฒฝํ์ ์ผ๋ก ํ์ต๋ฅ ์ ์กฐ์ ํ ์๋ฐ์ ์์ผ๋ฉฐ, ์ด๋ ํจ์จ์ ์ด์ง ์๊ณ ์ต์ ์ ํ์ต๋ฅ ์ ์ ํ๊ธฐ ์ด๋ ต๋ค. ๋ํ ํ์ต๋ฅ ์ด ๊ณ ์ ๋์ด ์๊ธฐ ๋๋ฌธ์ ์ต์ ํ๊ฐ ๋นํจ์จ์ ์ผ๋ก ์งํ๋๋ค. ํ์ต๋ฅ ์ด ๋ณํํ ์ ์๋ค๋ฉด ์ฒ์์๋ ํฐ ํญ์ผ๋ก ์ด๋ํ๋ค๊ฐ ์ต์ ํด์ ๊ฐ๊น์์ง์๋ก ์ด๋ ํญ์ ์ค์ฌ์ ์์ ..
๐ง Deep Learning
์ ๊ฒฝ๋ง ํ์ต์ ์๋ฏธ ์ ๊ฒฝ๋ง์๋ ์
๋ ฅ ๋ฐ์ดํฐ์ ํ๊น ๋ฐ์ดํฐ๊ฐ ์ ๊ณต๋ ๋ฟ, ์ถ๋ก ์ ์ํ ๊ท์น์ ์ ๊ณต๋์ง ์๋๋ค. ์ ๊ฒฝ๋ง์ `ํ์ต(learning)`ํ๋ค๋ ๊ฒ์ ์ด ๊ท์น์ ํ์ต ๋ฐ์ดํฐ๋ฅผ ์ด์ฉํด์ ์ค์ค๋ก ์ฐพ๋ ๊ฒ์ด๋ค. ์ด๋ ํ์ต ๋ฐ์ดํฐ์ ๊ธฐ๋ํ๋ ์ ๋ต์ด ๋ค์ด์๊ธฐ ๋๋ฌธ์ ๊ฐ๋ฅํ๋ค. ์ ๊ฒฝ๋ง์ ์
๋ ฅ ๋ฐ์ดํฐ๊ฐ ๋ค์ด์์ ๋ ์ด๋ค ์ถ๋ ฅ ๋ฐ์ดํฐ๋ฅผ ๋ง๋ค์ด์ผ ํ ์ง๋ฅผ ์ ํ๋ ๊ท์น์ ํจ์์ ๋งคํ ๊ด๊ณ๋ก ํํ๋๋ค. ๊ฐ์ค ํฉ์ฐ๊ณผ ํ์ฑ ํจ์๊ฐ ์ฐ๊ฒฐ๋์ด ๋ด๋ฐ์ ๊ตฌ์ฑํ๊ณ , ๋ด๋ฐ์ด ๋ชจ์ฌ ๊ณ์ธต์ ๊ตฌ์ฑํ๋ฉฐ, ๊ณ์ธต์ด ์์ฌ์ ์ ๊ฒฝ๋ง์ ๊ณ์ธต ๊ตฌ์กฐ๊ฐ ์ ์๋๋ค. ์ด๋ฌํ ๋ณต์กํ ์ ๊ฒฝ๋ง์ ๊ณ์ธต ๊ตฌ์กฐ ์์ฒด๊ฐ ์ ๊ฒฝ๋ง์ ํจ์์ ๋งคํ ๊ด๊ณ๋ฅผ ํํํ๋ ๊ฒ์ด๋ค. ์ ๊ฒฝ๋ง์ ํ์ต ๊ณผ์ ์์ ํจ์์ ๋งคํ ๊ด๊ณ๋ฅผ ํํํ๋ ์ ์ฒด ๊ณ์ธต ๊ตฌ์กฐ๋ฅผ ์ฐพ์์ผ ํ๋ ๊ฒ์ ์๋๋ค. ์ ๊ฒฝ๋ง์ ..
๐ง Deep Learning
์ ๊ฒฝ๋ง ํ์ต์์ ๊ฐ์ค์น ๋งค๊ฐ๋ณ์์ ๋ํ ์์ค ํจ์์ ๊ธฐ์ธ๊ธฐ๋ ์์น ๋ฏธ๋ถ์ ์ฌ์ฉํด ๊ณ์ฐํ๋ค. ์์น ๋ฏธ๋ถ์ ๋จ์ํ๊ณ ๊ตฌํํ๊ธฐ๋ ์ฝ์ง๋ง ๊ณ์ฐ ์๊ฐ์ด ์ค๋ ๊ฑธ๋ฆฐ๋ค๋ ๋จ์ ์ด ์๋ค. ์ด์ ๋นํด `์ค์ฐจ์ญ์ ํ๋ฒ(backpropagation)`์ ๊ฐ์ค์น ๋งค๊ฐ๋ณ์์ ๊ธฐ์ธ๊ธฐ๋ฅผ ํจ์จ์ ์ผ๋ก ๊ณ์ฐํ๋ค. ๊ณ์ฐ ๊ทธ๋ํ `๊ณ์ฐ ๊ทธ๋ํ(computational graph)`๋ ๊ณ์ฐ ๊ณผ์ ์ ๊ทธ๋ํ๋ก ๋ํ๋ธ ๊ฒ์ด๋ค. ์ด๋ ๋ณต์์ `๋
ธ๋(node)`์ ์์ง(edge)`๋ก ํํ๋๋ฉฐ, ๋
ธ๋ ์ฌ์ด์ ์ง์ ์ ์์ง๋ผ๊ณ ํ๋ค. ๊ณ์ฐ ๊ทธ๋ํ์ ๋ฌธ์ ํ์ด๋ ๋ค์๊ณผ ๊ฐ์ ํ๋ฆ์ผ๋ก ์งํ๋๋ค. ๊ณ์ฐ ๊ทธ๋ํ๋ฅผ ๊ตฌ์ฑํ๋ค. ๊ทธ๋ํ์์ ๊ณ์ฐ์ ์ผ์ชฝ์์ ์ค๋ฅธ์ชฝ์ผ๋ก ์งํํ๋ค. ์ฌ๊ธฐ์ 2๋ฒ์งธ ๋จ๊ณ์ธ ๊ทธ๋ํ์์ ๊ณ์ฐ์ ์ผ์ชฝ์์ ์ค๋ฅธ์ชฝ์ผ๋ก ์งํํ๋ ๋จ๊ณ๋ฅผ `์์ ํ(forward..