Backpropagation
์ ์ฒด ํจ์์ ๊ฐ ๋ณ์๋ค์ด ๋ฏธ์น๋ ์ํฅ ๋ฅผ ๊ตฌํ๊ธฐ ์ํด์ ํจ์๋ฅผ ๊ตฌ์ฑํ๋ ์ฐ์ฐ๋ค์ ์ชผ๊ฐ Computational Graph๋ฅผ ๊ณ์ฐํ๊ณ , ๊ฐ๊ฐ์ ์ฐ์ฐ๋ง๋ค Local Gradient๋ฅผ ๊ตฌํด Chain-Rule์ ์ด์ฉํด Gradient๋ฅผ ๊ณ์ฐํ๋ ๊ธฐ๋ฒ.
Sigmoid Gate
Computational Graph์ ๊ฐ Node๋ ์ ์ํ๊ธฐ ๋๋ฆ. ์๋ฅผ ๋ค์ด Sigmoidํจ์ ์์ฒด๋ฅผ Node๋ก ์ ์ํ๋ฉด, Sigmoid ํจ์์ ๋ฏธ๋ถ์ ์ด์ฉํด ๊ณ์ฐํ ์ ์๋ค.
Patterns in Backward Flow
โข
ADD ๊ฒ์ดํธ : Gradient๋ฅผ ๊ทธ๋๋ก ์ ๋ฌ (Gradient Distributor)
โข
MAX ๊ฒ์ดํธ : ํฐ ๊ฐ์๊ฒ Gradient๋ฅผ ์ ๋ฌํ๊ณ ์์ ๊ฐ์๊ฒ๋ 0์ ์ ๋ฌ (Gradient Router)
โข
MUL ๊ฒ์ดํธ : Gradient ๊ตํ (Gradient Switcher)
Backpropagation in Vectors
๊ฐ ๋ณ์๊ฐ ๋ฒกํฐ์ธ ๊ฒฝ์ฐ ๊ฐ ๊ฒ์ดํธ์ Gradient๋ Jacobian Matrix๋ก ํํ๋๋ค.
์ฐจ์ ๋ฒกํฐ๊ฐ ์
๋ ฅ์ด๋ฉด Jacobian Matrix๋ ์ฐจ์์ด ๋๋ค. ํ์ง๋ง ๊ทธ๋ ๊ฒ ๊ณ์ฐํ๋ฉด ๋๋ฌด ๋ง์ ์ฐ์ฐ๋์ด ํ์ํ๋ค.
ํ์ง๋ง, Backpropagation์์ ํ๋์ ๋ณ์๋ ์ค์ง ํ๋์ ์ถ๋ ฅ์๋ง ์ํฅ์ ๋ฏธ์น๋ฏ๋ก Jacobian Matrix๋ Diagonal Matrix๊ฐ ๋๋ค.
Jacobian Matrix
๋ค๋ณ์ ๋ฒกํฐ ํจ์์ 1๊ณ๋ ํธ๋ฏธ๋ถ
๋ค๋ณ์ ๋ฒกํฐ ํจ์
Neural Networks
๋น์ ํ์ ๋ณต์กํ ํจ์๋ฅผ ๋ง๋ค๊ธฐ ์ํด ๊ฐ๋จํ ํจ์๋ค์ ์์์ฌ๋ฆฐ ํจ์๋ค์ Class