-๋จธ์ ๋ฌ๋์ ๊ธฐ์ด ๊น์ด ์์๋ณด๊ธฐ-
ย [์ถ์ฒ] Ms Learn (Fundamentals of machine learning))
๐์กฐ๊ธ๋ ๊น๊ฒ ์์๋ณด๋ ๋จธ์ ๋ฌ๋ (Machine Learning)
๋จธ์ ๋ฌ๋์ ํต๊ณ์ ๋ฐ์ดํฐ์ ์ํ์ ๋ชจ๋ธ๋ง์ ๊ทธ ๊ธฐ์์ ๋๊ณ ์์ต๋๋ค. ๋จธ์ ๋ฌ๋์ ๊ธฐ๋ณธ ์์ด๋์ด๋ ๊ณผ๊ฑฐ ๊ด์ฐฐ์์ ์ป์ ๋ฐ์ดํฐ๋ฅผ ์ฌ์ฉํ์ฌ ์๋ ค์ง์ง ์์ ๊ฒฐ๊ณผ๋ ๊ฐ์ ์์ธกํ๋ ๊ฒ์ ๋๋ค.ย
๐ ์์ด์คํฌ๋ฆผ ๊ฐ๊ฒ ์ฃผ์ธ์ ๊ณผ๊ฑฐ ๋งค์ถ๊ณผ ๋ ์จ ๊ธฐ๋ก์ ๊ฒฐํฉํ์ฌ ์ผ๊ธฐ ์๋ณด๋ฅผ ๊ธฐ๋ฐ์ผ๋ก ํน์ ๋ ์ง์ ์ผ๋ง๋ ๋ง์ ์์ด์คํฌ๋ฆผ์ ํ๋งคํ ์ง ์์ธกํ๋ ์ฑ์ ์ฌ์ฉํ ์ ์์ต๋๋ค.
๐ ์์ฌ๋ ๊ณผ๊ฑฐ ํ์์ ์์ ๋ฐ์ดํฐ๋ฅผ ์ฌ์ฉํ์ฌ ์ฒด์ค, ํ๋น ์์ค ๋ฐ ๊ธฐํ ์ธก์ ๊ณผ ๊ฐ์ ์์ธ์ ๊ธฐ๋ฐ์ผ๋ก ์๋ก์ด ํ์๊ฐ ๋น๋จ๋ณ์ ๊ฑธ๋ฆด ์ํ์ด ์๋์ง ์ฌ๋ถ๋ฅผ ์์ธกํ๋ ์๋ํ๋ ํ ์คํธ๋ฅผ ์คํํ ์ ์์ต๋๋ค.
๐ ๋จ๊ทน์ ์ฐ๊ตฌ์๋ ๊ณผ๊ฑฐ ๊ด์ฐฐ์ ํตํด ์์ ์ค๋ฆฌ๋ฐ, ๋ถ๋ฆฌ ๋ฐ ๊ธฐํ ๋ฌผ๋ฆฌ์ ํน์ฑ ์ธก์ ์ ๊ธฐ๋ฐ์ผ๋ก ๋ค์ํ ํญ๊ท ์ข (์: Adelie , Gentoo ๋๋ Chinstrap )์ ์๋์ผ๋ก ์๋ณํ ์ ์์ต๋๋ค.
๐ ๋จธ์ ๋ฌ๋ ํจ์๋ก ์ดํดํ๊ธฐ(Machine learning as a funcion)
๊ธฐ๊ณ ํ์ต์ ์ํ๊ณผ ํต๊ณํ์ ๊ธฐ๋ฐ์ ๋๊ณ ์๊ธฐ ๋๋ฌธ์ ๊ธฐ๊ณ ํ์ต ๋ชจ๋ธ์ ์ํ์ ์ผ๋ก ์๊ฐํ๋ ๊ฒ์ด ์ผ๋ฐ์ ์ ๋๋ค. ๊ธฐ๋ณธ์ ์ผ๋ก ๊ธฐ๊ณ ํ์ต ๋ชจ๋ธ์ ํ๋ ์ด์์ ์ ๋ ฅ๊ฐ์ ๋ฐํ์ผ๋ก ์ถ๋ ฅ๊ฐ์ ๊ณ์ฐํ๋ ํจ์๋ฅผ ์บก์ํํ ์ํํธ์จ์ด ์ ํ๋ฆฌ์ผ์ด์ ์ ๋๋ค. ์ด ํจ์๋ฅผ ์ ์ํ๋ ๊ณผ์ ์ 'ํ๋ จ(training)'์ด๋ผ๊ณ ํฉ๋๋ค. ํจ์๊ฐ ์ ์๋ ํ์๋ ์๋ก์ด ๊ฐ์ ์์ธกํ๋ ๋ฐ ์ฌ์ฉํ ์ ์๋๋ฐ, ์ด ๊ณผ์ ์ '์ถ๋ก (inferencing)'์ด๋ผ๊ณ ํฉ๋๋ค. ํ๋ จ๊ณผ ์ถ๋ก ์ ๊ด๋ จ๋ ๋จ๊ณ๋ฅผ ์ดํด๋ณด๊ฒ ์ต๋๋ค.
๊ธฐ๊ณ ํ์ต ๋ชจ๋ธ์ ํ๋ จ์ํค๊ธฐ ์ํด์๋ ๋จผ์ ๋ฐ์ดํฐ๊ฐ ํ์ํฉ๋๋ค. ์ด ๋ฐ์ดํฐ๋ ๋ชจ๋ธ์ด ํ์ตํ ์ ์๋๋ก ํ์ํ ์ ๋ณด๋ค์ ํฌํจํ๊ณ ์์ด์ผ ํฉ๋๋ค. ์๋ฅผ ๋ค์ด, ๊ณ ์์ด์ ๊ฐ๋ฅผ ๊ตฌ๋ถํ๋ ๋ชจ๋ธ์ ๋ง๋ค๊ธฐ ์ํด์๋ ๊ณ ์์ด์ ๊ฐ์ ์ด๋ฏธ์ง ๋ฐ์ดํฐ๊ฐ ํ์ํฉ๋๋ค.
์์งํ ๋ฐ์ดํฐ๋ ์ข ์ข ๋ถ์์ ํ๊ฑฐ๋, ๋ถ์ ํํ๊ฑฐ๋, ํน์ ๋ชจ๋ธ์ด ํ์ตํ๊ธฐ ์ด๋ ค์ด ํ์์ผ ์ ์์ต๋๋ค. ๋ฐ๋ผ์ ๋ฐ์ดํฐ๋ฅผ ์ ๋ฆฌํ๊ณ , ์ ๊ทํ(normalization)ํ๊ฑฐ๋, ๊ฒฐ์ธก๊ฐ์ ์ฒ๋ฆฌํ๋ ๋ฑ์ ์ ์ฒ๋ฆฌ ๊ณผ์ ์ ๊ฑฐ์นฉ๋๋ค.
๊ธฐ๊ณ ํ์ต ๋ชจ๋ธ์๋ ๋ค์ํ ์ข ๋ฅ๊ฐ ์์ต๋๋ค. ์๋ฅผ ๋ค์ด, ์ ํ ํ๊ท(linear regression), ๊ฒฐ์ ํธ๋ฆฌ(decision tree), ์ ๊ฒฝ๋ง(neural network) ๋ฑ์ด ์์ต๋๋ค. ํด๊ฒฐํ๋ ค๋ ๋ฌธ์ ์ ์ ํ๊ณผ ๋ฐ์ดํฐ์ ํน์ฑ์ ๋ง๋ ๋ชจ๋ธ์ ์ ํํ๋ ๊ฒ์ด ์ค์ํฉ๋๋ค.
ํ๋ จ ๊ณผ์ ์์๋ ์ ๋ ฅ ๋ฐ์ดํฐ์ ๊ทธ์ ํด๋นํ๋ ์ถ๋ ฅ๊ฐ์ ์ฌ์ฉํ์ฌ ๋ชจ๋ธ์ ํ์ต์ํต๋๋ค. ๋ชจ๋ธ์ ์ ๋ ฅ๊ฐ๊ณผ ์ถ๋ ฅ๊ฐ ๊ฐ์ ๊ด๊ณ๋ฅผ ํ์ตํ๊ฒ ๋ฉ๋๋ค. ์ด ๊ณผ์ ์์ ์์ค ํจ์(loss function)๋ฅผ ์ต์ํํ๊ธฐ ์ํด ๋ชจ๋ธ์ ๋งค๊ฐ๋ณ์(parameters)๊ฐ ์กฐ์ ๋ฉ๋๋ค.
ํ๋ จ๋ ๋ชจ๋ธ์ด ์ ์๋ํ๋์ง ํ์ธํ๊ธฐ ์ํด ํ ์คํธ ๋ฐ์ดํฐ๋ฅผ ์ฌ์ฉํ์ฌ ํ๊ฐํฉ๋๋ค. ํ ์คํธ ๋ฐ์ดํฐ๋ ํ๋ จ์ ์ฌ์ฉ๋์ง ์์ ์๋ก์ด ๋ฐ์ดํฐ๋ก, ๋ชจ๋ธ์ ์ฑ๋ฅ์ ํ๊ฐํ๋ ๋ฐ ์ฌ์ฉ๋ฉ๋๋ค. ์ด ๋จ๊ณ์์ ๋ชจ๋ธ์ ์ ํ๋(accuracy), ์ ๋ฐ๋(precision), ์ฌํ์จ(recall) ๋ฑ์ ์งํ๋ฅผ ์ธก์ ํฉ๋๋ค.
๋ชจ๋ธ์ ์ฑ๋ฅ์ ๊ฐ์ ํ๊ธฐ ์ํด ํ์ดํผํ๋ผ๋ฏธํฐ(hyperparameters)๋ฅผ ์กฐ์ ํ๊ฑฐ๋, ๋ ๋ง์ ๋ฐ์ดํฐ๋ฅผ ์์งํ์ฌ ๋ค์ ํ๋ จ์ํค๋ ๋ฑ์ ๊ณผ์ ์ ๊ฑฐ์น ์ ์์ต๋๋ค. ์ด๋ฅผ ํตํด ๋ชจ๋ธ์ด ๋ ๋์ ์ฑ๋ฅ์ ๋ฐํํ ์ ์๋๋ก ์ต์ ํํฉ๋๋ค.
๋ชจ๋ธ์ด ์ถฉ๋ถํ ํ๋ จ๋๊ณ ํ๊ฐ๋๋ฉด, ์ด์ ์๋ก์ด ๋ฐ์ดํฐ๋ฅผ ์ ๋ ฅํ์ฌ ์์ธก๊ฐ์ ์์ฑํ ์ ์์ต๋๋ค. ์ด ๊ณผ์ ์ ์ถ๋ก ์ด๋ผ๊ณ ํ๋ฉฐ, ์ค์ํ์ ๋ค์ํ ์์ฉ ํ๋ก๊ทธ๋จ์์ ์ฌ์ฉ๋ฉ๋๋ค. ์๋ฅผ ๋ค์ด, ์ด๋ฉ์ผ ์คํธ ํํฐ๋ง, ์ด๋ฏธ์ง ์ธ์, ์์ฑ ์ธ์ ๋ฑ์์ ํ์ฉ๋ฉ๋๋ค.
์ด์ ๊ฐ์ด ๊ธฐ๊ณ ํ์ต ๋ชจ๋ธ์ ํ๋ จ๊ณผ ์ถ๋ก ๊ณผ์ ์ ๋ฐ์ดํฐ๋ฅผ ์์งํ๊ณ , ์ ์ฒ๋ฆฌํ๋ฉฐ, ์ ์ ํ ๋ชจ๋ธ์ ์ ํํ์ฌ ํ์ต์ํค๊ณ , ํ๊ฐ ๋ฐ ์ต์ ํ๋ฅผ ๊ฑฐ์ณ ์ต์ข ์ ์ผ๋ก ์๋ก์ด ๋ฐ์ดํฐ๋ฅผ ์์ธกํ๋ ์ผ๋ จ์ ๋จ๊ณ๋ฅผ ํฌํจํฉ๋๋ค. ์ด๋ฅผ ํตํด ์ฐ๋ฆฌ๋ ๋ค์ํ ๋ฌธ์ ๋ฅผ ํด๊ฒฐํ๊ณ , ๋ ๋์ ์์ฌ ๊ฒฐ์ ์ ๋ด๋ฆด ์ ์์ต๋๋ค.
์ด์ ๋จธ์ ๋ฌ๋์ ์ํ์ ํจ์๋ก ๊ณ์ฐํ์ฌ ์ถ๋ก ๋๋ ๊ณผ์ ์ ์ดํดํด ๋ด ์๋ค.
โ ํ๋ จ ๋ฐ์ดํฐ๋ ๊ณผ๊ฑฐ์ ๊ด์ธก์น๋ก ๊ตฌ์ฑ๋ฉ๋๋ค. ๋๋ถ๋ถ์ ๊ฒฝ์ฐ, ๊ด์ธก์น์๋ ๊ด์ฐฐ ๋์์ ์์ฑ์ด๋ ํน์ง์ด ํฌํจ๋์ด ์์ผ๋ฉฐ, ๋ชจ๋ธ์ ํ๋ จ์ํค๊ธฐ ์ํด ์์ธกํ๊ณ ์ ํ๋ ๊ฐ(๋ ์ด๋ธ์ด๋ผ๊ณ ํจ)์ด ํฌํจ๋ฉ๋๋ค. ์ํ์ ์ผ๋ก, ํน์ง์ ์ข ์ข x๋ผ๋ ๋ณ์ ์ด๋ฆ์ผ๋ก ์ถ์ฝ๋๊ณ , ๋ ์ด๋ธ์ y๋ก ์ถ์ฝ๋ฉ๋๋ค. ๋ณดํต ๊ด์ธก์น๋ ์ฌ๋ฌ ํน์ง ๊ฐ์ผ๋ก ๊ตฌ์ฑ๋๋ฏ๋ก, x๋ ์ค์ ๋ก [x1, x2, x3, ...]์ ๊ฐ์ ๋ฒกํฐ(์ฌ๋ฌ ๊ฐ์ด ํฌํจ๋ ๋ฐฐ์ด)์ ๋๋ค.
๐ ์์ด์คํฌ๋ฆผ ํ๋งค ์๋๋ฆฌ์ค
๋ชฉํ: ๋ ์จ์ ๋ฐ๋ผ ์์ด์คํฌ๋ฆผ ํ๋งค๋์ ์์ธกํ๋ ๋ชจ๋ธ์ ํ๋ จ.
ํน์ง(x): ํ๋ฃจ ๋์์ ๋ ์จ ์ธก์ ๊ฐ(์จ๋, ๊ฐ์๋, ํ์ ๋ฑ).
๋ ์ด๋ธ(y): ๊ฐ ๋ ์ ์์ด์คํฌ๋ฆผ ํ๋งค๋.
๐ ์๋ฃ ์๋๋ฆฌ์ค
๋ชฉํ: ํ์์ ์์ ์ธก์ ๊ฐ์ ๋ฐ๋ผ ๋น๋จ๋ณ ์ํ ์ฌ๋ถ๋ฅผ ์์ธก.
ํน์ง(x): ํ์์ ์ธก์ ๊ฐ(์ฒด์ค, ํ๋น ์์น ๋ฑ).
๋ ์ด๋ธ(y): ๋น๋จ๋ณ ์ํ ์ฌ๋ถ(์: 1์ ์ํ, 0์ ์ํ ์๋).
๐ ๋จ๊ทน ์ฐ๊ตฌ ์๋๋ฆฌ์ค
๋ชฉํ: ํญ๊ท์ ์ ์ฒด ํน์ฑ์ ๋ฐ๋ผ ์ข ์ ์์ธก.
ํน์ง(x): ํญ๊ท์ ์ฃผ์ ์ธก์ ๊ฐ(๋ ๊ฐ์ ๊ธธ์ด, ๋ถ๋ฆฌ์ ๋๋น ๋ฑ).
๋ ์ด๋ธ(y): ์ข (์: 0์ ์๋ธ๋ฆฌ, 1์ ์ ํฌ, 2๋ ํฑ๋ํญ๊ท).
โก ์๊ณ ๋ฆฌ์ฆ์ ํน์ง๊ณผ ๋ ์ด๋ธ ๊ฐ์ ๊ด๊ณ๋ฅผ ๊ฒฐ์ ํ๊ณ , ๊ทธ ๊ด๊ณ๋ฅผ ์ผ๋ฐํํ์ฌ x๋ฅผ ๊ธฐ๋ฐ์ผ๋ก y๋ฅผ ๊ณ์ฐํ๋ ํจ์๋ก ๋ํ๋ ๋๋ค. ์ฌ์ฉ๋๋ ํน์ ์๊ณ ๋ฆฌ์ฆ์ ํด๊ฒฐํ๋ ค๋ ์์ธก ๋ฌธ์ ์ ์ข ๋ฅ์ ๋ฐ๋ผ ๋ค๋ฅด์ง๋ง, ๊ธฐ๋ณธ ์๋ฆฌ๋ ๋ฐ์ดํฐ๋ฅผ ๊ธฐ๋ฐ์ผ๋ก ํน์ง ๊ฐ์ ์ฌ์ฉํ์ฌ ๋ ์ด๋ธ์ ๊ณ์ฐํ๋ ํจ์๋ฅผ ๋ง์ถ๋ ๊ฒ์ ๋๋ค.ย
โข ์๊ณ ๋ฆฌ์ฆ์ ๊ฒฐ๊ณผ๋ ํด๋น ์๊ณ ๋ฆฌ์ฆ์ด ์ ๋ํ ๊ณ์ฐ์ ํจ์๋ก ์บก์ํํ ๋ชจ๋ธ์ ๋๋ค. ์ด๋ฅผ ์ํ์ ํ๊ธฐ๋ฒ์ผ๋ก ๋ํ๋ด๋ฉด ๋ค์๊ณผ ๊ฐ์ต๋๋ค: y=f(x)ย
โฃ ํ๋ จ ๋จ๊ณ๊ฐ ์๋ฃ๋๋ฉด, ํ๋ จ๋ ๋ชจ๋ธ์ ์ถ๋ก ์ ์ฌ์ฉ๋ ์ ์์ต๋๋ค. ๋ชจ๋ธ์ ํ๋ จ ๊ณผ์ ์์ ์์ฑ๋ ํจ์๋ฅผ ์บก์ํํ ์ํํธ์จ์ด ํ๋ก๊ทธ๋จ์ ๋๋ค. ํน์ง ๊ฐ ์ธํธ๋ฅผ ์ ๋ ฅํ๋ฉด, ํด๋น ๋ ์ด๋ธ์ ์์ธก ๊ฐ์ ์ถ๋ ฅ์ผ๋ก ๋ฐ์ ์ ์์ต๋๋ค. ๋ชจ๋ธ์ ์ถ๋ ฅ์ ํจ์์ ์ํด ๊ณ์ฐ๋ ์์ธก ๊ฐ์ด๋ฏ๋ก, ์ข ์ข ์ถ๋ ฅ ๊ฐ์ ๊ด์ฐฐ๋ ๊ฐ์ด ์๋ ์์ธก ๊ฐ์ผ๋ก ๋ํ๋ด๊ธฐ ์ํด ลท (๋ฐ์: "y-hat")๋ก ํ๊ธฐํฉ๋๋ค.ย
๐ ๋จธ์ ๋ฌ๋์ ๋ถ๋ฅ(Multiple type of machine learing)
๐ ์ง๋ํ์ต(Spervised machine learning)
์ง๋ ํ์ต(Supervised Machine Learning)์ ํ๋ จ ๋ฐ์ดํฐ์ ํน์ง ๊ฐ๊ณผ ์๋ ค์ง ๋ ์ด๋ธ ๊ฐ์ด ๋ชจ๋ ํฌํจ๋ ๊ธฐ๊ณ ํ์ต ์๊ณ ๋ฆฌ์ฆ์ ์๋ฏธํฉ๋๋ค. ์ง๋ ํ์ต์ ๊ณผ๊ฑฐ ๊ด์ฐฐ์์ ํน์ง๊ณผ ๋ ์ด๋ธ ๊ฐ์ ๊ด๊ณ๋ฅผ ๊ฒฐ์ ํ์ฌ, ๋ฏธ๋์ ๊ฒฝ์ฐ์ ํน์ง์ ๋ํ ์๋ ค์ง์ง ์์ ๋ ์ด๋ธ์ ์์ธกํ๋ ๋ฐ ์ฌ์ฉ๋ฉ๋๋ค.
1.ํ๊ท(Regression)
ํ๊ท๋ ์ง๋ ํ์ต์ ํ ํํ๋ก, ๋ชจ๋ธ์ด ์์ธกํ๋ ๋ ์ด๋ธ์ด ์์น ๊ฐ์ธ ๊ฒฝ์ฐ๋ฅผ ๋งํฉ๋๋ค. ๊ทธ ์์๋ก,
์จ๋, ๊ฐ์๋, ํ์์ ๊ธฐ์ค์ผ๋ก ํน์ ๋ ์ ํ๋งค๋ ์์ด์คํฌ๋ฆผ์ ์.
ํ๋ฐฉ ํผํธ ํฌ๊ธฐ, ์นจ์ค ์, ์์น์ ์ฌํ๊ฒฝ์ ์ ์งํ๋ฅผ ๊ธฐ์ค์ผ๋ก ํ ๋ถ๋์ฐ์ ํ๋งค ๊ฐ๊ฒฉ.
์์ง ํฌ๊ธฐ, ๋ฌด๊ฒ, ๋๋น, ๋์ด, ๊ธธ์ด๋ฅผ ๊ธฐ์ค์ผ๋ก ํ ์๋์ฐจ์ ์ฐ๋น(๋ง์ผ๋น ๊ฐค๋ฐ).
2.๋ถ๋ฅ(Classification)
๋ถ๋ฅ๋ ์ง๋ ํ์ต์ ํ ํํ๋ก, ๋ ์ด๋ธ์ด ๋ฒ์ฃผ ๋๋ ํด๋์ค๋ฅผ ๋ํ๋ ๋๋ค. ๋ถ๋ฅ์๋ ๋ ๊ฐ์ง ์ผ๋ฐ์ ์ธ ์๋๋ฆฌ์ค๊ฐ ์์ต๋๋ค.
2-1) ์ด์ง ๋ถ๋ฅ(Binary Classification)
์ด์ง ๋ถ๋ฅ์์๋ ๋ ์ด๋ธ์ด ํน์ ํด๋์ค์ ์ธ์คํด์ค์ธ์ง ์ฌ๋ถ๋ฅผ ๊ฒฐ์ ํฉ๋๋ค. ๋ค์ ๋งํด, ์ด์ง ๋ถ๋ฅ ๋ชจ๋ธ์ ๋ ๊ฐ์ง ์ํธ ๋ฐฐํ์ ์ธ ๊ฒฐ๊ณผ ์ค ํ๋๋ฅผ ์์ธกํฉ๋๋ค. ๊ทธ ์์๋ก,
์ฒด์ค, ๋์ด, ํ๋น ์์น ๋ฑ์ ์์ ์งํ๋ฅผ ๊ธฐ์ค์ผ๋ก ํ ํ์์ ๋น๋จ๋ณ ์ํ ์ฌ๋ถ.
์๋, ์ ์ฉ ๊ธฐ๋ก, ๋์ด ๋ฑ์ ์์๋ฅผ ๊ธฐ์ค์ผ๋ก ํ ์ํ ๊ณ ๊ฐ์ ๋์ถ ์ํ ๋ถ์ดํ ์ฌ๋ถ.
์ธ๊ตฌ ํต๊ณ ์์ฑ ๋ฐ ๊ณผ๊ฑฐ ๊ตฌ๋งค๋ฅผ ๊ธฐ์ค์ผ๋ก ํ ์ฐํธ๋ฌผ ๊ณ ๊ฐ์ ๋ง์ผํ ์ ์ ๊ธ์ ์๋ต ์ฌ๋ถ.
์ด ๋ชจ๋ ์์์ ๋ชจ๋ธ์ ๋จ์ผ ๊ฐ๋ฅํ ํด๋์ค์ ๋ํด ์ด์ง ์ฐธ/๊ฑฐ์ง ๋๋ ๊ธ์ /๋ถ์ ์์ธก์ ํฉ๋๋ค.
2-1) ๋ค์ค ํด๋์ค ๋ถ๋ฅ(Multiclass Classification)
๋ค์ค ํด๋์ค ๋ถ๋ฅ๋ ์ด์ง ๋ถ๋ฅ๋ฅผ ํ์ฅํ์ฌ ์ฌ๋ฌ ๊ฐ๋ฅํ ํด๋์ค ์ค ํ๋๋ฅผ ๋ํ๋ด๋ ๋ ์ด๋ธ์ ์์ธกํฉ๋๋ค. ์๋ฅผ ๋ค์ด:
ํญ๊ท์ ์ ์ฒด ์ธก์ ์ ๊ธฐ์ค์ผ๋ก ํ ์ข (์๋ธ๋ฆฌ, ์ ํฌ, ํฑ๋ํญ๊ท).
์ถ์ฐ์ง, ๊ฐ๋ , ์์ฐ์ ๊ธฐ์ค์ผ๋ก ํ ์ํ ์ฅ๋ฅด(์ฝ๋ฏธ๋, ๊ณตํฌ, ๋ก๋งจ์ค, ๋ชจํ, SF).
๋๋ถ๋ถ์ ์๋๋ฆฌ์ค์์ ์ฌ๋ฌ ํด๋์ค๊ฐ ํฌํจ๋ ๊ฒฝ์ฐ ๋ค์ค ํด๋์ค ๋ถ๋ฅ๋ฅผ ์ฌ์ฉํ์ฌ ์ํธ ๋ฐฐํ์ ์ธ ๋ ์ด๋ธ์ ์์ธกํฉ๋๋ค. ์๋ฅผ ๋ค์ด, ํญ๊ท์ ์ ํฌ์ ์๋ธ๋ฆฌ์ผ ์ ์์ต๋๋ค. ํ์ง๋ง, ์ผ๋ถ ์๊ณ ๋ฆฌ์ฆ์ ๋ค์ค ๋ ์ด๋ธ ๋ถ๋ฅ ๋ชจ๋ธ์ ํ๋ จํ๋ ๋ฐ ์ฌ์ฉํ ์ ์์ผ๋ฉฐ, ๋จ์ผ ๊ด์ฐฐ์ ๋ํด ์ฌ๋ฌ ์ ํจํ ๋ ์ด๋ธ์ด ์์ ์ ์์ต๋๋ค. ์๋ฅผ ๋ค์ด, ์ํ๋ SF์ ์ฝ๋ฏธ๋๋ก ๋์์ ๋ถ๋ฅ๋ ์ ์์ต๋๋ค.
๐ ๋น์ง๋ํ์ต(Unsupervised machine learning)
๋น์ง๋ ํ์ต์ ๊ฐ์ฅ ์ผ๋ฐ์ ์ธ ํํ๋ ๊ตฐ์งํ์ ๋๋ค. ๊ตฐ์งํ ์๊ณ ๋ฆฌ์ฆ์ ํน์ง์ ๊ธฐ์ค์ผ๋ก ๊ด์ฐฐ์น ๊ฐ์ ์ ์ฌ์ฑ์ ์๋ณํ๊ณ , ์ด๋ฅผ ๊ฐ๋ณ ๊ตฐ์ง์ผ๋ก ๊ทธ๋ฃนํํฉ๋๋ค. ๊ทธ ์์๋ก,
๊ฝ์ ํฌ๊ธฐ, ์์ ์, ๊ฝ์์ ์๋ฅผ ๊ธฐ์ค์ผ๋ก ์ ์ฌํ ๊ฝ ๊ทธ๋ฃนํ.
์ธ๊ตฌ ํต๊ณ ์์ฑ๊ณผ ๊ตฌ๋งค ํ๋์ ๊ธฐ์ค์ผ๋ก ์ ์ฌํ ๊ณ ๊ฐ ๊ทธ๋ฃน ์๋ณ.
์ด๋ค ๋ฉด์์๋ ๊ตฐ์งํ๊ฐ ๋ค์ค ํด๋์ค ๋ถ๋ฅ์ ์ ์ฌํฉ๋๋ค. ์ฆ, ๊ตฐ์งํ๋ ๊ด์ฐฐ์ ๊ฐ๋ณ ๊ทธ๋ฃน์ผ๋ก ๋ถ๋ฅํฉ๋๋ค. ์ฐจ์ด์ ์ ๋ถ๋ฅ๋ฅผ ์ฌ์ฉํ ๋๋ ํ๋ จ ๋ฐ์ดํฐ์ ๊ด์ฐฐ์ด ์ํ๋ ํด๋์ค๋ฅผ ์ด๋ฏธ ์๊ณ ์์ผ๋ฉฐ, ์๊ณ ๋ฆฌ์ฆ์ ํน์ง๊ณผ ์๋ ค์ง ๋ถ๋ฅ ๋ ์ด๋ธ ๊ฐ์ ๊ด๊ณ๋ฅผ ๊ฒฐ์ ํ๋ค๋ ๊ฒ์ ๋๋ค. ๊ตฐ์งํ์์๋ ์ฌ์ ์๋ ค์ง ๊ตฐ์ง ๋ ์ด๋ธ์ด ์์ผ๋ฉฐ, ์๊ณ ๋ฆฌ์ฆ์ ํน์ง์ ์ ์ฌ์ฑ๋ง์ ๊ธฐ์ค์ผ๋ก ๋ฐ์ดํฐ๋ฅผ ๊ทธ๋ฃนํํฉ๋๋ค.
์ผ๋ถ ๊ฒฝ์ฐ ๊ตฐ์งํ๋ ๋ถ๋ฅ ๋ชจ๋ธ์ ํ๋ จํ๊ธฐ ์ ์ ํด๋์ค ์งํฉ์ ๊ฒฐ์ ํ๋ ๋ฐ ์ฌ์ฉ๋ฉ๋๋ค. ์๋ฅผ ๋ค์ด, ๊ณ ๊ฐ์ ๊ทธ๋ฃน์ผ๋ก ์ธ๋ถํํ๊ณ , ์ด ๊ทธ๋ฃน์ ๋ถ์ํ์ฌ ๋ค์ํ ๊ณ ๊ฐ ํด๋์ค๋ฅผ ์๋ณํ๊ณ ๋ถ๋ฅํ ์ ์์ต๋๋ค(์: ๊ณ ๊ฐ์น-์ ๋, ๋น๋ฒํ ์๋ ๊ตฌ๋งค์ ๋ฑ). ๊ทธ๋ฐ ๋ค์ ์ด๋ฌํ ๋ถ๋ฅ๋ฅผ ์ฌ์ฉํ์ฌ ๊ตฐ์งํ ๊ฒฐ๊ณผ์ ๊ด์ฐฐ์ ๋ ์ด๋ธ์ ์ง์ ํ๊ณ , ์ ๊ณ ๊ฐ์ด ์ํ ์ ์๋ ๊ณ ๊ฐ ๋ฒ์ฃผ๋ฅผ ์์ธกํ๋ ๋ถ๋ฅ ๋ชจ๋ธ์ ํ๋ จํ ์ ์์ต๋๋ค.
'๋น์ ์ ์ด์ผ๊ธฐ๋ฅผ ๋ฃ๊ณ ์ถ์ด์. ๋ฐ๋ชจ์ด์ ํจ๊ป ๋์ด๊ฐ๊ณ ์ถ๋ค๋ฉด superioraj@naver.com ํน์ Learnmore X๋ก ์ฌ๋ฌ๋ถ์ ์ด์ผ๊ธฐ๋ฅผ ๋ค๋ ค์ฃผ์ธ์.'