๋ณธ๋ฌธ ๋ฐ”๋กœ๊ฐ€๊ธฐ
๐Ÿง‘โ€๐ŸŽ“Machine Learning

NLP (์ž์—ฐ์–ด ์ฒ˜๋ฆฌ) ๋ž€?

by veryberries 2024. 5. 5.

NLP (๋˜๋Š” ์ž์—ฐ์–ด ์ฒ˜๋ฆฌ) ๋Š” 2016๋…„ ์ฏค ์ฑ—๋ด‡์ด ์„ฑํ–‰ํ•˜๋ฉด์„œ๋ถ€ํ„ฐ ๋งŽ์€ ๊ด€์‹ฌ์„ ๋Œ์—ˆ๋˜ ํ‚ค์›Œ๋“œ์˜€๋‹ค. 

 

๋‹ค์†Œ ์˜ค๋ž˜๋œ ๋“ฏํ•œ ์ด ํ‚ค์›Œ๋“œ๋ฅผ ๋‹ค์‹œ ๊บผ๋‚ด๋Š” ์ด์œ ๋Š”, LLM (Large Language Model) ๊ธฐ์ˆ ์ด ๋น ๋ฅด๊ฒŒ ๋ฐœ์ „ํ•˜๋ฉด์„œ NLP ์— ๋Œ€ํ•ด ๋‹ค์‹œ ์ฒ˜์Œ๋ถ€ํ„ฐ ์ดํ•ดํ•˜๊ณ ์ž ํ•จ์ด๋‹ค. 

 

NLP (= ์ž์—ฐ์–ด์ฒ˜๋ฆฌ) ๋Š”, ๋จธ์‹ ๋Ÿฌ๋‹ ๊ธฐ๋ฐ˜์œผ๋กœ ์ธ๊ฐ„์˜ ์–ธ์–ด๋ฅผ ์ปดํ“จํ„ฐ๊ฐ€ ์ž˜ ์ดํ•ดํ•˜๋„๋ก ํ•˜๊ณ ์ž ํ•˜๋Š” ์–ธ์–ดํ•™์˜ ์˜์—ญ ์ค‘ ํ•˜๋‚˜์ด๋‹ค. 

์—ฌ๊ธฐ์„œ ์ค‘์š”ํ•œ ๊ฒƒ์€, ๋‹จ์–ด ์ž์ฒด์˜ ๋œป์„ ์ดํ•ดํ•˜๋Š” ๊ฒƒ์—์„œ ๊ทธ์น˜์ง€ ์•Š๊ณ , ๋‹จ์–ด์™€ ๋ฌธ์žฅ ๊ฐ„์˜ ๋ฌธ๋งฅ ๊ทธ ํ–‰๊ฐ„์˜ ์˜๋„๋ฅผ ์ดํ•ดํ•˜๋„๋ก ํ•˜๋Š” ๊ฒƒ์ด ํ•ต์‹ฌ์ด๋‹ค. (๋ฌธ๋งฅ!)

 

๋Œ€ํ‘œ์ ์ธ NLP Task ๋Š”:

  • ๋ถ„๋ฅ˜ (Classification) 
    • ์ „์ฒด ๋ฌธ์žฅ ๊ฐ„ ๋ถ„๋ฅ˜ : ๋ฆฌ๋ทฐ์˜ ๊ธ์ •/๋ถ€์ • ์—ฌ๋ถ€, ์ด๋ฉ”์ผ์ด ์ŠคํŒธ์ธ์ง€, ๋‘ ๋ฌด์žฅ ๊ฐ„์˜ ์—ฐ๊ด€์„ฑ์ด ์–ผ๋งˆ๋‚˜ ๋†’์€์ง€
    • ๋ฌธ์žฅ ๋‚ด ๋‹จ์–ด๋“ค์„ ๋ถ„๋ฅ˜ : ํ•œ ๋ฌธ์žฅ ๋‚ด์—์„œ์˜ ๋ฌธ๋ฒ•์ ์ธ ๊ตฌ์„ฑ ์š”์†Œ๋ฅผ ๊ตฌ๋ถ„ํ•˜๊ฑฐ๋‚˜ (๋ช…์‚ฌ, ๋ถ€์‚ฌ, ๋™์‚ฌ ๋“ฑ), ์—”ํ‹ฐํ‹ฐ ๊ตฌ๋ถ„ (์žฅ์†Œ, ์‚ฌ๋žŒ, ์‚ฌ๋ฌผ ๋“ฑ)
  • ์ƒ์„ฑ (Generation)
    • ์ƒˆ๋กœ์šด ํ…์ŠคํŠธ๋ฅผ ์ƒ์„ฑ - ํ”„๋กฌํ”„ํŠธ๋ฅผ ์‚ฌ์šฉํ•ด์„œ ํ…์ŠคํŠธ๋ฅผ ์ž๋™์ƒ์„ฑํ•˜๊ฑฐ๋‚˜, masking ๋œ ๋‹จ์–ด๋ฅผ ๊ฐ€์ง€๊ณ  ๋นˆ์นธ์˜ ๋‹จ์–ด ์ฑ„์šฐ๊ธฐ
    • ์ž…๋ ฅ ํ…์ŠคํŠธ๋กœ๋ถ€ํ„ฐ ์ƒˆ๋กœ์šด ๋ฌธ์žฅ ์ƒ์„ฑํ•˜๊ธฐ - ์ž…๋ ฅ ํ…์ŠคํŠธ๋ฅผ ์š”์•ฝํ•˜๊ฑฐ๋‚˜ ๋ฒˆ์—ญ
  • ์œ ์ถ”/์ถ”์ถœ (Extract)
    • ํ…์ŠคํŠธ๋กœ๋ถ€ํ„ฐ ๋‹ต๋ณ€ ์ถ”์ถœํ•˜๊ธฐ - ๋ฌธ๋งฅ๊ณผ ์งˆ๋ฌธ์ด ํ•จ๊ป˜ ์ฃผ์–ด์กŒ์„ ๋•Œ, ๋ฌธ๋งฅ์„ ๊ธฐ๋ฐ˜์œผ๋กœ ์งˆ๋ฌธ์— ๋Œ€ํ•ด ์‘๋‹ตํ•˜๊ธฐ 

 

NLP ๊ฐ€ ๊ทธ๋™์•ˆ ๋งŽ์ด ๋ฐœ์ „ํ•ด์™”๊ณ , ๋ฒˆ์—ญ ๋“ฑ ์–ด๋А ์ •๋„์˜ Task ๋Š” ์ž˜ ์ˆ˜ํ–‰ํ•˜๋Š” ๊ฒƒ ๊ฐ™์€๋ฐ ์™œ NLP ๊ฐ€ ์–ด๋ ต๋‹ค๊ณ  ํ•˜๋Š” ๊ฒƒ์ผ๊นŒ? 

์ž์—ฐ์–ด ์ฒ˜๋ฆฌ๊ฐ€ ์–ด๋ ค์šด ์ด์œ ๋Š”, ์ปดํ“จํ„ฐ๊ฐ€ ํ…์ŠคํŠธ๋ฅผ ์ธ์‹ํ•˜๊ณ  ์ฒ˜๋ฆฌํ•˜๋Š” ๋ฐฉ์‹์ด ์ธ๊ฐ„์˜ ์ฒ˜๋ฆฌ๋ฐฉ์‹๊ณผ๋Š” ๋‹ค๋ฅด๊ธฐ ๋•Œ๋ฌธ์ด๋‹ค. ์˜ˆ๋ฅผ ๋“ค์–ด, ์‚ฌ๋žŒ์€ "์ง‘์— ๊ฐ€๊ณ  ์‹ถ๋‹ค" ๋Š” ๋ฌธ์žฅ์„ ๋ณด๋ฉด, ์ด ๋ฌธ์žฅ์˜ ์ •์ ์ธ ๋œป์„ ๋„˜์–ด ๊ทธ ๋ฌธ์žฅ์— ๋‹ด๊ธด "์˜๋ฏธ" ์™€ "์˜๋„" ๋ฅผ ์‰ฝ๊ฒŒ ํŒŒ์•…ํ•  ์ˆ˜ ์žˆ๋‹ค. ์ง‘์ด ๋„ˆ๋ฌด ์ข‹์•„์„œ ์ง‘์ด ๊ทธ๋ฆฝ๋‹ค๋Š” ๊ฒƒ์ธ์ง€, ์•„๋‹ˆ๋ฉด ์ง€๊ธˆ ์ด ์ƒํ™ฉ์ด ์ง€๋ฃจํ•ด์„œ ์—ฌ๊ธธ ์–ผ๋ฅธ ๋– ๋‚˜๊ณ  ์‹ถ๋‹ค๋Š” ์˜๋ฏธ์ธ์ง€ ๋ง์ด๋‹ค. ํ•˜์ง€๋งŒ ์ปดํ“จํ„ฐ๋Š” "์ง‘์— ๊ฐ€๊ณ  ์‹ถ๋‹ค" ๋Š” ๋ฌธ์žฅ์„ ๋‹จ์ˆœํžˆ ์ปดํ“จํ„ฐ๊ฐ€ ์ดํ•ดํ•  ์ˆ˜ ์žˆ๋„๋ก ํ…์ŠคํŠธ๋ฅผ ๋ฒกํ„ฐ, ๊ทธ๋ฆฌ๊ณ  ๋น„ํŠธ๋กœ ์ดํ•ดํ•˜๊ธฐ ๋•Œ๋ฌธ์—, ์ด ๋ฌธ์žฅ ๋„˜์–ด์— ์žˆ๋Š” ์˜๋„๋‚˜ ํ–‰๊ฐ„์˜ ์˜๋ฏธ๋ฅผ ์ธ์ง€ํ•˜๋„๋ก ํ•˜๊ธด ์‰ฝ์ง€ ์•Š๋‹ค. 

 

์ด ๋ถ€๋ถ„์„ ๋”์šฑ ํ–ฅ์ƒ์‹œํ‚ค๊ธฐ ์œ„ํ•ด ์šฐ๋ฆฌ๋Š” ๋จธ์‹ ๋Ÿฌ๋‹ ๋ชจ๋ธ์„ ์‚ฌ์šฉํ•˜์—ฌ ์ปดํ“จํ„ฐ๊ฐ€ ์ธ๊ฐ„๊ณผ ๊ฐ™์ด ํ…์ŠคํŠธ๋ฅผ ์ดํ•ดํ•˜๊ณ  ์‚ฌ๊ณ ํ•˜๊ณ  ์ฒ˜๋ฆฌํ•  ์ˆ˜ ์žˆ๋„๋ก, ๋ชจ๋ธ์„ ๋‹ค์–‘ํ•œ ๋ฐ์ดํ„ฐ๋ฅผ ํ™œ์šฉํ•ด ํ•™์Šต์‹œํ‚จ๋‹ค. ์ด๋Ÿฐ ์˜๋ฏธ์—์„œ, ๋” ๋งŽ์€ ๋ฌธ๋งฅ์„ ์ดํ•ด์‹œํ‚ค๋„๋ก ๊ฑฐ๋Œ€ํ•œ ์ธํ”„๋ผ๋ฅผ ๊ธฐ๋ฐ˜์œผ๋กœ ๋‹ค๋Ÿ‰์˜ ๋ฐ์ดํ„ฐ๋ฅผ ํ•™์Šต์‹œํ‚ค๋Š” pretrained model ์˜ ์ค‘์š”์„ฑ์ด ๋†’์•„์ง€๊ณ  ์žˆ๊ณ , ํ…์ŠคํŠธ๋ฅผ ๋ชจ๋ธ์˜ ์–ธ์–ด๋กœ ๋ณ€ํ™˜ํ•  ๋•Œ์—๋„ ๋ฌธ์žฅ์˜ ๋ฌธ๋งฅ์„ ์ž˜ ๋‹ด์•„์„œ ๋ณ€ํ™˜ํ•  ์ˆ˜ ์žˆ๋„๋ก ํ•˜๋Š” ์ž„๋ฒ ๋”ฉ ๊ธฐ์ˆ  ๋˜ํ•œ NLP ์˜์—ญ์— ์žˆ์–ด ๋งค์šฐ ์ค‘์š”ํ•œ ์š”์†Œ๊ฐ€ ๋˜๋Š” ๊ฒƒ์ด๋‹ค. 

 

NLP๊ฐ€ ์–ผ๋งˆ๋‚˜ ์–ด๋ ค์šด๊ฐ€๋ฅผ ๋ฐ˜์ถ”ํ•ด๋ณด๋ฉด, ์šฐ๋ฆฌ ์ธ๊ฐ„์ด ์‚ฌ๊ณ ํ•˜๋Š” ๊ฒƒ์ด ์–ผ๋งˆ๋‚˜ ์œ„๋Œ€ํ•œ ๊ฒƒ์ธ๊ฐ€ ์ƒ๊ฐํ•ด๋ณด๊ฒŒ ๋œ๋‹ค. 

์–ธ์–ด๋ฅผ ํ†ตํ•ด ์šฐ๋ฆฌ์˜ ์ƒ๊ฐ๊ณผ ์˜๋„๋ฅผ ์ ์ ˆํžˆ ํ‘œํ˜„ํ•ด๋‚ด๊ณ , ๊ทธ ํ‘œํ˜„์„ ์ƒ๋Œ€๋ฐฉ์ด ์ž˜ ์ฝ์–ด๋‚ด์–ด ์˜์‚ฌ์†Œํ†ตํ•œ๋‹ค๋Š” ๊ฒƒ, ์ฐธ ์œ„๋Œ€ํ•œ ์ผ์ด ์•„๋‹ ์ˆ˜ ์—†๋‹ค. 

 

์•ž์œผ๋กœ NLP ์™€ ๊ด€๋ จ๋œ ๋จธ์‹ ๋Ÿฌ๋‹์˜ ์—ฌ๋Ÿฌ ์š”์†Œ๋“ค์„ ์ฐจ๊ทผ์ฐจ๊ทผ ์•Œ์•„๋ณผ ์˜ˆ์ •์ด๋‹ค.

 

 

'๐Ÿง‘โ€๐ŸŽ“Machine Learning' ์นดํ…Œ๊ณ ๋ฆฌ์˜ ๋‹ค๋ฅธ ๊ธ€

[Hugging Face NLP Course] #1 Transformer Models  (38) 2024.05.12