์ด๋ฏธ์ง€ ๊ตฌํ˜„ AI ํ”Œ๋žซํผ(Platform)/Stable Diffusion

[์Šคํ…Œ์ด๋ธ” ๋””ํ“จ์ „ ์šฉ์–ด์ •๋ฆฌ] Checkpoint, Lora, Embedding(Textual inversion), Hyper Network

๋ชฝ๋ฌผ๊ณ ๊ธฐ๐“†œ 2023. 5. 1. 16:20
728x90
728x90

 

โ… . Checkpoint (Model) ๋ž€? 


์ฒดํฌํฌ์ธํŠธ(Checkpoint )๋Š” ๊ตฌํ˜„๋˜๋Š” ์ด๋ฏธ์ง€์˜ ๋ชจ๋ธ(Model)์ด ๋˜๋Š” ๋ถ€๋ถ„์„ ๋งํ•œ๋‹ค. 

๋‹ค๋ฅด๊ฒŒ ์–˜๊ธฐํ•˜๋ฉด ์ด๋ฏธ์ง€ ์Šคํƒ€์ผ์ด๋ผ๊ณ  ๋ณด๋ฉด ๋œ๋‹ค. 

์ฃผ๋กœ anything, pastelmix, orangemix, caramel, chilloutmix ๋“ฑ ๋‹ค์–‘ํ•œ ๊ณณ์—์„œ ๋ชจ๋ธ ํŒŒ์ผ์„ ๋‹ค์šด๋ฐ›์„ ์ˆ˜ ์žˆ๋‹ค.

์ด ์ด๋ฏธ์ง€์— ๋Œ€ํ•œ ์ €์ž‘๊ถŒ ๋…ผ์˜๋Š” ๊ณ„์† ๋˜๊ณ  ์žˆ๋‹ค๋Š” ์  ๋˜ํ•œ ๊ฐ์•ˆํ•˜์—ฌ์•ผ ํ•œ๋‹ค.

 

Checkpoint (Model) ์‚ฌ์šฉ ๋ฐฉ๋ฒ•

 

โ…ก. Lora, Embedding(Textual inversion), Hyper Network ๋ž€? 


๋กœ๋ผ(Lora), ์ž„๋ฒ ๋”ฉ(Embedding(Textual inversion์ด๋ผ๊ณ ๋„ ํ•œ๋‹ค)), ํ•˜์ดํผ ๋„คํŠธ์›Œํฌ(Hyper Network) ๋Š” ์œ„ ๋ชจ๋ธ(์ฒดํฌํฌ์ธํŠธ)๋ฅผ ํ† ๋Œ€๋กœ ๋ถ€๊ฐ€์ ์ธ ๋ชจ๋ธ๋ง ์—ญํ• ์„ ํ•œ๋‹ค. 

๊ฐ„๋žตํžˆ ์–˜๊ธฐํ•ด๋ณด์ž๋ฉด ์•„๋ž˜ ์ด๋ฏธ์ง€์™€ ๊ฐ™๋‹ค.

์ƒ๊ธฐ์™€ ๊ฐ™์ด ์ฒดํฌํฌ์ธํŠธ(๋ชจ๋ธ)์„ ๊ธฐ์ ์œผ๋กœ ๋กœ๋ผ, ์ž„๋ฒ ๋”ฉ, ํ•˜์ดํผ ๋„คํŠธ์›Œํฌ 3๊ฐ€์ง€๋ฅผ ์„ ํƒํ•˜์—ฌ ๋ถ€๊ฐ€์ ์ธ ํšจ๊ณผ๋ฅผ ์ค„ ์ˆ˜ ์žˆ๋‹ค.

์—ฌ๊ธฐ์„œ ๊ณ ์œ ์˜ ํšจ๊ณผ๋ฅผ ๊ฐ•ํ•˜๊ฒŒ ๋‚˜ํƒ€๋‚ด์ฃผ๋Š” Lora > Hyper Network > Embedding(Textual inversion)๋ผ๊ณ  ์ƒ๊ฐํ•˜๋ฉด ๋œ๋‹ค.

์žฅ๋‹จ์ ์„ ๊ฐ„๋žตํžˆ ๊ธฐ์ˆ ํ•ด๋ณด์ž๋ฉด ๋‹ค์Œ๊ณผ ๊ฐ™๋‹ค. 

 

1.  Lora

์žฅ์ 

๋กœ๋ผ๋Š” ์˜ํ–ฅ๋ ฅ์ด ๊ฐ€์žฅ ํฐ ํšจ๊ณผ๋กœ ์›ํ•˜๋Š” ์Šคํƒ€์ผ์„ ๊ฐ€์žฅ ํšจ๊ณผ์ ์œผ๋กœ ๊ฐ€์ •ํ•  ์ˆ˜ ์žˆ๋‹ค. 

๋”ฐ๋ผ์„œ ์‹œ๊ฐ„ ํšจ์œจ์ด ๋” ์ข‹๊ณ , ์ด๋Ÿฌํ•œ ์žฅ์ ์„ ๋ฐ”ํƒ•์œผ๋กœ ์„ ํƒํ•  ์ˆ˜ ์žˆ๋Š” ๋ชจ๋ธ๋„ ๋งŽ๋‹ค. 

๋™์‹œ์— ์—ฌ๋Ÿฌ Lora๋ฅผ ์‚ฌ์šฉํ•  ์ˆ˜ ์žˆ์œผ๋ฉฐ, ๊ฐ•๋„๋„ ์กฐ์ ˆ ๊ฐ€๋Šฅํ•˜๋‹ค. 

๋‹จ์ 

๋‹จ์ ์€ ๋”ฑํžˆ ์—†๋Š” ๊ฒƒ ๊ฐ™๋‹ค. 

Embedding(Textual inversion)๋ณด๋‹ค ์šฉ๋Ÿ‰์€ ์žˆ์ง€๋งŒ, ํฌ๊ฒŒ ์ฐจ์ด๋‚˜์ง€๋Š” ์•Š๋Š” ๊ฒƒ ๊ฐ™๊ณ , ์ข‹์€ ๋ชจ๋ธ๋“ค์ด ๋งŽ๊ธฐ ๋•Œ๋ฌธ์— ํฐ ๋‹จ์ ์€ ์—†๋‹ค. 

2. Embedding(Textual inversion)

์žฅ์ 

์ž„๋ฒ ๋”ฉ์€ ๋กœ๋ผ์— ๋น„ํ•ด์„œ ํฐ ์˜ํ–ฅ์„ ์ฃผ์ง€ ์•Š๋Š” ํšจ๊ณผ์ด๋‹ค. 

์ข€ ๋” ์„ ๋ช…ํ•˜๊ฒŒ ํ‘œํ˜„ํ•œ๋‹ค๋˜์ง€, ๋ช…์•”์˜ ๊ฐ•๋„๋ฅผ ์˜ฌ๋ ค์ฃผ๋Š” ์ •๋„๋ผ๊ณ  ์ƒ๊ฐํ•˜๋ฉด ์ข‹์„ ๊ฒƒ ๊ฐ™๋‹ค. 

2D ์• ๋‹ˆ๋ฉ”์ด์…˜์˜ ๊ฒฝ์šฐ ์ƒ‰๊ฐ์„ ์ข€ ๋” ์˜ˆ์˜๊ฒŒ ํ•œ๋‹ค๋˜์ง€, ์ˆ˜์ฑ„ํ™” ๋Š๋‚Œ์„ ์ข€ ๋” ์ฃผ๋Š” ๊ทธ ์ •๋„? 

์šฉ๋Ÿ‰๋„ ๊ฐ€๋ฒผ์šฐ๋ฉด์„œ ๋™์‹œ์— ์—ฌ๋Ÿฌ Embedding๋„ ์‚ฌ์šฉ ๊ฐ€๋Šฅํ•˜๋‹ค. 

๋‹จ์ 

์šฉ๋Ÿ‰์ด ๊ฐ€๋ณ์ง€๋งŒ, ํšจ๊ณผ๊ฐ€ ์ ๊ธฐ ๋•Œ๋ฌธ์— ํฐ ํšจ์œจ์€ ๊ธฐ๋Œ€ํ•˜๊ธฐ ์–ด๋ ต๋‹ค. 

 

3. Hyper Network

์žฅ์ 

ํ•˜์ดํผ ๋„คํŠธ์›Œํฌ๋Š” ์ƒ๊ธฐ ์ž„๋ฒ ๋”ฉ๊ณผ ์œ ์‚ฌํ•˜๋‹ค. ํ•˜์ง€๋งŒ ํ•˜์ดํผ ๋„คํŠธ์›Œํฌ์˜ ๊ฒฝ์šฐ ํšจ๊ณผ๊ฐ€ ์กฐ๊ธˆ ๋” ๊ฐ•ํ•˜๊ฒŒ ๋‚˜ํƒ€๋‚˜๊ธฐ๋„ ํ•œ๋‹ค. 

๋กœ๋ผ์™€ ์ž„๋ฒ ๋”ฉ์˜ ์ค‘๊ฐ„์œผ๋กœ ์šฉ๋Ÿ‰๋„ ๊ทธ์— ๋น„๋ก€ํ•œ๋‹ค. 

 

๋‹จ์ 

๋‹จ์  ๋˜ํ•œ ๋กœ๋ผ์™€ ์ž„๋ฒ ๋”ฉ์˜ ์ค‘๊ฐ„์ด๋ผ๊ณ  ์ƒ๊ฐํ•˜๋ฉด ์ข‹์„ ๊ฒƒ ๊ฐ™๋‹ค. 

์ฒจ์–ธํ•˜์ž๋ฉด, ํฐ ๋ฉ”๋ฆฌํŠธ๊ฐ€ ๋”ฑํžˆ ์—†๋Š” ํšจ๊ณผ์—ฌ์„œ ๋ชจ๋ธ ์ฐพ๊ธฐ๊ฐ€ ์‰ฝ์ง€ ์•Š๋‹ค. 

๋ชจ๋ธ์€ ๋กœ๋ผ๊ฐ€ ๋” ๋งŽ๊ธฐ ๋•Œ๋ฌธ์— ๋กœ๋ผ๋ฅผ ๋” ์‚ฌ์šฉํ•˜๊ฒŒ ๋˜๋Š” ๊ฒƒ ๊ฐ™๋‹ค. 

 

728x90
728x90