Stable Diffusion

모델

Stable Diffusion

Stability AI가 공개한 오픈소스 텍스트-이미지 생성 모델. 오픈 웨이트 덕분에 커뮤니티 생태계가 폭발적으로 성장해 이미지 생성 AI의 대중화를 이끌었다.

개념 설명

DALL-E와 Midjourney가 API/서비스로만 제공되는 반면, Stable Diffusion은 모델 가중치를 공개해 누구나 로컬에서 실행하고 수정할 수 있다. 이 오픈 접근 덕분에 LoRA 파인튜닝, ControlNet(포즈/구조 제어), img2img, inpainting 등 수천 개의 확장이 커뮤니티에서 만들어졌다. Latent Diffusion 아키텍처를 사용해 픽셀이 아닌 잠재 공간에서 작동하므로 소비자 GPU에서도 실행 가능하다.

사용 예시

ComfyUI나 Automatic1111 WebUI로 로컬에서 이미지를 생성하고, LoRA로 특정 스타일을 학습시킬 수 있다. Stability AI API를 서비스에 통합하거나, HuggingFace의 diffusers 라이브러리로 Python 코드에서 직접 호출할 수도 있다. 게임 에셋, 마케팅 소재, UI 목업 제작에 실무적으로 많이 쓰인다.

#이미지생성#오픈소스#Stability AI

← AI Wiki에서 더 보기