Stable Diffusion – levná vstupenka do první ligy

Publikováno: 6. října 2024 | autor Jan Vojtek
006b.png

Stable Diffusion od Stability AI je jeden z nejlepších a nejpoužívanějších modelů na generování obrazu z textového zadání. Při našem putování světem AI se díky němu poprvé podíváme na skutečně komplexní nástroj umožňující vysokou kontrolu celého kreativního procesu.

Stable Diffusion mělo v srpnu druhé narozeniny. Jeho modely jsou trénovány na datasetu pěti miliard textově popsaných obrázků a fotografií stažených z internetu. Jakožto open source ho využívá mnoho služeb a produktů na webu i v mobilních aplikacích. Také ho lze nainstalovat na počítači a používat zcela nezávisle bez jakýchkoliv omezení a zdarma. Ale to je poměrně složitý proces, k němuž se dostaneme někdy v budoucnu v samostatném článku.

Tentokrát k vyzkoušení Stable Diffusion využijeme pohodlný online nástroj DreamStudio.ai, který provozuje přímo Stability AI.

001.png

Na první pohled může ovládací panel působit trochu komplikovaně, ale dá se v něm rychle zorientovat. Vysvětlíme si všechna nastavení a parametry.

Cena

002.png

Po registraci dostaneme zdarma 25 kreditů, které vystačí na vytvoření přibližně 125 fotografií. Za 10 dolarů si můžeme koupit tisíc kreditů na přibližně 5000 fotografií, takže jeden snímek vyjde na necelých pět haléřů. Za tu zábavu to rozhodně stojí.

003b.png

Generování fotografií spouštíme tlačítkem Dream neboli si je „vysníme“. V pravé části tlačítka se dynamicky mění počet kreditů odečtených za jeho stisknutí. Zde e potřeba být obezřetný – jak je vidět na screenshotech, cena se může pohybovat mezi 0,07 až 413,69 kreditu.

Prompt

Česky bychom řekli textové zadání, na jehož základě se snímky generují. Strukturu promptu jsme detailně probírali v minulém vydání FotoVideo 09/2024. Zkrátka napíšeme, jakou scénu si představujeme, v jakém stylu, s jakými barvami, jakou atmosférou atd.

004a.png

Bez mučení se přiznám, že se mi nechtělo prompt vymýšlet, tak jsem požádal ChatGPT, aby mi vytvořil deset promptů pro fotografii do článku. Pouze jsem zdůraznil, že chci přirozeně vypadající pozitivní fotografii, žádné surreální úlety, a z nabídky jsem vybral tento.

004b.jpg

Stable Diffusion vyžaduje zadávání promptů v angličtině, což ovšem nemůže nikoho vyřadit ze hry. Stejně jako jsem zde požádal Copilota o překlad promptu do češtiny, můžete ho požádat o překlad českého promptu do angličtiny.

Model

005b.png

DreamStudio momentálně poskytuje přístup ke dvěma modelům – Stable Diffusion v1.6 a SDXL v1.0. V dalších krocích jsem nechal zapnutý SDXL.

006b.png

Generation steps

Zjednodušeně řečeno zde zadáváme, kolikrát je generovaná fotografie vylepšena. Můžeme volit mezi 10–150 kroky, přičemž čím více kroků, tím více kreditů je účtováno. Defaultní nastavení je 40, což je za mě zpravidla dostačující. Vyšší počet kroků je vhodný třeba při vytváření velice detailních záběrů, vykreslování textur, u komplexních scén s několika důležitými objekty atd.

007aa.jpg

U tohoto porovnání bych ocenil, že je výsledek slušný už při minimálních deseti krocích. Některé fotografie (třeba makro) jsou při deseti krocích naprosto komické.

007bb.jpg

S více kroky se vylepšila konstrukce malířského stojanu, obrazy na zdi získaly tvar, roh místnosti je lépe definován, nasvícení scény od okna realističtější – například na mikině malířky a ...


Celý článek najdete v říjnovém FotoVideo

Doporučujeme také výhodné předplatné s dárkem!


fv10-24-obalka-web3.jpg

Právě vychází
fv06-25-obalka-web3.jpg
Tento web používá k poskytování služeb soubory cookie.