Stable Diffusion od Stability AI je jeden z nejlepších a nejpoužívanějších modelů na generování obrazu z textového zadání. Při našem putování světem AI se díky němu poprvé podíváme na skutečně komplexní nástroj umožňující vysokou kontrolu celého kreativního procesu.
Stable Diffusion mělo v srpnu druhé narozeniny. Jeho modely jsou trénovány na datasetu pěti miliard textově popsaných obrázků a fotografií stažených z internetu. Jakožto open source ho využívá mnoho služeb a produktů na webu i v mobilních aplikacích. Také ho lze nainstalovat na počítači a používat zcela nezávisle bez jakýchkoliv omezení a zdarma. Ale to je poměrně složitý proces, k němuž se dostaneme někdy v budoucnu v samostatném článku.
Tentokrát k vyzkoušení Stable Diffusion využijeme pohodlný online nástroj DreamStudio.ai, který provozuje přímo Stability AI.
Na první pohled může ovládací panel působit trochu komplikovaně, ale dá se v něm rychle zorientovat. Vysvětlíme si všechna nastavení a parametry.
Po registraci dostaneme zdarma 25 kreditů, které vystačí na vytvoření přibližně 125 fotografií. Za 10 dolarů si můžeme koupit tisíc kreditů na přibližně 5000 fotografií, takže jeden snímek vyjde na necelých pět haléřů. Za tu zábavu to rozhodně stojí.
Generování fotografií spouštíme tlačítkem Dream neboli si je „vysníme“. V pravé části tlačítka se dynamicky mění počet kreditů odečtených za jeho stisknutí. Zde e potřeba být obezřetný – jak je vidět na screenshotech, cena se může pohybovat mezi 0,07 až 413,69 kreditu.
Česky bychom řekli textové zadání, na jehož základě se snímky generují. Strukturu promptu jsme detailně probírali v minulém vydání FotoVideo 09/2024. Zkrátka napíšeme, jakou scénu si představujeme, v jakém stylu, s jakými barvami, jakou atmosférou atd.
Bez mučení se přiznám, že se mi nechtělo prompt vymýšlet, tak jsem požádal ChatGPT, aby mi vytvořil deset promptů pro fotografii do článku. Pouze jsem zdůraznil, že chci přirozeně vypadající pozitivní fotografii, žádné surreální úlety, a z nabídky jsem vybral tento.
Stable Diffusion vyžaduje zadávání promptů v angličtině, což ovšem nemůže nikoho vyřadit ze hry. Stejně jako jsem zde požádal Copilota o překlad promptu do češtiny, můžete ho požádat o překlad českého promptu do angličtiny.
DreamStudio momentálně poskytuje přístup ke dvěma modelům – Stable Diffusion v1.6 a SDXL v1.0. V dalších krocích jsem nechal zapnutý SDXL.
Zjednodušeně řečeno zde zadáváme, kolikrát je generovaná fotografie vylepšena. Můžeme volit mezi 10–150 kroky, přičemž čím více kroků, tím více kreditů je účtováno. Defaultní nastavení je 40, což je za mě zpravidla dostačující. Vyšší počet kroků je vhodný třeba při vytváření velice detailních záběrů, vykreslování textur, u komplexních scén s několika důležitými objekty atd.
U tohoto porovnání bych ocenil, že je výsledek slušný už při minimálních deseti krocích. Některé fotografie (třeba makro) jsou při deseti krocích naprosto komické.
S více kroky se vylepšila konstrukce malířského stojanu, obrazy na zdi získaly tvar, roh místnosti je lépe definován, nasvícení scény od okna realističtější – například na mikině malířky a ...
Doporučujeme také výhodné předplatné s dárkem!