Porovnání top nástrojů na generování fotografií

Publikováno: 9. července 2025 | autor Jan Vojtek
07a.png

Ještě před rokem jsem nadšeně testoval každý nový model na generování fotografií, kvalita se zvyšovala skokově. S napětím jsem čekal, že každou chvíli už musí přijít model, který nadobro smaže hranice mezi AI a realitou. To se pořád ještě nestalo a tempo zlepšování modelů se citelně zpomalilo.

Vybral jsem osm nástrojů, které jsou podle mě aktuálně nejpoužívanější a nejpokročilejší. Pro srovnání výkonu jsem vytvořil tři prompty:

1. Muž s nápisem na kartonu: pro ověření, jak zvládají práci s textem.
2. Žena se sklenkou vína: abychom se podívali, jak dokážou vytvořit přirozenou atmosféru a dlouhodobě problematickou část lidského těla – prsty.
3. Historickou fotografii Prahy: pro porovnání AI fotografie s reálným prostředím a otestování schopnosti stylizace.

Záměrně jsem použil jednoduché prompty bez sofistikovaného nastavování parametrů, aby bylo vidět, jak nástroje fungují pro v běžném provozu „out of the box“.

ChatGPT

O „četu dží pý tý“ od OpenAI slyšíme neustále ze všech stran, až to dokáže být otravné.

01a.png

Ale nedá se nic dělat – momentálně je to skutečně nejrobustnější a nejuniverzálnější nástroj pro práci s různými AI modely – textem, zvukem, obrazem atd.

01b.png

Je to skvělý nástroj na získání kvalitních AI fotografií pro uživatele, kteří nemají zkušenosti s pokročilým nastavováním parametrů – dá se s ním jednoduše „domluvit“ přirozeným jazykem a funguje i bezplatně.

01c.png

Canva

Canva umí takřka všechno, ale vlastně nic pořádně. Říkám to s určitou mírou nadsázky, protože ji moc dobře neznám (nerad ji používám), je pro mě příliš složité se v ní zorientovat a najít to, co potřebuji.

02a.jpg

Mám radši více specializované nástroje. Kvalita generovaných fotografií tomu odpovídá.

02b.jpg

Jako jedna doplňková funkce z mnoha je to fajn, ale pro seriózní práci bych zvolil jiný nástroj.

02c.jpg

Copilot

Microsoft je klíčový investor OpenAI, takže jeho Copilot využívá stejný model pro generování obrazu GPT Image 1.

03a.png

Výstupy jsou tedy stejně kvalitní, jen se drobně liší, jak aplikace reagují na nuance v textovém zadání.

03b.png

Fotografie vypadají dobře, ale pořád je vidět, že jim „něco“ chybí k naprosto přirozenému vzhledu (a to nemám na mysli tramvaj levitující vedle mostu). I v Copilotu je možné generovat fotografie v bezplatném plánu.

03c.jpg

Firefly

Adobe statečně bojuje s vývojem svého modelu pro generování obrazu, který je dostupný třeba ve Photoshopu. „Problém“ je v tom, že na rozdíl od většiny konkurentů k trénování modelu používá licencovaná data (takže jich nemá tolik a stojí to víc peněz).

04a.jpg

Výsledkem je pomalejší vývoj a horší výsledky, ale uživatelům zase nehrozí důsledky soudních sporů, které se vedou mezi majiteli autorských práv a vývojáři modelů.

04b.jpg

Musím Adobe přiznat, že generování celých fotografií je sice slabší, ale funkce jako generativní rozšíření fotografie nebo vyplnění/nahrazení její části funguje neskutečně dobře.

04c.jpg

Flux

Flux byl první model, který uměl dobře vygenerovat písmo. Obecně je velice dobrý v generování lidské anatomie. Často mívá jinou estetiku než ostatní modely. Rozhodně se vyplatí ho sledovat a testovat...


Celý článek najdete v červencovém FotoVideo

Doporučujeme také výhodné předplatné s dárkem!


fv07-25-obalka-web3.jpg

Právě vychází
fv07-25-obalka-web3.jpg
Tento web používá k poskytování služeb soubory cookie.