Porovnání top nástrojů na generování fotografií

Publikováno: 9. července 2025 | autor Jan Vojtek

Štítky

Ještě před rokem jsem nadšeně testoval každý nový model na generování fotografií, kvalita se zvyšovala skokově. S napětím jsem čekal, že každou chvíli už musí přijít model, který nadobro smaže hranice mezi AI a realitou. To se pořád ještě nestalo a tempo zlepšování modelů se citelně zpomalilo.

Vybral jsem osm nástrojů, které jsou podle mě aktuálně nejpoužívanější a nejpokročilejší. Pro srovnání výkonu jsem vytvořil tři prompty:

1. Muž s nápisem na kartonu: pro ověření, jak zvládají práci s textem.
2. Žena se sklenkou vína: abychom se podívali, jak dokážou vytvořit přirozenou atmosféru a dlouhodobě problematickou část lidského těla – prsty.
3. Historickou fotografii Prahy: pro porovnání AI fotografie s reálným prostředím a otestování schopnosti stylizace.

Záměrně jsem použil jednoduché prompty bez sofistikovaného nastavování parametrů, aby bylo vidět, jak nástroje fungují pro v běžném provozu „out of the box“.

ChatGPT

O „četu dží pý tý“ od OpenAI slyšíme neustále ze všech stran, až to dokáže být otravné.

Ale nedá se nic dělat – momentálně je to skutečně nejrobustnější a nejuniverzálnější nástroj pro práci s různými AI modely – textem, zvukem, obrazem atd.

Je to skvělý nástroj na získání kvalitních AI fotografií pro uživatele, kteří nemají zkušenosti s pokročilým nastavováním parametrů – dá se s ním jednoduše „domluvit“ přirozeným jazykem a funguje i bezplatně.

Canva

Canva umí takřka všechno, ale vlastně nic pořádně. Říkám to s určitou mírou nadsázky, protože ji moc dobře neznám (nerad ji používám), je pro mě příliš složité se v ní zorientovat a najít to, co potřebuji.

Mám radši více specializované nástroje. Kvalita generovaných fotografií tomu odpovídá.

Jako jedna doplňková funkce z mnoha je to fajn, ale pro seriózní práci bych zvolil jiný nástroj.

Copilot

Microsoft je klíčový investor OpenAI, takže jeho Copilot využívá stejný model pro generování obrazu GPT Image 1.

Výstupy jsou tedy stejně kvalitní, jen se drobně liší, jak aplikace reagují na nuance v textovém zadání.

Fotografie vypadají dobře, ale pořád je vidět, že jim „něco“ chybí k naprosto přirozenému vzhledu (a to nemám na mysli tramvaj levitující vedle mostu). I v Copilotu je možné generovat fotografie v bezplatném plánu.

Firefly

Adobe statečně bojuje s vývojem svého modelu pro generování obrazu, který je dostupný třeba ve Photoshopu. „Problém“ je v tom, že na rozdíl od většiny konkurentů k trénování modelu používá licencovaná data (takže jich nemá tolik a stojí to víc peněz).

Výsledkem je pomalejší vývoj a horší výsledky, ale uživatelům zase nehrozí důsledky soudních sporů, které se vedou mezi majiteli autorských práv a vývojáři modelů.

Musím Adobe přiznat, že generování celých fotografií je sice slabší, ale funkce jako generativní rozšíření fotografie nebo vyplnění/nahrazení její části funguje neskutečně dobře.

Flux

Flux byl první model, který uměl dobře vygenerovat písmo. Obecně je velice dobrý v generování lidské anatomie. Často mívá jinou estetiku než ostatní modely. Rozhodně se vyplatí ho sledovat a testovat...

Celý článek najdete v červencovém FotoVideo

Doporučujeme také výhodné předplatné s dárkem!

E-mail přijemce:	Váš e-mail: