Když se s lidmi bavím o AI nástrojích pro práci s obrazem, zmínka o Groku většinou vyvolá tázavé pohledy. Přitom je to jeden z nejlepších a nejrychleji se vyvíjejících modelů pro generování fotografií a videí. Tak si na něj pojďme společně posvítit.
Grok je AI nástroj od xAI patřící Elonu Muskovi, která pohání jeho platformu X (bývalý Twitter). Je multimodální – umí chatovat, dělat souhrn a analýzu sentimentu na X k aktuálním tématům, fact checkovat informace, rozumí obrázkům, generuje je, upravuje a zvládne vytvořit i video.
Celé je to napojené na ekosystém X, takže funguje jako asistent i tvůrce obsahu přímo ve feedu. Firma xAI za tím stojí s brutální infrastrukturou – v Memphisu provozují cluster s až 200 000 NVIDIA Hopper GPU H100 (jeden kus stojí přes půl milionu Kč).
To je síla, která se v praxi projevuje velmi rychlým vývojem AI modelů a také spotřebou: cca 150 MW – řádově jako elektřina pro cca 100 tisíc domácností. Jako u každého snadno dostupného generátoru obrázků se ale řeší i limity a zneužití – Grok v poslední době schytal kritiku kvůli nevyžádaným sexualizovaným editacím, což ukazuje, že AI dnes není jen o kvalitě výstupu, ale i o pravidlech hry kolem.
Pro běžné použití se vejdeme do bezplatných limitů. Pohodlný přístup ke Groku je:
Co tedy tento výpočetní kolos umí?
Text-to-image je nejrychlejší způsob, jak zhmotnit nápad. Ne jako náhrada focení, spíš jako skicák: atmosféra, světlo, lokace, rekvizity. Čím přesněji popíšeme fotografický jazyk (objektiv, světlo, pozadí, stín), tím méně prostoru dáváme modelu „vymýšlet si“. Nebo mu naopak můžeme nechat volnou ruku pro kreativitu a inspirovat se jeho výtvory.

K práci s obrazem se v Groku dostaneme v sekci Imagine. Pro vytvoření fotografie stačí zadat jednoduchý textový popis – prompt. Funguje i v češtině, ale ze zkušenosti mám pocit, že na angličtinu reaguje trochu lépe.

Po odeslání promptu začne Grok během pár vteřin chrlit spoustu variant fotografií. Jak člověk skroluje obrazovkou dolů, přibývají další a další. Je to skutečně impozantní a u jiného generátoru jsem to neviděl.

Výsledky jsou dobré, ale pomocí Gemini nebo Midjourney lze dosáhnout přirozenějších fotografií.
Tady je AI pro fotografa často nejpraktičtější. Nechceme, aby model vymyslel nový obsah, ale aby upravil vzhled: barvy, kontrast, dojem světla. Klíčové je hlídat, kdy se model ještě drží předlohy a kdy už začne tvořit „nový obraz“.


U této fotografie jsem si řekl o stylizaci do fotografie na film Portra – Grok změnil tonalitu a barvy, přidal hloubku ostrosti a vinětaci, za mě super výsledek.

Převedení snímku do zimní atmosféry se mu také povedlo.
Generativní retuš je návyková, protože když to vyjde, je to jednoduchý prompt a pár vteřin práce AI.

Na tomto snímku jsem požádal o odstranění rušivého lampionu – perfektní výsledek.

Grok může dobře posloužit při retušování/restaurování starých fotografií.
Tohle je disciplína, kde se ukáže, jestli AI umí poslouchat. Cílem je, aby upravila jen tu část fotografie, kterou jí...
Doporučujeme také výhodné předplatné s dárkem!