Opomíjený šampion Grok

Publikováno: 12. března 2026 | autor Jan Vojtek

Štítky

Když se s lidmi bavím o AI nástrojích pro práci s obrazem, zmínka o Groku většinou vyvolá tázavé pohledy. Přitom je to jeden z nejlepších a nejrychleji se vyvíjejících modelů pro generování fotografií a videí. Tak si na něj pojďme společně posvítit.

Grok je AI nástroj od xAI patřící Elonu Muskovi, která pohání jeho platformu X (bývalý Twitter). Je multimodální – umí chatovat, dělat souhrn a analýzu sentimentu na X k aktuálním tématům, fact checkovat informace, rozumí obrázkům, generuje je, upravuje a zvládne vytvořit i video.

Celé je to napojené na ekosystém X, takže funguje jako asistent i tvůrce obsahu přímo ve feedu. Firma xAI za tím stojí s brutální infrastrukturou – v Memphisu provozují cluster s až 200 000 NVIDIA Hopper GPU H100 (jeden kus stojí přes půl milionu Kč).

To je síla, která se v praxi projevuje velmi rychlým vývojem AI modelů a také spotřebou: cca 150 MW – řádově jako elektřina pro cca 100 tisíc domácností. Jako u každého snadno dostupného generátoru obrázků se ale řeší i limity a zneužití – Grok v poslední době schytal kritiku kvůli nevyžádaným sexualizovaným editacím, což ukazuje, že AI dnes není jen o kvalitě výstupu, ale i o pravidlech hry kolem.

Pro běžné použití se vejdeme do bezplatných limitů. Pohodlný přístup ke Groku je:

prostřednictvím platformy X (web nebo mobilní appka)
přes aplikaci Grok (web nebo mobilní appka)
na platformách jako fal.ai nebo replicate.com

Co tedy tento výpočetní kolos umí?

1. Fotografie z textového zadání

Text-to-image je nejrychlejší způsob, jak zhmotnit nápad. Ne jako náhrada focení, spíš jako skicák: atmosféra, světlo, lokace, rekvizity. Čím přesněji popíšeme fotografický jazyk (objektiv, světlo, pozadí, stín), tím méně prostoru dáváme modelu „vymýšlet si“. Nebo mu naopak můžeme nechat volnou ruku pro kreativitu a inspirovat se jeho výtvory.

K práci s obrazem se v Groku dostaneme v sekci Imagine. Pro vytvoření fotografie stačí zadat jednoduchý textový popis – prompt. Funguje i v češtině, ale ze zkušenosti mám pocit, že na angličtinu reaguje trochu lépe.

Po odeslání promptu začne Grok během pár vteřin chrlit spoustu variant fotografií. Jak člověk skroluje obrazovkou dolů, přibývají další a další. Je to skutečně impozantní a u jiného generátoru jsem to neviděl.

Výsledky jsou dobré, ale pomocí Gemini nebo Midjourney lze dosáhnout přirozenějších fotografií.

2. Komplexní úprava fotografie

Tady je AI pro fotografa často nejpraktičtější. Nechceme, aby model vymyslel nový obsah, ale aby upravil vzhled: barvy, kontrast, dojem světla. Klíčové je hlídat, kdy se model ještě drží předlohy a kdy už začne tvořit „nový obraz“.

U této fotografie jsem si řekl o stylizaci do fotografie na film Portra – Grok změnil tonalitu a barvy, přidal hloubku ostrosti a vinětaci, za mě super výsledek.