OpenAI na počátku září uvedla ChatGPT o1 (v preview podobě) se schopností uvažovat. A je docela zajímavé ji zkusit využit pro lepší návrhy zadání (promptu) pro DALL E 3 v klasické GPT 4o.
Pokud například vezmeme titulek tohoto tipu a požádáme DALL E 3 přímo o “prosím vytvoř ilustraci na šířku na téma:” tak vznikne například toto:

Prompt tomu odpovídající je: A futuristic scene where a person is using an advanced AI assistant called ‚ChatGPT o1‘ to refine an image creation task for a powerful art generation tool like DALL-E 3. The person is sitting at a sleek, minimalistic workstation with a holographic interface projecting various image concepts and prompts. The background shows a digital, abstract environment symbolizing creativity and artificial intelligence at work. The AI assistant appears as a semi-transparent figure or hologram, actively engaging with the user to improve their artistic requests.
Ale pokud požádáme ChatGPT-o1 o “Prosím navrhni prompt pro DALL E 3 pro toto téma:” tak získáme zadání: „Zobrazte futuristickou scénu, kde pokročilá umělá inteligence (symbolizující ‚uvažující‘ ChatGPT o1) pečlivě tvoří detailní a komplexní zadání. Z tohoto zadání vychází živý, vysoce kvalitní obraz generovaný DALL·E 3. Scéna by měla symbolizovat, jak vylepšené uvažování vede k lepším vizuálním výstupům.“
To poté můžete v DALL E 3 použít k vytvoření nového obrázku:

Který tak jako tak DALL E 3 mělo podle svého vlastního upraveného zadání: A futuristic scene where an advanced AI, representing the ‚thinking‘ ChatGPT o1, is meticulously crafting a detailed and complex prompt. From this prompt, a vivid, high-quality image is being generated by DALL·E 3. The scene symbolizes how enhanced reasoning leads to better visual outputs. The AI is depicted as an abstract, intelligent presence, possibly a hologram or a glowing figure, with intricate patterns forming around it. The generated image appears as a vibrant, emerging visual, showcasing creativity and precision. The setting is sleek, digital, and futuristic.
Při práci s ChatGPT-o1 si případně i všímejte možnosti rozbalit “Thought for…” a trochu tak nahlédnout na to, jakým způsobem nad zadáním uvažovala.
Něco jiného?
Co třeba “Prosím navrhni DALL E 3 prompt pro toto téma: Stoletá voda ohrožuje Prahu. “ vs. prosté “Prosím o foto na šířku. Téma: Stoletá voda ohrožuje Prahu”.

Návrh od o1: „Zobrazte dramatickou scénu, kde stoletá voda ohrožuje historické centrum Prahy. Řeka Vltava se vylila z břehů a její rozbouřené vody obklopují ikonické památky jako Karlův most, Pražský hrad a Staroměstskou radnici. Obloha je temná a zatažená, s těžkými mraky a deštěm, který přidává na atmosféře napětí. Obyvatelé města jsou vidět v dálce, jak se snaží zachránit své domovy. Scéna by měla zdůraznit kontrast mezi krásou historické architektury a silou přírody.“

Proč něco takového dělat?
Nejpodstatnější vhodný důvod je nejspíš ten, že tvorba promptu pomocí o1 vede k bohatému zadání. To můžete použít rovnou, ale také ho přizpůsobit a předpřipravený prompt vám lépe pomůže pochopit co vlastně můžete chtít.
Zcela správně se ale můžete zeptat, proč to nedělat přímo v ChatGPT 4o. Můžete, ale „uvažující“ podoba nad tím tak trochu „víc přemýšlí“. A zkušenosti navíc i je, že tvoří zadání, které DALL E 3 méně odmítá vytvořit s ohledem na „porušování pravidel“.
Ale můžete si to i nechat vysvětlit dotazem „Proč bych vlastně vůbec měl používat Chat GPT 1 pro tvorbu promptu pro Dall e 3. Není to stejné jako využití klasické ChatGPT 4o?“
Použití „uvažujícího“ ChatGPT o1 pro tvorbu promptů pro DALL·E 3 může výrazně zlepšit kvalitu výsledných obrázků. Tato verze ChatGPT je navržena tak, aby poskytovala detailnější, přesnější a nuancovanější popisy díky svým pokročilým schopnostem uvažování. Bohatší a preciznější prompty pomáhají DALL·E 3 generovat realističtější a věrnější obrázky, které lépe odpovídají vaší představě.
Zatímco klasická verze ChatGPT 4o je schopná vytvořit kvalitní prompty, „uvažující“ ChatGPT o1 nabízí vylepšený výkon při jejich tvorbě. To vede k lepším výsledkům při generování obrázků, protože DALL·E 3 má k dispozici detailnější a propracovanější instrukce, které může následovat.
Dá se teď například požádat o „Tak mi teď navrhni prompt, který bude jasně ilustrovat toto vysvětlení. Ideálně ve formě nějaké ínfografiky.“
Což povede k zadání:
„Vytvořte infografiku, která ilustruje výhody používání ‚uvažujícího‘ ChatGPT o1 oproti klasickému ChatGPT 4o při tvorbě promptů pro DALL·E 3. Infografika by měla obsahovat srovnání vedle sebe:
- Vlevo: Proces a výsledek použití klasického ChatGPT 4o. Zobrazte jednodušší prompt a méně detailní obrázek generovaný DALL·E 3.
- Vpravo: Proces a výsledek použití ‚uvažujícího‘ ChatGPT o1. Zobrazte detailnější, komplexnější prompt a realističtější obrázek generovaný DALL·E 3.
Použijte grafické prvky jako ikony, šipky a textové popisky k vysvětlení rozdílů. Design by měl být čistý, přehledný a vizuálně přitažlivý, s důrazem na zlepšení kvality díky použití ‚uvažujícího‘ ChatGPT o1.“
Vlastně docela povedené zadání pro grafika, lidského. Pro DALL E 3 je to poněkud příliš složité, ale to co vytvoří by mohlo grafikovi posloužit jako skvělá inspirace.

Případně můžete zkusit kouzlit s klasickým „Prosím zásadně zjednodušit“.

Další tipy týkající se ChatGPT
-
TIP#2621: ChatGPT? Google Bard/Gemini? Microsoft Bing/Copilot? Co vybrat?
Tohle je těžké. Máme tu v zásadě tři hlavní linie generativních umělých inteligencí. ChatGPT od OpenAI, Gemini (dříve Bard) od Google a Copilot (dříve Bing) od Microsoftu. Ta poslední je navíc postavená…
-
TIP#2619: Jak velké množství souborů třídit do složek podle roku a měsíce? A jak v tom pomůže ChatGPT?
Mám v počítači dvě složky, kde každý měsíc přibude spousta souborů a je velmi vhodné ty starší odsouvat někam do archivu, aby ta složka zůstala použitelná. Dlouho jsem to dělal ručně. Prostě…
-
TIP#2577: Jaké jsou nejvíce rozšířené AI mýty?
Další přírůstek do série “Mýty” se týká AI, věci co je aktuálně hodně v kurzu a také tomu odpovídá řada mýtů s tím spojených. Související příspěvky TIP#2396: Jak je to u ChatGPT…
-
TIP2567: Co je to OSINT a pomůže při téhle činnosti AI?
Občas na tuhle zkratku narážím, takže je možná dobré ji přidat k vysvětleným cizím slovíčkům. OSINT je vlastně tak trochu zkratka a znamená „Open Source Intelligence„. Související příspěvky TIP#2396: Jak je to…
-
TIP#2566: Odpovídá vám ChatGPT náhodné zmatené věci? Na češtinu anglicky? Co s tím?
Časem na to nejspíš narazíte. Pokud budete mít moc dlouho session (chat), tak po vložení delšího textu (třeba textu článku), vám místo smysluplné odpovědi dorazí něco zcela náhodného, nesmyslného a anglicky, ačkoliv…
-
TIP#2559: Má ChatGPT přístup k Internetu? Jak funguje Browse with Bing?
ChatGPT původně měla Browse with Bing jako volitelnou variantu, ale od listopadu 2023 je funkčnost přístupu k Internetu zahrnuta přímo v ChatGPT – nutno dodat, že jde o placenou (Plus) verzi a…
-
TIP#2557: Je možné použít ChatGPT/LLM pro kontrolu pravopisu? Jak na kontrolu (zejména českého) pravopisu?
Už jsme tu probírali, zda je vhodné ChatGPT používat pro překlady místo (zejména) DeepL a také zda jde použít pro doplnění nabodeníček (diakritiky). Takže je logické se ptát, zda můžete ChatGPT použít…
-
DALL-E 3 v ChatGPT: Jak vytvořit obrázek podle obrázku? (13)
Tohle je trochu složitější a ne 100% blbu vzdorné, ale dá se to použít snadno a občas i s velmi hezkými výsledky. Vyjdeme z toho, že máte obrázek či fotku a chcete…
-
TIP#2552: Jak na vlastní GPT (Custom GPT) v ChatGPT. Kompletní návod
Na počátku října ChatGPT získala novou verzi ve které můžete vytvářet vlastní GPT. Můžete to brát jako rozšířenější možnost custom instructions – určíte co má vaše GPT dělat, čím se má řídit,…
-
TIP#2550: DALL-E 3 v ChatGPT: Interní instrukce
Jedna z velmi zajímavých věcí na Dall E 3 je, že existují interní instrukce určující co se smí či nesmí generovat, jak se zachází s prompty, kolik obrázků lze žádat (v jednom…
-
TIP#2547: Jsou nějaké rozdíly v různých variantách ChatGPT? Včetně té v Bing Chat
Tohle byste měli vědět. Existuje ChatGPT 3.5 a ChatGPT 4 a je asi vcelku jasné, že mezi nimi jsou rozdíly. Ale co když v Chat GP4 aktivujete Browse with Bing, Data Analytics…
-
DALL-E 3 v ChatGPT: Příklady zadání (prompts), druhé pokračování (12)
Generujte si fraktály. Velmi detailní fotografie a skvělá pozadí. Jde generovat příběh? Engineering-style draft of. Design ikon a fontů. Pixel art. Související příspěvky TIP#2621: ChatGPT? Google Bard/Gemini? Microsoft Bing/Copilot? Co vybrat? TIP#2550:…
-
TIP#2544: Jak funguje GPT4V/GPT4Vision, ChatGPT co umí “vidět”. Kde to najdu?
GPT4V/GPT4Vision je další dílek schopností ChatGPT 4 – přidává možnost nahrát obrázek (vyfotit fotku) a umělá inteligence se pokusí zjistit co v něm je a umožní vám pokračovat v konverzaci – můžete…
-
DALL-E 3 v ChatGPT: Custom Instructions pro zásadní proměnu promptů i výstupů (11)
Glibatree na YouTube v Try THIS to instantly make DALL·E 3 way better!!! ukazuje dost rozsáhlou sadu Custom Instructions co dokáže přimět Dall E 3 k vytváření lepších promptů – a nutno…