OpenAI na počátku září uvedla ChatGPT o1 (v preview podobě) se schopností uvažovat. A je docela zajímavé ji zkusit využit pro lepší návrhy zadání (promptu) pro DALL E 3 v klasické GPT 4o.
Pokud například vezmeme titulek tohoto tipu a požádáme DALL E 3 přímo o “prosím vytvoř ilustraci na šířku na téma:” tak vznikne například toto:

Prompt tomu odpovídající je: A futuristic scene where a person is using an advanced AI assistant called ‚ChatGPT o1‘ to refine an image creation task for a powerful art generation tool like DALL-E 3. The person is sitting at a sleek, minimalistic workstation with a holographic interface projecting various image concepts and prompts. The background shows a digital, abstract environment symbolizing creativity and artificial intelligence at work. The AI assistant appears as a semi-transparent figure or hologram, actively engaging with the user to improve their artistic requests.
Ale pokud požádáme ChatGPT-o1 o “Prosím navrhni prompt pro DALL E 3 pro toto téma:” tak získáme zadání: „Zobrazte futuristickou scénu, kde pokročilá umělá inteligence (symbolizující ‚uvažující‘ ChatGPT o1) pečlivě tvoří detailní a komplexní zadání. Z tohoto zadání vychází živý, vysoce kvalitní obraz generovaný DALL·E 3. Scéna by měla symbolizovat, jak vylepšené uvažování vede k lepším vizuálním výstupům.“
To poté můžete v DALL E 3 použít k vytvoření nového obrázku:

Který tak jako tak DALL E 3 mělo podle svého vlastního upraveného zadání: A futuristic scene where an advanced AI, representing the ‚thinking‘ ChatGPT o1, is meticulously crafting a detailed and complex prompt. From this prompt, a vivid, high-quality image is being generated by DALL·E 3. The scene symbolizes how enhanced reasoning leads to better visual outputs. The AI is depicted as an abstract, intelligent presence, possibly a hologram or a glowing figure, with intricate patterns forming around it. The generated image appears as a vibrant, emerging visual, showcasing creativity and precision. The setting is sleek, digital, and futuristic.
Při práci s ChatGPT-o1 si případně i všímejte možnosti rozbalit “Thought for…” a trochu tak nahlédnout na to, jakým způsobem nad zadáním uvažovala.
Něco jiného?
Co třeba “Prosím navrhni DALL E 3 prompt pro toto téma: Stoletá voda ohrožuje Prahu. “ vs. prosté “Prosím o foto na šířku. Téma: Stoletá voda ohrožuje Prahu”.

Návrh od o1: „Zobrazte dramatickou scénu, kde stoletá voda ohrožuje historické centrum Prahy. Řeka Vltava se vylila z břehů a její rozbouřené vody obklopují ikonické památky jako Karlův most, Pražský hrad a Staroměstskou radnici. Obloha je temná a zatažená, s těžkými mraky a deštěm, který přidává na atmosféře napětí. Obyvatelé města jsou vidět v dálce, jak se snaží zachránit své domovy. Scéna by měla zdůraznit kontrast mezi krásou historické architektury a silou přírody.“

Proč něco takového dělat?
Nejpodstatnější vhodný důvod je nejspíš ten, že tvorba promptu pomocí o1 vede k bohatému zadání. To můžete použít rovnou, ale také ho přizpůsobit a předpřipravený prompt vám lépe pomůže pochopit co vlastně můžete chtít.
Zcela správně se ale můžete zeptat, proč to nedělat přímo v ChatGPT 4o. Můžete, ale „uvažující“ podoba nad tím tak trochu „víc přemýšlí“. A zkušenosti navíc i je, že tvoří zadání, které DALL E 3 méně odmítá vytvořit s ohledem na „porušování pravidel“.
Ale můžete si to i nechat vysvětlit dotazem „Proč bych vlastně vůbec měl používat Chat GPT 1 pro tvorbu promptu pro Dall e 3. Není to stejné jako využití klasické ChatGPT 4o?“
Použití „uvažujícího“ ChatGPT o1 pro tvorbu promptů pro DALL·E 3 může výrazně zlepšit kvalitu výsledných obrázků. Tato verze ChatGPT je navržena tak, aby poskytovala detailnější, přesnější a nuancovanější popisy díky svým pokročilým schopnostem uvažování. Bohatší a preciznější prompty pomáhají DALL·E 3 generovat realističtější a věrnější obrázky, které lépe odpovídají vaší představě.
Zatímco klasická verze ChatGPT 4o je schopná vytvořit kvalitní prompty, „uvažující“ ChatGPT o1 nabízí vylepšený výkon při jejich tvorbě. To vede k lepším výsledkům při generování obrázků, protože DALL·E 3 má k dispozici detailnější a propracovanější instrukce, které může následovat.
Dá se teď například požádat o „Tak mi teď navrhni prompt, který bude jasně ilustrovat toto vysvětlení. Ideálně ve formě nějaké ínfografiky.“
Což povede k zadání:
„Vytvořte infografiku, která ilustruje výhody používání ‚uvažujícího‘ ChatGPT o1 oproti klasickému ChatGPT 4o při tvorbě promptů pro DALL·E 3. Infografika by měla obsahovat srovnání vedle sebe:
- Vlevo: Proces a výsledek použití klasického ChatGPT 4o. Zobrazte jednodušší prompt a méně detailní obrázek generovaný DALL·E 3.
- Vpravo: Proces a výsledek použití ‚uvažujícího‘ ChatGPT o1. Zobrazte detailnější, komplexnější prompt a realističtější obrázek generovaný DALL·E 3.
Použijte grafické prvky jako ikony, šipky a textové popisky k vysvětlení rozdílů. Design by měl být čistý, přehledný a vizuálně přitažlivý, s důrazem na zlepšení kvality díky použití ‚uvažujícího‘ ChatGPT o1.“
Vlastně docela povedené zadání pro grafika, lidského. Pro DALL E 3 je to poněkud příliš složité, ale to co vytvoří by mohlo grafikovi posloužit jako skvělá inspirace.

Případně můžete zkusit kouzlit s klasickým „Prosím zásadně zjednodušit“.

Další tipy týkající se ChatGPT
-
TIP#2502: Jak je možné OpenAI/Bard říci, že nesmí přistupovat k vašemu obsahu pro zahrnutí do ChatGPT/Bardu. A proč to je to ničemu
Je to teď tak trochu módní “zakazovat” ChatGPT přístup k obsahu, aby ho nemohla použít. Udělat to jde poměrně snadno, protože OpenAI respektuje zákaz indexování v robots.txt. Související příspěvky TIP2567: Co je…
-
TIP#2496: Umí ChatGPT či Bard vytvářet prezentace v PowerPointu, Google Sheets či PDF?
Tady je odpověď jednoduchá, žádná z konverzačních umělých inteligencí, tedy ChatGPT, Bard ani Bing Chat neumí přímo vytvořit prezentace v PowerPointu, Google Sheets či PDF. Související příspěvky TIP#2621: ChatGPT? Google Bard/Gemini? Microsoft…
-
TIP#2493: Jak pracovat s Custom Instructions v ChatGPT4? Příklady, které můžete použít i v běžných zadáních
Custom Instructions (Vlastní instrukce) je nová funkčnost v ChatGPT 4, tedy v placené verzi. Čerstvě zpřístupněna i pro EU, kam se provozovateli nechtělo funkčnost pustit, protože hrozí ukládání osobních či jinak důvěrných…
-
TIP#2489: Jak využít ChatGPT 4 pro konverzi XML do Google Tabulky?
ChatGPT4 má nesmírně užitečnou věc jménem Code Interpreter. Dá se využít na množství věcí, takže je vhodné se s tím naučit zacházet. Jeden takový vcelku základní příklad je konverze XML do Google…
-
TIP#2465: Python jako nástroj pro rychlé vylepšení fotografií? A jak pomůže ChatGPT
Třeba se to někomu bude hodit. V současných vedrech jsem dostal bláznivý nápad se “naučit” zda by pomocí Pythonu nedalo automatizovat vylepšení fotek, které by to přece jen trochu potřebovaly. Takové základní,…
-
TIP#2461: Jak využít ChatGPT pro generování zadání (prompts) pro Stable Diffusion. Pokročilé naučení ChatGPT
V Jak využít ChatGPT pro generování zadání (prompts) pro Stable Diffusion, Midjourney a další? jsem slíbil pokračování, takže tady ho máte. Připomenu, že ChatGPT nemá o generativních obrázkových AI ponětí, v době…
-
TIP#2451: Jak využít ChatGPT pro generování zadání (prompts) pro Stable Diffusion, Midjourney a další?
ChatGPT můžete využít pro vytváření zadání (promptů) pro generativní obrázkové AI jako je Stable Diffusion, Dall-E (Bing Create), Mid Journey a další. Ale má to drobné zádrhele, dané hlavně tím, že ChatGPT…
-
TIP#2447: Rozšíření pro (zejména) Chrome pro ChatGPT? Pár šikovných věcí se najde
ChatGPT se vcelku dobře používá aniž byste si pořizovali cokoliv dalšího, ale přeci jen některé věci se hodit mohou. Pozor jen, až si budete nějaká rozšíření pořizovat, tak nic co by po vás…
-
TIP#2444: Placená ChatGPT? Co umí a jak s ní zacházet? Proč si ji pořídit?
ChatGPT můžete používat zdarma. stačí jít na ai.com a po založení si účtu můžete používat konverzační umělou inteligenci s pár omezeními. Bud pomalejší, bude méně spolehlivá (občas “spadne”, občas bude nedostupná). Nemá…
-
TIP#2442: Pluginy v ChatGPT? Tipy na ty nejzajímavější a jak s pluginy pracovat
V placené ChatGPT (20 USD měsíčně) můžete mít nejenom přístup k Internetu, ale také pluginy, tedy rozšiřující “aplikace” s různorodou funkčnosti. Související příspěvky TIP#2891: ChatGPT Tasks (Úkoly) a k čemu je to…
-
TIP#2396: Jak je to u ChatGPT a dalších podobných s bezpečností a soukromím?
ChatGPT je konverzační umělá inteligence a pokládáte ji otázky, sdělujete ji nějaké informace. Znamená to i to, že může dojít k tomu, že ji budete sdělovat soukromé informace, osobní údaje, ale v…
-
TIP#2391: Co je to AGI (Artificial General Intelligence, obecná umělá inteligence)? Jak ji poznáme?
Artificial General Intelligence (AGI, Obecná umělá inteligence) je pojem používaný k popisu teoretické formy umělé inteligence, která by měla schopnosti obdobné lidem, tj. Související příspěvky TIP#2891: ChatGPT Tasks (Úkoly) a k čemu…
-
TIP#2386: Jak využít ChatGPT pro psaní celých či částečných článků (včetně AI verze)
Nebudu nic zastírat. Poslední víkend v březnu jsem doháněl resty v psaní tipů pro 365tipů po týdenní skluzu zaviněném #moribundus stavem. Zároveň se připravoval na nějaké školení, které se bude týkat toho,…