V půlce října do ChatGPT dorazila DALL-E-3, tedy generativní AI. Ta co je už pár týdnů v Bing Create. Musíte mít ale placenou ChatGPT a v menu GPT-4 aktivovat, že chcete generovat obrázky. Pak už si můžete s ChatGPT nejen povídat, ale hlavně ji zadávat co má vytvořit.
Prompt nebo zadání je v DALL E 3 trochu jiné, než v ostatních generativních inteligencích, takže tady máte množství důležitých postřehů a informací.
- Zadání (prompt) můžete psát i česky či v dalších jazycích. Ale dost počítejte s tím, že dojde k překladům. Což může znamenat i nepřesnosti, nejasnosti a zmatky
- Prompt není posloupnost klíčový slov, jste v ukecaná AI (LLM) a povídáte si s ní. Byť tedy i ty posloupnosti klíčových slov mohou fungovat.
- Prompt pro Stable Diffusion či MidJourney někdy dají odpovídající výsledek, někdy vůbec, někdy odmítne, protože tam se hodně používaly umělci a osoby.
- Na české zadání často získáte anglický přepracovaný prompt u každé fotky, což je zásadní rozdíl oproti jiným generativním AI. ChatGPT řeknete co chcete, popíšete, ideálně co nejvíce slovně, povídavě a ona to podle sebe přetvoří. Čas ukáže jak to bude užitečné či neužitečné, ale naučte se zadání psát zcela jinak, než pro Midjourney či Stable Diffusion.
- Je to ChatGPT, takže otázky bude klasicky odpovídat, ale cokoliv co vypadá jako prompt, tak začne generovat
- Dobré je, že toho “o sobě” ví hodně, takže se můžete ptát, třeba co umí za styly, techniky. Ale také můžete chtít vysvětlení proč něco nechce vytvořit.
TIP: Při psaní tohoto tipů jsem zkoušel řadu velmi různorodých věcí. Mrkněte do Hrátky s DALL E 3 v ChatGPT. Hodně různorodých promptů s ukázkou výsledků pro množství zadání (promptů) i výsledků.
- Kupodivu lze určovat seed, takže můžete “znovu” generovat něco co jste už měli. Musíte ho ale vložit do promptu, takto:
“I’d like an image of a tropical beach at sunset. Please use seed 12345.”
- Neumí priority (závorky v jiných AI), neumí ani váhy (význam)
- Neumí ani parametry jako ohnisková vzdálenost, ale můžete je popisovat slově, tedy něco jako :
“Photo taken with a wide-angle lens showing a vast landscape.”
“Portrait with a shallow depth of field highlighting the subject’s eyes.”
“Image captured with a long exposure showing the motion of stars.”
- Umí čitelné a srozumitelné krátké (ale fakt krátké) texty do výstupů. Občas tam ale udělá chybu, chybějící nebo zdvojující se písmena. Neumí háčky a čárky. A čím delší text, tím problematičtější výsledek (a nemá s tím nic společného s háčky a čárky).
- Trochu lépe to ale zvládá pokud text bude v angličtině. Chce to ale opravdu spíše krátké texty.
- Umí jen tři rozměry (viz samostatný dřívejší tip), takže nemůžete žádat poměry stran jako třeba v MidJourney
- Pozor na to, že chat (session) si prostě “pamatuje” vše co bylo předtím, takže když změníte generované téma, tak do toho bude zasahovat vše předchozí (styl, atd). Chcete-li generovat něco nového, tak je lepší zahájit nový chat, Případně zkuste “reset” pomocí:
“Let’s start fresh…”
“Begin a new session with…”
“Reset and let’s discuss…”
“Moving on to a different topic…”
- Dall-E-3 tvrdí, že umí rozpoznávat kompozici s pomocí (nejen) vlevo/vpravo. “city street where there is dog on left and cat on right, no cars” například funguje docela dobře. Jen tam tedy občas to auto prostě je. “park with cat on front of dog” funguje také dost dobře. “Dog with cat on top of his head” také dává dobré výsledky
- Umí konkrétní techniky kreslení a také umělecké styly, viz samostatný tip s přehledem v tomto seriálu
- Zvládá i perspektivu, a tady máte na výběr například
Bird’s-eye View | Worm’s-eye View | One-point Perspective | Two-point Perspective | Three-point Perspective |
Aerial View | Over-the-shoulder View | Profile View | Frontal View | Oblique View |
Close-up | Mid-shot | Long Shot | Extreme Close-up | Dutch Angle |
High Angle | Low Angle | Eye Level | Canted Angle (or Tilt) | Panoramic View |
Isometric View (příklad níže) | Fish-eye View | Cross-section View | Head-on View | Tilted Up View |
Tilted Down View | Side View | Overhead View | Ground Level View | Dynamic Perspective |
- Mělo by být možné i určovat specifický počet objektů, tedy něco jako “dvě děti”, “tři auta” a teoreticky i třeba “ulice, čtyři auta, autobus, pět chodců”. Skutečnost je ta, že třeba ten poslední příklad ukáže, že počítat stále spolehlivě neumí. Trochu lépe dopadne “tři děti a dva psi” (třeba hrající si v parku), ale různé iterace mají různorodé výsledky. Podobně “City street with only two pedestrians” většinou dopadne docela dobře, někdy se ale chodci poněkud množí
Další tipy týkající se ChatGPT
-
TIP#2761: Co umí (neumí) ChatGPT-4o mini vs. plná ChatGPT-4o
V červenci 2024 Open AI vypustili do světa ChatGPT-4o mini. Je tedy dobré vědět co neumí oproti plné a komplexnější ChatGPT-4o. Následjící tabulky pochází přímo od ChatGPT 4o mini. Související příspěvky TIP2567:…
-
TIP#2710: Co všechno je/není možné dělat v neplacené Chat GPT (GPT-4o)?
OpenAI v dubnu 2024 uvolnilo GPT-4o, pokročilejší verzi GPT4, ale hlavně verzi ve které se otevřela řada schopností, které doposud byly pouze v placené GPT Plus. Související příspěvky TIP#2621: ChatGPT? Google Bard/Gemini?…
-
TIP#2624: Další šetření času s Image Magick. Vytvoření stínu okolo/pod obrázkem
Dělal jsem to chvíli v Canva, ale je to trochu opruz. Otevřít Canva, nahrát obrázek, vyvolat menu, editace, efekty, stín, stáhnout obrázek. Pak jsem se šel ChatGPT zeptat, jestli nejde Canva nějak…
-
TIP#2621: ChatGPT? Google Bard/Gemini? Microsoft Bing/Copilot? Co vybrat?
Tohle je těžké. Máme tu v zásadě tři hlavní linie generativních umělých inteligencí. ChatGPT od OpenAI, Gemini (dříve Bard) od Google a Copilot (dříve Bing) od Microsoftu. Ta poslední je navíc postavená…
-
TIP#2619: Jak velké množství souborů třídit do složek podle roku a měsíce? A jak v tom pomůže ChatGPT?
Mám v počítači dvě složky, kde každý měsíc přibude spousta souborů a je velmi vhodné ty starší odsouvat někam do archivu, aby ta složka zůstala použitelná. Dlouho jsem to dělal ručně. Prostě…
-
TIP#2577: Jaké jsou nejvíce rozšířené AI mýty?
Další přírůstek do série “Mýty” se týká AI, věci co je aktuálně hodně v kurzu a také tomu odpovídá řada mýtů s tím spojených. Související příspěvky TIP#2396: Jak je to u ChatGPT…
-
TIP2567: Co je to OSINT a pomůže při téhle činnosti AI?
Občas na tuhle zkratku narážím, takže je možná dobré ji přidat k vysvětleným cizím slovíčkům. OSINT je vlastně tak trochu zkratka a znamená “Open Source Intelligence“. Související příspěvky TIP#2396: Jak je to…
-
TIP#2566: Odpovídá vám ChatGPT náhodné zmatené věci? Na češtinu anglicky? Co s tím?
Časem na to nejspíš narazíte. Pokud budete mít moc dlouho session (chat), tak po vložení delšího textu (třeba textu článku), vám místo smysluplné odpovědi dorazí něco zcela náhodného, nesmyslného a anglicky, ačkoliv…
-
TIP#2559: Má ChatGPT přístup k Internetu? Jak funguje Browse with Bing?
ChatGPT původně měla Browse with Bing jako volitelnou variantu, ale od listopadu 2023 je funkčnost přístupu k Internetu zahrnuta přímo v ChatGPT – nutno dodat, že jde o placenou (Plus) verzi a…
-
TIP#2557: Je možné použít ChatGPT/LLM pro kontrolu pravopisu? Jak na kontrolu (zejména českého) pravopisu?
Už jsme tu probírali, zda je vhodné ChatGPT používat pro překlady místo (zejména) DeepL a také zda jde použít pro doplnění nabodeníček (diakritiky). Takže je logické se ptát, zda můžete ChatGPT použít…
-
DALL-E 3 v ChatGPT: Jak vytvořit obrázek podle obrázku? (13)
Tohle je trochu složitější a ne 100% blbu vzdorné, ale dá se to použít snadno a občas i s velmi hezkými výsledky. Vyjdeme z toho, že máte obrázek či fotku a chcete…
-
TIP#2552: Jak na vlastní GPT (Custom GPT) v ChatGPT. Kompletní návod
Na počátku října ChatGPT získala novou verzi ve které můžete vytvářet vlastní GPT. Můžete to brát jako rozšířenější možnost custom instructions – určíte co má vaše GPT dělat, čím se má řídit,…
-
TIP#2550: DALL-E 3 v ChatGPT: Interní instrukce
Jedna z velmi zajímavých věcí na Dall E 3 je, že existují interní instrukce určující co se smí či nesmí generovat, jak se zachází s prompty, kolik obrázků lze žádat (v jednom…
-
TIP#2547: Jsou nějaké rozdíly v různých variantách ChatGPT? Včetně té v Bing Chat
Tohle byste měli vědět. Existuje ChatGPT 3.5 a ChatGPT 4 a je asi vcelku jasné, že mezi nimi jsou rozdíly. Ale co když v Chat GP4 aktivujete Browse with Bing, Data Analytics…
-
DALL-E 3 v ChatGPT: Příklady zadání (prompts), druhé pokračování (12)
Generujte si fraktály. Velmi detailní fotografie a skvělá pozadí. Jde generovat příběh? Engineering-style draft of. Design ikon a fontů. Pixel art. Související příspěvky TIP#2621: ChatGPT? Google Bard/Gemini? Microsoft Bing/Copilot? Co vybrat? TIP#2550:…