V půlce října do ChatGPT dorazila DALL-E-3, tedy generativní AI. Ta co je už pár týdnů v Bing Create. Musíte mít placenou ChatGPT a v menu GPT-4 aktivovat, že chcete generovat obrázky.
Kompozice
- Po určité době asi zjistíte, že má velmi v oblibě vystředěnou kompozici a umístění významnějších věcí doprostřed. Nepomáhá jí říkat aby byla asymetrická, ale tohle je asi věc k dalšímu zkoumání (a byla o tom řeč i jiném dřívějším tipu). ChatGPT každopádně tvrdí, že umí následující kompozice
- Rule of Third
- Golden Ratio (or Phi Grid)
- Diagonal Lines
- Leading Lines
- Frame within a Frame
- Symmetry
- Asymmetry
- Central Composition
- Negative Space
- Foreground Interest
- Patterns and Repetition
- Juxtaposition
- Rule of Odds
- Fill the Frame
- Jenže, i když si řeknete o : Ok, make me wide picture od dog in park, each picture in different composition – use Diagonal Lines, Negative Space, Juxtaposition and Fill the Frame, tak to stále je všechno středěné, byť kompozice asi každá jiná.
- Pro lepší ilustraci tedy zkusme: OK, take number three and regenerate with those compositions: Diagonal Lines, Negative Space, Juxtaposition and Fill the Frame
- Úsměvné je, že když se ptáte jak se středění vyvarovat, tak nabídne využít Rule of Thirds. A u následujících obrázků suverénně tvrdí, že psiska jsou levé či pravé třetině. Ale neřekl bych že jsou.
- Takže otázku kompozice asi zatím můžeme uzavřít jako “nefunguje” a doufat, že je to chyba, kterou někdy napraví. A jasně, zkoušel jsem toho mnohem více než pár výše uvedených.
Co DALL E 3 neumí
- Dall E 3 (ChatGPT) neumí upscaling, tady musíte mít vlastní řešení (Upscayl a další)
- Není ani možné nahrát obrázek, natož ho měnit/doplňovat ho
- Nelze určovat Inference Steps ani Guidance Scale
- Neumí “negative prompt” tak jako (například) Stable Diffusion
- V tipu o promptech/zadáních je i řeč o tom, že neumí hloubky ostrosti, volné poměry stran (protože umí pevně jen tři velikosti) ani zadat rozměry v bodech
- Neumí se zdržet zadání zasahování do zadání, takže občas zjistíte, že vaše zadání zásadně mění, zpravidla i tak, že jde o dodání “politické korektnosti”
TIP: Při psaní tohoto tipů jsem zkoušel řadu velmi různorodých věcí. Mrkněte do Hrátky s DALL E 3 v ChatGPT. Hodně různorodých promptů s ukázkou výsledků pro množství zadání (promptů) i výsledků.
- Jakkoliv chatGPT tvrdí, že když si řeknete o “PNG with transparent background” tak ho vytvoří, tak tomu tak není. Místo průhledného pozadí tam sází poněkud chaotické čtverečky
- Prozatím není možné sdílet konverzaci ve které jsou obrázky. Trochu škoda, ale asi to časem dorazí. [16.10.23]
Nejasnosti
- Halucinace? Ale samozřejmě. Následující prompt například vytváři leccos, jen ne ženu natož podobnou Leie. Problém je ale v češtině, protože když totéž poskytnete v angličtině, tak výsledek smysl dává (a dokonce i odmítá generovat, protože práva, což ostatně udělá běžně i v češtině).
Prosím o olejomalbu postavy vypadající jako princezna leia (princess leia, leia organa), na dřevě inspirovanou renesančním portrétem ve stylu sfumato. Obraz by měl zachytit tajemnou a klidnou náladu s jemným úsměvem a vzdáleným krajinářským pozadím. Na široko.
- K tomu předchozímu ještě poznámka. Ne nutně vám to musí udělat totéž jako mě. Může mezitím dojít k nápravě, mohlo jít o chybu či přetížení. Mohlo jít o vliv předchozích generování.
- Jak říct že něco ve výstup nemá být? Trochu komplikované, sama ChatGPT tvrdí, že máte napsat velkými písmeny co nechcete, tedy třeba “NO BANANAS” nebo to uvést jako “absolutely no bananas”. Někdy to snad i zabare, ale zkušenost je že spíše ne
TIP: Nové Hrátky s DALL E 3 v ChatGPT: Vlevo ani vpravo prostě nedává a je potřeba to vědět, protože podle toho musíte pracovat s prompty (a mít nekonečnou trpělivost, ehm)
Další tipy týkající se ChatGPT
-
TIP#2761: Co umí (neumí) ChatGPT-4o mini vs. plná ChatGPT-4o
V červenci 2024 Open AI vypustili do světa ChatGPT-4o mini. Je tedy dobré vědět co neumí oproti plné a komplexnější ChatGPT-4o. Následjící tabulky pochází přímo od ChatGPT 4o mini. Související příspěvky TIP2567:…
-
TIP#2710: Co všechno je/není možné dělat v neplacené Chat GPT (GPT-4o)?
OpenAI v dubnu 2024 uvolnilo GPT-4o, pokročilejší verzi GPT4, ale hlavně verzi ve které se otevřela řada schopností, které doposud byly pouze v placené GPT Plus. Související příspěvky TIP#2621: ChatGPT? Google Bard/Gemini?…
-
TIP#2624: Další šetření času s Image Magick. Vytvoření stínu okolo/pod obrázkem
Dělal jsem to chvíli v Canva, ale je to trochu opruz. Otevřít Canva, nahrát obrázek, vyvolat menu, editace, efekty, stín, stáhnout obrázek. Pak jsem se šel ChatGPT zeptat, jestli nejde Canva nějak…
-
TIP#2621: ChatGPT? Google Bard/Gemini? Microsoft Bing/Copilot? Co vybrat?
Tohle je těžké. Máme tu v zásadě tři hlavní linie generativních umělých inteligencí. ChatGPT od OpenAI, Gemini (dříve Bard) od Google a Copilot (dříve Bing) od Microsoftu. Ta poslední je navíc postavená…
-
TIP#2619: Jak velké množství souborů třídit do složek podle roku a měsíce? A jak v tom pomůže ChatGPT?
Mám v počítači dvě složky, kde každý měsíc přibude spousta souborů a je velmi vhodné ty starší odsouvat někam do archivu, aby ta složka zůstala použitelná. Dlouho jsem to dělal ručně. Prostě…
-
TIP#2577: Jaké jsou nejvíce rozšířené AI mýty?
Další přírůstek do série “Mýty” se týká AI, věci co je aktuálně hodně v kurzu a také tomu odpovídá řada mýtů s tím spojených. Související příspěvky TIP#2396: Jak je to u ChatGPT…
-
TIP2567: Co je to OSINT a pomůže při téhle činnosti AI?
Občas na tuhle zkratku narážím, takže je možná dobré ji přidat k vysvětleným cizím slovíčkům. OSINT je vlastně tak trochu zkratka a znamená “Open Source Intelligence“. Související příspěvky TIP#2396: Jak je to…
-
TIP#2566: Odpovídá vám ChatGPT náhodné zmatené věci? Na češtinu anglicky? Co s tím?
Časem na to nejspíš narazíte. Pokud budete mít moc dlouho session (chat), tak po vložení delšího textu (třeba textu článku), vám místo smysluplné odpovědi dorazí něco zcela náhodného, nesmyslného a anglicky, ačkoliv…
-
TIP#2559: Má ChatGPT přístup k Internetu? Jak funguje Browse with Bing?
ChatGPT původně měla Browse with Bing jako volitelnou variantu, ale od listopadu 2023 je funkčnost přístupu k Internetu zahrnuta přímo v ChatGPT – nutno dodat, že jde o placenou (Plus) verzi a…
-
TIP#2557: Je možné použít ChatGPT/LLM pro kontrolu pravopisu? Jak na kontrolu (zejména českého) pravopisu?
Už jsme tu probírali, zda je vhodné ChatGPT používat pro překlady místo (zejména) DeepL a také zda jde použít pro doplnění nabodeníček (diakritiky). Takže je logické se ptát, zda můžete ChatGPT použít…
-
DALL-E 3 v ChatGPT: Jak vytvořit obrázek podle obrázku? (13)
Tohle je trochu složitější a ne 100% blbu vzdorné, ale dá se to použít snadno a občas i s velmi hezkými výsledky. Vyjdeme z toho, že máte obrázek či fotku a chcete…
-
TIP#2552: Jak na vlastní GPT (Custom GPT) v ChatGPT. Kompletní návod
Na počátku října ChatGPT získala novou verzi ve které můžete vytvářet vlastní GPT. Můžete to brát jako rozšířenější možnost custom instructions – určíte co má vaše GPT dělat, čím se má řídit,…
-
TIP#2550: DALL-E 3 v ChatGPT: Interní instrukce
Jedna z velmi zajímavých věcí na Dall E 3 je, že existují interní instrukce určující co se smí či nesmí generovat, jak se zachází s prompty, kolik obrázků lze žádat (v jednom…
-
TIP#2547: Jsou nějaké rozdíly v různých variantách ChatGPT? Včetně té v Bing Chat
Tohle byste měli vědět. Existuje ChatGPT 3.5 a ChatGPT 4 a je asi vcelku jasné, že mezi nimi jsou rozdíly. Ale co když v Chat GP4 aktivujete Browse with Bing, Data Analytics…
-
DALL-E 3 v ChatGPT: Příklady zadání (prompts), druhé pokračování (12)
Generujte si fraktály. Velmi detailní fotografie a skvělá pozadí. Jde generovat příběh? Engineering-style draft of. Design ikon a fontů. Pixel art. Související příspěvky TIP#2621: ChatGPT? Google Bard/Gemini? Microsoft Bing/Copilot? Co vybrat? TIP#2550:…