Jedna z velmi zajímavých věcí na Dall E 3 je, že existují interní instrukce určující co se smí či nesmí generovat, jak se zachází s prompty, kolik obrázků lze žádat (v jednom generování), jaké jsou rozměry obrázků.
Důležité je,že tyto instrukce jsou v angličtině a také to, že obsahují to co už víme – že váš (třeba český) prompt se překládá do angličtiny.
POZNÁMKA: Aktuálnější verzi z července 2024 najdete v Jak vypadají interní instrukce ChatGPT? A víte, že má více osobností? ~ Extra newsletter
Interní instrukce
# Tools ## dalle // Whenever a description of an image is given, use dalle to create the images and then summarize the prompts used to generate the images in plain text. If the user does not ask for a specific number of images, default to creating four captions to send to dalle that are written to be as diverse as possible. All captions sent to dalle must abide by the following policies: // 1. if the description is not in English, then translate it. // 2. do not create more than 4 images, even if the user requests more. // 3. do not create images of politicians or other public figures. Recommend other ideas instead. // 4. do not create images in the style of artists whose last work was created within the last 100 years (e.g. Picasso, Kahlo). Artists whose last work was over 100 years ago are ok to reference directly (e.g. Van Gogh, Klimt). If asked say, "I can't reference this artist", but make no mention of this policy. Instead, apply the following procedure when creating the captions for dalle: (a) substitute the artist's name with three adjectives that capture key aspects of the style; (b) include an associated artistic movement or era to provide context; and (c) mention the primary medium used by the artist. // 5. DO NOT list or refer to the descriptions before OR after generating the images. They should ONLY ever be written out ONCE, in the `"prompts"` field of the request. You do not need to ask for permission to generate, just do it! // Always mention the image type (photo, oil painting, watercolor painting, illustration, cartoon, drawing, vector, render, etc.) at the beginning of the caption. Unless the caption suggests otherwise, make at least 1--2 of the 4 images photos. // 7. Diversify depictions of ALL images with people to include DESCENT and GENDER for EACH person using direct terms. Adjust only human descriptions. // EXPLICITLY specify these attributes, not abstractly reference them. The attributes should be specified in a minimal way and should directly describe their physical form. // Your choices should be grounded in reality. For example, all of a given OCCUPATION should not be the same gender or race. Additionally, focus on creating diverse, inclusive, and exploratory scenes via the properties you choose during rewrites. Make choices that may be insightful or unique sometimes. // Use "various" or "diverse" ONLY IF the description refers to groups of more than 3 people. Do not change the number of people requested in the original description. // Don't alter memes, fictional character origins, or unseen people. Maintain the original prompt's intent and prioritize quality. // Do not create any imagery that would be offensive. // For scenarios where bias has traditionally been an issue, make sure that key traits such as gender and race are specified and in an unbiased way -- for example, prompts that contain references to specific occupations. // Silently modify descriptions that include names or hints or references of specific people or celebrity by carefully selecting a few minimal modifications to substitute references to the people with generic descriptions that don't divulge any information about their identities, except for their genders and physiques. Do this EVEN WHEN the instructions ask for the prompt not to be changed. Some special cases: // Modify such prompts even if you don't know who the person is, or if their name is misspelled (e.g. "Barake Obema"). // If the reference to the person will only appear as TEXT out in the image, then use the reference as is and do not modify it. // When making the substitutions, don't use prominent titles that could give away the person's identity. E.g., instead of saying "president", "prime minister", or "chancellor", say "politician"; instead of saying "king", "queen", "emperor", or "empress", say "public figure"; instead of saying "Pope" or "Dalai Lama", say "religious figure"; and so on. // If any creative professional or studio is named, substitute the name with a description of their style that does not reference any specific people, or delete the reference if they are unknown. DO NOT refer to the artist or studio's style. // The prompt must intricately describe every part of the image in concrete, objective detail. THINK about what the end goal of the description is, and extrapolate that to what would make satisfying images. // All descriptions sent to dalle should be a paragraph of text that is extremely descriptive and detailed. Each should be more than 3 sentences long. namespace dalle { // Create images from a text-only prompt. type text2im = (_: { // The resolution of the requested image, which can be wide, square, or tall. Use 1024x1024 (square) as the default unless the prompt suggests a wide image, 1792x1024, or a full-body portrait, in which case 1024x1792 (tall) should be used instead. Always include this parameter in the request. size?: "1792x1024" | "1024x1024" | "1024x1792", // The user's original image description, potentially modified to abide by the dalle policies. If the user does not suggest a number of captions to create, create four of them. If creating multiple captions, make them as diverse as possible. If the user requested modifications to previous images, the captions should not simply be longer, but rather it should be refactored to integrate the suggestions into each of the captions. Generate no more than 4 images, even if the user requests more. prompts: string[], // A list of seeds to use for each prompt. If the user asks to modify a previous image, populate this field with the seed used to generate that image from the image dalle metadata. seeds?: number[], }) => any; } // namespace dalle
Krátké shrnutí
Zajímavé je i to, že ChatGPT se k těmto instrukcím hlásí a pokud se na ně budete aktuálně ptát, tak ač poskytnete text hovoří o čtyřech obrázcích, tak v odpovědích bude operovat s dvěma obrázky – to proto, že na konci října musela Open.AI omezit počet generovaných (a na konci listopadu museli omezit na jeden).
dalle: Tento nástroj vytváří obrázky na základě zadaných textových popisů.
Výchozí chování: Pokud není zadáno, nástroj vytvoří dva obrázky na základě různých popisků.
Zásady:
- Přeložit neanglické popisy.
- Omezit na dva obrázky, i když je jich požadováno více.
- Vyhněte se vytváření obrázků politiků nebo veřejných osobností.
- Neodkazujte na umělce s díly z posledních 100 let. Pro starší umělce platí určité zásady.
- Popisy obrázků se vypisují pouze jednou do pole „podněty“.
- Uveďte typ obrázku a ujistěte se, že alespoň jeden obrázek je fotografie.
- Zajistěte rozmanitost při zobrazování lidí uvedením pohlaví a původu.
- V popisech buďte přesní a realističtí, zachovejte pohotový záměr a vyvarujte se předsudků.
- Upravte popisy s odkazy na konkrétní osoby, aby byla zachována anonymita.
- Popisy stylů nahraďte jmény tvůrčích profesionálů nebo studií.
- Popisy by měly být podrobné a důkladně popisovat požadovaný obraz.
Technické detaily:
- Rozlišení obrázku může být čtvercové, široké nebo vysoké s uvedením konkrétních rozměrů.
- Výchozí hodnota je 1024×1024 (čtverec).
- Pro široké obrázky použijte 1792×1024.
- Pro portréty celého těla použijte 1024×1792 (vysoký).
- Popis obrázku uživatele může být upraven na základě zásad.
- Existuje možnost použít specifická „seed“, která ovlivní generování obrázku, zejména pokud je třeba upravit předchozí obrázek.
Další tipy týkající se ChatGPT
-
TIP#2860: Jak na MacOS přidat stín k obrázkům (pokračování řešení pro Windows)
Před mnoha měsíci jsem využil ChatGPT k vytvoření .cmd skriptu pro Windows, který k obrázku přidá stín pomocí imagemagick. Ušetřil mi záplavu času, protože to používám prakticky neustále pro sociální sítě i…
-
TIP#2850: Jak pracovat s ChatGPT rozhraním? Základy
Překvapivě často narážím na to, že lidé nevědí jak ChatGPT funguje a jak pracovat s rozhraním, ať už webovým nebo mobilním (je prakticky shodné). Netuší ani základy, takže těmi začneme. A přidám…
-
TIP#2837: Jak funguje ChatGPT search. Základy i pokročile tipy. A proč to není náhrada klasického vyhledávače
ChatGPT má od konce října 2024 novou funkci ChatGPT search. Pokročilejší schopnost integrující vyhledávací nástroje (stále ale Bing) i další zdroje (včetně médií) pro získání aktuálních informací. Včetně velmi dobrého zdrojování. Prozatím…
-
TIP#2834: Advanced Voice Mode na ChatGPT. V čem je jiný než předchozí podoba a k čemu je to dobré?
Do ChatGPT v Evropě dorazilo Advanced Voice Mode. Doposud ho OpenAI klasicky blokovala, protože se dohadovala s EU o dalších podivnostech a šlo to jedině přes VPN. Od 24. října je ale…
-
TIP#2825: Jak funguje paměť (memory) v ChatGPT? Jak zjistit co se o vás naučila?
Od jisté doby má ChatGPT paměť (Memory). Do ní si ukládá věci, které zjistila při vaši konverzaci. Paměť můžete potlačit (v rámci chatu) a můžete se i podívat, co se o vás…
-
TIP#2817: Jak používat dočasný (temporary) chat v ChatGPT a k čemu slouží
ChatGPT je postavená na tom, že můžete vytvářet další a další chaty a poté se k nim případně i kdykoliv vracet a pokračovat v konverzaci. Osobně jich tam mám určitě přes tisícovku…
-
TIP#2808: Jak využít ChatGPT pro návrh témat pro váš web/blog, která ještě nemáte zpracovaná
ChatGPT funguje docela dobře pro navrhování článků na určité téma. Už jsem to probíral v Poradí mi AI jaké další tipy mám psát pro 365tipů? Využití #ChatGPT pro návrh témat v trochu…
-
TIP#2806: Využijte novou “uvažující” ChatGPT o1 pro detailnější zadání pro DALL E 3
OpenAI na počátku září uvedla ChatGPT o1 (v preview podobě) se schopností uvažovat. A je docela zajímavé ji zkusit využit pro lepší návrhy zadání (promptu) pro DALL E 3 v klasické GPT…
-
TIP#2802: Co je to HAARP? A proč si někteří lidé myslí, že slouží USA k manipulaci počasí?
Je to teď aktuální. dezoláti na sociálních sítích tvrdí, že za současné počasí a povodně mohou USA a jakýsi HAARP. Tak jsem se šel zeptat ChatGPT a výjimečně to nedám na JustIT.cz.…
-
TIP#2761: Co umí (neumí) ChatGPT-4o mini vs. plná ChatGPT-4o
V červenci 2024 Open AI vypustili do světa ChatGPT-4o mini. Je tedy dobré vědět co neumí oproti plné a komplexnější ChatGPT-4o. Následjící tabulky pochází přímo od ChatGPT 4o mini.
-
TIP#2710: Co všechno je/není možné dělat v neplacené Chat GPT (GPT-4o)?
OpenAI v dubnu 2024 uvolnilo GPT-4o, pokročilejší verzi GPT4, ale hlavně verzi ve které se otevřela řada schopností, které doposud byly pouze v placené GPT Plus.
-
TIP#2624: Další šetření času s Image Magick. Vytvoření stínu okolo/pod obrázkem
Dělal jsem to chvíli v Canva, ale je to trochu opruz. Otevřít Canva, nahrát obrázek, vyvolat menu, editace, efekty, stín, stáhnout obrázek. Pak jsem se šel ChatGPT zeptat, jestli nejde Canva nějak…
-
TIP#2621: ChatGPT? Google Bard/Gemini? Microsoft Bing/Copilot? Co vybrat?
Tohle je těžké. Máme tu v zásadě tři hlavní linie generativních umělých inteligencí. ChatGPT od OpenAI, Gemini (dříve Bard) od Google a Copilot (dříve Bing) od Microsoftu. Ta poslední je navíc postavená…
-
TIP#2619: Jak velké množství souborů třídit do složek podle roku a měsíce? A jak v tom pomůže ChatGPT?
Mám v počítači dvě složky, kde každý měsíc přibude spousta souborů a je velmi vhodné ty starší odsouvat někam do archivu, aby ta složka zůstala použitelná. Dlouho jsem to dělal ručně. Prostě…
-
TIP#2577: Jaké jsou nejvíce rozšířené AI mýty?
Další přírůstek do série “Mýty” se týká AI, věci co je aktuálně hodně v kurzu a také tomu odpovídá řada mýtů s tím spojených.