Přeskočit na obsah
@365tipu
  • Domů
    • Práce na dálku
    • Twitter for dummies
    • Jak na Mastodon
    • Facebook a marketing
    • Návod pro Instagram
    • Jak na LinkedIn
    • Bezpečný Internet
    • Bezpečnost pro novináře
    • Soukromí na Facebooku
    • Pomocník webdesignera
    • Jak na WordPress
    • Nepostradatelné software
      • Jak na Windows 11
      • Jak na Windows 10
      • Jak na iPhone/iPad
      • Jak na Mac OS
      • Jak na Apple TV/TV+
      • Jak na Apple Watch
      • Jak na Apple AirTag
      • Microsoft Office
      • Linux
    • Jazykový koutek
    • GTD
    • Filmy a TV seriály
    • Recenze
    • Chytrá domácnost
      • Chytrá domácnost
      • Jak na Google Home
      • Amazon Echo a Alexa
      • Apple HomePod
      • Jak na Raspberry Pi
      • Jak na QNAP NAS
      • Netatmo
    • Jak na Home Assistant
  • Všechny štítky
  • Odběr e-mailem
  • RSS/XML
  • Kontakt
    • Kontakt
    • Twitter
    • Facebook
    • BlueSky
    • Mastodon
      • Threads
    • Zásady Cookies (EU)
✉️        Pět velkých tipů týdně. Extra desítky menších. Některé jdou na socnety, ale všechny najdete jedině v newsletteru. 2x, týdně, středa a neděle. Starší čísla zde. Přihlášení ▶️
2. 11. 2023 podle 365tipů
Software

TIP#2544: Jak funguje GPT4V/GPT4Vision, ChatGPT co umí “vidět”. Kde to najdu?

GPT4V/GPT4Vision je další dílek schopností ChatGPT 4 – přidává možnost nahrát obrázek (vyfotit fotku) a umělá inteligence se pokusí zjistit co v něm je a umožní vám pokračovat v konverzaci – můžete se ptát, rozvíjet, vymýšlet, hledat souvislost, chtít nějaké další věci.

GPT4V je součástí výchozí ChatGPT4 a je nutné mít Plus, tedy placenou verzi – nemůžete mít aktivovaný Browsing with Bing ani Dall E, prostě jen přepnout na Default kliknutím v menu schovávajícím se pod “GPT-4” nahoře. Můžete na mobilu, ale i počítači. 

Tím získáte možnost nahrát obrázek (na počítači) nebo nahrát obrázek a vyfotit (na mobilu). Udělejte to a poté můžete rovnou odeslat, případně můžete ještě doplnit rovnou co chcete.  Pokud nic nedoplníte, může být odpověď v angličtině. 

Co to umí

Rozpoznává objekt i objekty, může jich být i více. Mohou to být i jen určité části objektů. 

Umí rozpoznávat texty, umí i češtinu. 

Představte si GPT4V jako novou generaci Google Lens (Goggles), která nejen že umí rozpoznávat co na obrázku je (zda lépe ale zatím nevíme), ale dokáže to i více analyzovat a poté v konverzací diskutovat a řešit další návazné věci. 

Některé schopností jsou ale dost neuvěřitelné. Opravdu totiž můžete ChagGPT “namířit” na vaši ledničku a zeptat se co v lednici máte a ona vám to velmi dobře popíše, upozorní i na některé zajímavější věci. Následně nabídne (třeba) i to, že vám může navrhnout pár jídel i s recepty. 

Dokáže i velmi detailně popsat co na fotce/obrázku je, jaké jsou tam barvy, jestli tam někde jsou i texty kterých jste si možná ani nevšimli (třeba podpis autora)

Je to stále ChatGPT, takže se předpokládá, že se i na to co v obrázku/fotce je budete ptát. Třeba bude-li tam auto, tak se můžete zeptat “jakou barvu má auto”. 

Je možné nahrát více než jeden obrázek a ChatGPT je porovná a řekne jaké jsou v nich rozdíly. 

Podrobné popisky můžete použít jako vstup pro DALL E 3. O vytvoření promptu můžete i požádat, ale (bude o tom samostatný tip) prompt je velmi krátký a spíše nedostatečný – míněno pro to, abyste nahráli obrázek/fotku a nechali si vygenerovat “totéž” v DALL E 3.

Co dál ještě umí?

  • Přečíst a vysvětlit grafy, infografiky
  • Z fotky více mincí či bankovek vám řekne kolik mají celkem hodnotu
  • Pozná filmy, herce
  • Pozná jídlo či pití a umí k němu dodat i recept
  • Zvládá i flóru a faunu a předměty, atd 
  • Umí poznat místa, města, pamětihodnosti, ale jsou tu nějaká “bezpečnostní” omezení a možnosti omezené tím, že to místo musí znát 
  • Poradí i zlepšení obrázku, můžete diskutovat estetiku
  • Poskytnout kontext, pokud je tedy nějaký možné odhalit
  • Pro předmět v obrázku umí definovat jeho umístěním v pixelech
  • Dokáže poznat rovnice a vůbec další matematické věci
  • Umí přečíst tabulku a poskytnout v tabulkové formě
  • Předložíte-li UI/web mockup, tak ho také umí analyzovat i zpracovat (níže na mockupu od WireframeSketcher, zda to ale funguje můžete zkusit sami)

Co neumí?

  • Odmítá pracovat s obličeji lidí. Odmítá občas i vůbec pracovat s fotkou člověka, ale dá se to obejít tím, že ji řeknete ať vynechá konkrétní osobu a použije abstrakci typu “mladá žena” (například). 
  • Odmítne i jakkoliv hodnotit vzhled lidí
  • Není možné použít pro řešení Captcha 
  • Prozatím není možné chat sdílet, stejně jako není možné sdílet DALL E 3 chaty
  • Obrázky neumí zpracovávat, tedy žádné úpravy, změny, barvy, filtry

Pozor na opravdu komplexní obrázky, čas od času se zpracování zakucká. Ale na druhou stranu dokáže vytahovat řadu detailů.

Další tipy týkající se ChatGPT

  • TIP#2964: Jak na Mac OS (a nejen tam) mít lokálně LLM (AI). DeepSeek, Llama a další?

    TIP#2964: Jak na Mac OS (a nejen tam) mít lokálně LLM (AI). DeepSeek, Llama a další?

    Chcete mít vlastní umělou inteligenci, která nepotřebuje přístup k Internetu a ani nic nikam neposílá a nevykecává? Je to vlastně docela snadné, prostě si budete LLM co to umožňují spouštět přímo v…

  • TIP#2941: ChatGPT má nový generátor fotek a obrázků (4o Image Generation). Je hodně jiný než DALL E 3. Jak na něj?

    TIP#2941: ChatGPT má nový generátor fotek a obrázků (4o Image Generation). Je hodně jiný než DALL E 3. Jak na něj?

    OpenAI pustila poslední týden v březnu 2025 do světa nový 4o generátor obrázků a fotografií. Je součástí 4o modelu a je zcela, ale opravdu zcela jiný než předchozí DALL E 3. Přístupný…

  • TIP#2917: Co bude AI (nejen) ve vyhledávání znamenat pro váš obsah (web, blog, atd).  Bude vedle SEO i GEO?  Delší čtení

    TIP#2917: Co bude AI (nejen) ve vyhledávání znamenat pro váš obsah (web, blog, atd).  Bude vedle SEO i GEO?  Delší čtení

    AI stále není schopna plně nahradit vyhledávání, ale k dispozici je ChatGPT Search, Perplexity a nový Grok 3 má DeepSearch, takže je zcela jisté, že vývoj bude pokračovat. Navíc už jen to,…

  • TIP#2892: Jak na iPhone vyvolat ChatGPT přímo hlasem (tedy jako když oslovíte Siri)

    TIP#2892: Jak na iPhone vyvolat ChatGPT přímo hlasem (tedy jako když oslovíte Siri)

    Chcete žít tak trochu blíže budoucnosti a na iPhone hlasem vyvolat ChatGPT v “voice” režimu a začít si s ní povídat? Není to nijak složité, ale nemůžete na to jít přes Apple…

  • TIP#2891: ChatGPT Tasks (Úkoly) a k čemu je to dobré?

    TIP#2891: ChatGPT Tasks (Úkoly) a k čemu je to dobré?

    ChatGPT doplnila beta verzi Tasks, kde můžete ChatGPT požádat, aby v určitý čas (jednorázově nebo opakovaně) spustila vám stanovený dotaz a poslala vám výsledek.  Související příspěvky TIP#2964: Jak na Mac OS (a…

  • TIP#2860: Jak na MacOS přidat stín k obrázkům (pokračování řešení pro Windows)

    TIP#2860: Jak na MacOS přidat stín k obrázkům (pokračování řešení pro Windows)

    Před mnoha měsíci jsem využil ChatGPT k vytvoření .cmd skriptu pro Windows, který k obrázku přidá stín pomocí imagemagick. Ušetřil mi záplavu času, protože to používám prakticky neustále pro sociální sítě i…

  • TIP#2850: Jak pracovat s ChatGPT rozhraním? Základy

    TIP#2850: Jak pracovat s ChatGPT rozhraním? Základy

    Překvapivě často narážím na to, že lidé nevědí jak ChatGPT funguje a jak pracovat s rozhraním, ať už webovým nebo mobilním (je prakticky shodné). Netuší ani základy, takže těmi začneme. A přidám…

  • TIP#2837: Jak funguje ChatGPT search. Základy i pokročile tipy. A proč to není náhrada klasického vyhledávače

    TIP#2837: Jak funguje ChatGPT search. Základy i pokročile tipy. A proč to není náhrada klasického vyhledávače

    ChatGPT má od konce října 2024 novou funkci ChatGPT search. Pokročilejší schopnost integrující vyhledávací nástroje (stále ale Bing) i další zdroje (včetně médií) pro získání aktuálních informací. Včetně velmi dobrého zdrojování. Prozatím…

  • TIP#2834: Advanced Voice Mode na ChatGPT. V čem je jiný než předchozí podoba a k čemu je to dobré?

    TIP#2834: Advanced Voice Mode na ChatGPT. V čem je jiný než předchozí podoba a k čemu je to dobré?

    Do ChatGPT v Evropě dorazilo Advanced Voice Mode. Doposud ho OpenAI klasicky blokovala, protože se dohadovala s EU o dalších podivnostech a šlo to jedině přes VPN. Od 24. října je ale…

  • TIP#2825: Jak funguje paměť (memory) v ChatGPT? Jak zjistit co se o vás naučila?

    TIP#2825: Jak funguje paměť (memory) v ChatGPT? Jak zjistit co se o vás naučila?

    Od jisté doby má ChatGPT paměť (Memory). Do ní si ukládá věci, které zjistila při vaši konverzaci. Paměť můžete potlačit (v rámci chatu) a můžete se i podívat, co se o vás…

  • TIP#2817: Jak používat dočasný (temporary) chat v ChatGPT a k čemu slouží

    TIP#2817: Jak používat dočasný (temporary) chat v ChatGPT a k čemu slouží

    ChatGPT je postavená na tom, že můžete vytvářet další a další chaty a poté se k nim případně i kdykoliv vracet a pokračovat v konverzaci. Osobně jich tam mám určitě přes tisícovku…

  • TIP#2808: Jak využít ChatGPT pro návrh témat pro váš web/blog, která ještě nemáte zpracovaná

    TIP#2808: Jak využít ChatGPT pro návrh témat pro váš web/blog, která ještě nemáte zpracovaná

    ChatGPT funguje docela dobře pro navrhování článků na určité téma. Už jsem to probíral v Poradí mi AI jaké další tipy mám psát pro 365tipů? Využití #ChatGPT pro návrh témat v trochu…

  • TIP#2806: Využijte novou “uvažující” ChatGPT o1 pro detailnější zadání pro DALL E 3

    TIP#2806: Využijte novou “uvažující” ChatGPT o1 pro detailnější zadání pro DALL E 3

    OpenAI na počátku září uvedla ChatGPT o1 (v preview podobě) se schopností uvažovat. A je docela zajímavé ji zkusit využit pro lepší návrhy zadání (promptu) pro DALL E 3 v klasické GPT…

  • TIP#2802: Co je to HAARP? A proč si někteří lidé myslí, že slouží USA k manipulaci počasí?

    TIP#2802: Co je to HAARP? A proč si někteří lidé myslí, že slouží USA k manipulaci počasí?

    Je to teď aktuální. dezoláti na sociálních sítích tvrdí, že za současné počasí a povodně mohou USA a jakýsi HAARP. Tak jsem se šel zeptat ChatGPT a výjimečně to nedám na JustIT.cz.…

  • TIP#2761: Co umí (neumí) ChatGPT-4o mini vs. plná ChatGPT-4o

    TIP#2761: Co umí (neumí) ChatGPT-4o mini vs. plná ChatGPT-4o

    V červenci 2024 Open AI vypustili do světa ChatGPT-4o mini. Je tedy dobré vědět co neumí oproti plné a komplexnější ChatGPT-4o. Následjící tabulky pochází přímo od ChatGPT 4o mini.  Související příspěvky TIP2567:…

1 2 3 … 5
Další stránka»

Související příspěvky

  • TIP#2964: Jak na Mac OS (a nejen tam) mít lokálně LLM (AI). DeepSeek, Llama a další?
  • TIP#2941: ChatGPT má nový generátor fotek a obrázků (4o Image Generation). Je hodně jiný než DALL E 3. Jak na něj?
  • TIP#2891: ChatGPT Tasks (Úkoly) a k čemu je to dobré?

AI ChatGPT Software Umělá inteligence

Předchozí článekTIP#2543: Co je to Prompt Injection u AIDalší článek TIP#2545: Kde v Linkedin najdu naplánované příspěvky?

Nejnovější příspěvky

Nákupní rádce (44): PlayStation 5 Pro. Co si pořídit pro 3D tisk. To nejlepší co jsem si koupil z Ali

TIP#2971: Obtěžuje vás v Gmailu Gemini? Můžete to vypnout a mít klid

TIP#2970: Jak v terminálu v Linuxu otevřít či si prohlédnout soubor?

TIP#2969: K čemu všemu se hodí, dá používat, NAS

TIP#2968: Jak je to s to přednosti matematických operací?

TIP#2967: Proč nejít “blogovat” na Seznam Médium

TIP#2966: Jak v iPhone (iPadu) použít SD/microSD kartu?

Nákupní rádce (43): Dost boží XXL sada fixů. Gola sada. Ukázka malé PC sestavy pro NAS. Placatka

TIP#2965: Má iPhone (iPad)  “guest mode”? Můžete ho nějak na chvíli bezpečně půjčit někomu jinému? 

TIP#2964: Jak na Mac OS (a nejen tam) mít lokálně LLM (AI). DeepSeek, Llama a další?

Nejčtenější

Přispět na provoz můžete

Přispějte. 500 Kč můžete změnit dle vlastního uvážení. Z částky zaplatíme DPH a pochopitelně daně platbou na účet 331049001/5500, spec. symbol 365. Částku si můžete změnit. Z platby odvádíme DPH a daníme ji.

... nebo placeným odběrem

Staňte se platícím odběratelem newsletteru. 5 USD/měsíc, 50 USD/rok nebo dle vlastního uvážení od 100 USD/rok. Každou středu a neděli nálož informací.

Kontakt a tak

Kontakt: 365tipu@gmail.com

Veškerý obsah zde uveřejněný je CC-BY-NC-SA

Oznámení