Vydal jsem se zkoumat něco co nevyhnutelně přichází. Digitální klon mého vlastního hlasu, který umožní vytvářet podcast. Aniž bych ho namluvil, řešil kvalitu, šum a další věci. Chtěl jsem vědět zda to jde a co to obnáší. A tady máte základní a zásadní postřehy.
Kvalita
Tohle je jasné. Kvalita výsledného zvuku je nesrovnatelná s přímým natáčením podcastů a můžete se vyhnout potřebě čištění audia po natočení. V klasickém podcastu vždy bude jaksi něco navíc. A pokud nemáte profesionální podmínky, tak budete zápasit s šumem, rušivými vlivy, hlasitostí a dalšími komplikacemi.
Ušetří to čas právě za další “post processing”, tedy zpracování po samotném nahrání. O občasném nepovedeném namluvení a natáčení znovu ani nemluvě.
Posuďte ostatně sami na několika podcastech
- Jaká je budoucnost podcastů s klonováním hlasů pomocí AI?
- Příběh ICQ. Namluvený mým digitálním já a napsaný ChatGPT. Experiment pokračuje
- Vše to bylo, je a bude jenom hra. Meta se bude z vašich dat učit, ať to odmítáte jakkoliv
- Apple Inteligence? Máte? A mohli bychom ji vidět?
Korektury a styl
Podcast s pomocí digitálního já se tvoří dost jinak, než když ho namlouváte. Je nutné předem napsat kompletní text celého podcastu a má to hodně jiných aspektů.
- Je to daleko méně tolerantní na překlepy, chyby, špatně sestavené věty. Ve výsledku tak budete věnovat čas navíc jednomu či více kolům oprav – což bude znamenat si celý výsledek poslechnou, opravit v originále, opravit v aplikaci na generování a znovu generovat.
- Budete se muset naučit vhodný styl pro psaní. Chcete totiž něco co funguje dobře vyprávěné, čtené nahlas, ale to není totéž jako text co píšete pro klasické čtení si. Bude vám také chvíli trvat, než se naučíte některé vhodné (a nevhodné) vychytávky
- Některá slova neumí digitální dvojče vyslovovat dobře, je občas třeba si trochu hrát s interpunkcí, dělením vět, odstavci. Neumí odrážky, logicky, protože ty jsou vizuální pomůcka pro psaný text.
- Zjistíte i to, že je vhodné vynechávat některé znaky. Třeba to, že to nedokázalo správně vyslovit #tyden, nebo vhodně skloňovat číslovky.
- Přijdete i na to, že nadpisy, tak nutné pro čitelnost textu, v mluvené podobě buď je lépe vynechat, nebo řešit nějak jinak (viz dále)
Přirozenost
Tohle bude hodně záležet na technickém, řešení, to zkoumané od Elevenlabs stačí pár minut vašeho hlasu a výsledné digitální dvojče je dobré, působí přirozeně, byť občas to naráží na zádrhele při generování – mění se rychlost “mluvení” aniž by byl zjevný důvod, zejména..
Popravdě, byl jsem velmi mile překvapen, že to tak dobře zvládá češtinu. A dokážu si představit, že toto je cesta k trvalému intenzivnímu využívání.
Výhodu najdete i v tom, že Elevenlabs mají v repertoáru více hlasů, sice asi více strojových, ale dost se to hodilo třeba k tomu, že nadpisy jsem nechal předčítat jiným hlasem.
Celý ten projev působí poměrně přirozeně, ale nemůžete po něm chtít takové ty vychytávka jako dramatický přednes. Prostě pokročilejší věci, které lidský vypravěč udělá snadno se tedy dělají obtížně.
Cena
Elevenlabs má první přijatelný plán za 22 USD měsíčně – přijatelný hlavně proto, že jde zhruba o 120 minut audia (100 tisíc znak) na měsíc. Levnější, pěti dolarový, je malý – 30 minut/30 tisíc znaků, příliš málo, spíš jen na malé občasné věci, nebo na namlouvání krátkých videí pro Instagram/TikTok.
Další se liší nejen výrazně vyšší délkou/počty, ale mají i vyšší kvalitu a nějaké další vychytávky.
Pro představu, Apple Inteligence? Máte? A mohli bychom ji vidět? je 11 minut z 9 700 znaků. #TYDEN k poslouchání býval 15 minut, jednou týdně, takže měsíčně by to odhadem mohlo být 90 000 znaků a 90 minut.
Háček se může objevit v tom, že nejde o výsledek, ale i všechny korektury, opravy a změny ubírají z dostupného počtu znaků.
Délka textu vs. délka podcastu
Už jsem výše trochu naznačil jak to je a cenový model to asi také tak nějak naznačuje, co tisíc znaků, to jedna minuta podcastu.
Prakticky to znamená (a bylo to trochu překvapivé, když jsem to udělal poprvé) napíšete něco co vypadá jako dost dlouhý text, ale dostanete jenom krátké povídání.
Realita prostě je, když podcast přímo namlouváte, tk je daleko snazší namluvit třeba právě oněch 15 minut, které jsem u #tyden většinou dosáhl. Pokud to máte psát předem, tak je to vlastně něco jako 13 až 15 000 znaků. A vy co píšete, tak víte, že to je poměrně hodně.
Možná využití
Na počátku jsem si říkal, že by bylo hezké mít na #tyden snazší cestu, jak “namluvit” onu (alespoň) jednu epizodu týdně – klasická cesta totiž naráží na to, že nemám studio ani profesionální vybavení. Mít by znamenalo další náklady finanční i časové. Digitální hlasové já by určitě používat šlo, jen ta část ušetřeného času se ztratí v jiných věcech, které je potřeba dělat.
Ale možností kde digitální já, či obecně text to speech, využít je víc
- Podcasty
- Audio verze článku, zpráv, zpráviček
- Audio knihy
- Hlas pro video na sociální sítě i jinde
- Hlasová upozornění z aplikací, informačních systémů
- Předčítání e-mailů, SMS. včetně správného hlasu odesílatele
- Hlášení stanic v dopravě, obchodech, atd
- Vyjádření (tiskového mluvčí) pro média
- V pokročilé podobě dabing
Budu pokračovat?
Přiznám se, že zatím nevím. Chtěl jsem najít cestu jak ušetřit hodně času eliminací nahrávání a potřeby úprav výsledku, ale to tato cesta řeší jen částečně.
Pokud by existovalo bezplatné řešení, ideálně navíc i lokální (tedy na vlastním počítači), tak by to bylo více lákavé, protože by to nic nestálo.
Původní #tyden tak jako tak vznikl, protože jsem prostě chtěl vědět jak dělat podcast, Od nuly, amatérsky, pro zábavu. Zkoumání digitálního hlasového já do toho nakonec dost dobře zapadlo.
Ale jestli a jak s tím budu pokračovat? Nevím.
Další tipy týkající se Podcastů
-
TIP#2749: Konec experimentu s hlasovým digitálním já. Praktické postřehy a proč (prozatím) skončil
Vydal jsem se zkoumat něco co nevyhnutelně přichází. Digitální klon mého vlastního hlasu, který umožní vytvářet podcast. Aniž bych ho namluvil, řešil kvalitu, šum a další věci. Chtěl jsem vědět zda to…
-
TIP#2606: Jak na marketing podcastu? Co dělat, abyste rostli
Máte podcast? A chcete nabírat nové posluchače? Nebude to nic jednoduchého, jako ve všem potřebujete kupu marketingových aktivit, ideálně i nějaké ty peníze. A budete neustále narážet na to, že podcasty jsou…
-
TIP#2366: Jak otestovat, jestli mi (správně) funguje mikrofon?
Jedna z věcí při nahrávání #TYDEN k poslouchání dost nutná před samotným záznamem nové epizody je … otestovat jestli funguje mikrofon. A nejen jestli funguje, ale také jak funguje. Jednu epizodu jsem…
-
TIP#2344: Přepis (podcastu) s pomocí Whisper? Ukážeme si na příkladu důležitého tématu a zjistíte, jak na Whisper na Macu, Windows a v Google Colab
Na konci prosince se #TYDEN k poslouchání věnoval důležitému tématu. Podcast Zapamatujte si: Když něco (na Internetu) prodáváte, kupující platí vám. Ne vy jemu! má patnáct minut. A protože se čerstvě objevila…
-
TIP#2344: Co podcastové platformy/aplikace prozradí o poslechovosti a posluchačích?
Narážím na to velmi často. Zeptáte se tvůrců podcastu na poslechovost a dostanete jen záplavu výmluv a zavádějících tvrzení. Přitom každá z platforem nabízí čísla, která není problém poskytnout. Tedy samozřejmě asi…
-
TIP#2298: Jak dostat podcast do Pocket Casts?
Mít podcast dostupný na nejpoužívanějších platformách (Google, Apple) či aplikacích (Spotify) je důležité. K velké trojce ale patří i Pocket Casts. Open Source aplikace, vlastněná Automattic, dostupná zdarma – tedy mobilní aplikace,…
-
TIP#2270: Začínáte s podcastem? Kupa postřehů, které vám pomohou
Prostě jsem si jednoho dne řekl, že nahraju první podcast. Měsíce jsem o tom přemýšlel a vždy zvítězila klasická lenost. A obava z nového. Jenže Substack mi to komplikoval tím, že je…
-
TIP#2265: Dostat podcast do Google, třetí místo, kde by neměl chybět
#TYDEN k poslouchání je v Spotify, Apple a pochopitelně i v Google. Tři základní podcastové platformy, kam byste svůj podcast měli dostat. Lidé totiž podcasty poslouchají v aplikacích a ty nejrozšířenější jsou…
-
TIP#2261: Dostat podcast do Apple? Samozřejmě dost nutnost
Pojďme pokračovat v důležitých věcech pro ty, kdo se pustí do pocastů. Po “návodu” jak mít podcast ve Spotify se vydáme do jablečného světa. To proto, že Apple má vlastní aplikaci Podcasty/Podcasts…
-
TIP#2250: Dostat podcast na Spotify? Měli byste. A nejenom tam
Když jsem se někdy zhruba před měsícem pustil do podcastů, přineslo to mnoho nových výzev, které jako podcasteři budete také řešit. Jedna z nich je, že musíte váš podcast dostat na “podcastové…
-
TIP#2243: Podcast v Substacku? Je to nesmírně snadné. Ale až příliš jednoduché
Substack používám pro newslettery už delší dobu. @rychlofky i @kolotipy tam mají už slušný počet vydaných týdenních newsletterů. Umí ale i podcasty a dlouho jsem to chtěl zkusit.
-
TIP#2209: Proč prakticky vůbec neposlouchám podcasty? A proč podcasty zůstávají niché
V roce 2021 celosvětově poslouchalo podcasty přes 383 milionů lidí, tento rok by to mělo být 424.4 milionu lidí, 10.6% meziroční růst (slušný, nutno dodat). Záleží, který zdroj pro celkový počet použijete,…
-
TIP#2182: Katalogy českých podcastů aneb kde objevovat podcasty?
Co jsou podcasty určitě, ale kdyby přeci jen ne, tak můžete odskočit do Jak poslouchat podcasty? A co to vlastně ty podcasty jsou?