Přeskočit na obsah
@365tipu
  • Domů
    • Práce na dálku
    • Twitter for dummies
    • Jak na Mastodon
    • Facebook a marketing
    • Návod pro Instagram
    • Jak na LinkedIn
    • Bezpečný Internet
    • Bezpečnost pro novináře
    • Soukromí na Facebooku
    • Pomocník webdesignera
    • Jak na WordPress
    • Nepostradatelné software
      • Jak na Windows 11
      • Jak na Windows 10
      • Jak na iPhone/iPad
      • Jak na Mac OS
      • Jak na Apple TV/TV+
      • Jak na Apple Watch
      • Jak na Apple AirTag
      • Microsoft Office
      • Linux
    • Jazykový koutek
    • GTD
    • Filmy a TV seriály
    • Recenze
    • Chytrá domácnost
      • Chytrá domácnost
      • Jak na Google Home
      • Amazon Echo a Alexa
      • Apple HomePod
      • Jak na Raspberry Pi
      • Jak na QNAP NAS
      • Netatmo
    • Jak na Home Assistant
  • Všechny štítky
  • Odběr e-mailem
  • RSS/XML
  • Kontakt
    • Kontakt
    • Twitter
    • Facebook
    • BlueSky
    • Mastodon
      • Threads
    • Zásady Cookies (EU)
13. 4. 2016 podle 365tipů
Cloud, Microsoft, Software, Vyhledávání

TIP#469: Co je to deduplikace? V čem to pomůže vašemu počítači? A jak na to?

Deduplikace je termín pro nalezení duplikátních dat, v případě souborů v počítači prostě nalezení všech souborů, které se někde vyskytují ve více kopiích. Po nalezení se můžete rozhodnout, že nadbytečné kopie smažete. Je dost jasné k čemu vám to pomůže,  může to uvolnit množství místa na disku.

Duplikáty v počítačích vznikají velmi často v podobě fotografií, MP3 souborů či filmů. Ale může to být prakticky cokoliv, omylem zkopírované dokumenty, kopie na které se zapomnělo, protože už nejsou potřeba. Opakovaně stažené soubory, atd.

Na deduplikaci potřebujete software, které prohledá disky a najde vše co se vyskytuje opakovaně. V tom nejprimitivnějším případě bude srovnávat jména a délky souborů. V tom pokročilejším by mělo srovnávat obsah souborů – což už není až tak legrace, protože to může být velmi časově náročné. Může ale jít o něco mezi, nějaký algoritmus, který vše urychlí.

dupeGuru – dupeguru.voltaicideas.net – (MAC OS, Linux, Windows) patří mezi deduplikační pomůcky s oním „fuzzy“ algoritmem, kde se například nenechá poplést jiným jménem souboru. A nespornou výhodou je i to, že je dostupný i pro více operačních systémů a navíc zadarmo. Užitečné může být, že má i specifickou verzi pro hudbu a obrázky, kde najde duplikáty i v souborech s rozdílným formátem.

Duplicate File Finder – doubles.sourceforge.net – (Windows, Linux) umí nejenom najít duplicity, ale umí tak to, co budete od podobných software chtít, tedy vedl odstranění duplikátu také možnost vytvořit link, který v původním místě ponechá jen odkaz na jeden originál. V tomto případě nejde pouze přesné shody. Výhodou může být i rychlost, protože porovnávání souborů se děje pomoci hashe (kontrolního součtu).

SimilarImages – tn123.org/simimages – (Windows) je, jak název napovídá, vhodný pro hledání podobných obrázků. Vizuálně podobných.

Deduplikovat můžete i fotky na mobilu/tabletu (a Macu), viz Jak na iPhone/iPadu či Macu najít duplicitní fotografie a videa

Vydáte-li se zkoušet deduplikační software, tak nespěchejte. Prohledávání dnešních disků majících běžně terabajty může být poměrně déle trvající proces. A ano, může to znamenat i několik hodin. Deduplikovat ale můžete třeba zkusit jenom, například, sbírku vašich MP3.

Další možnosti

  • AlDup – www.alldup.de/alldup_help/alldup.htm
  • Duplicate Cleaner – www.duplicatecleaner.com

Pokud používáte jako NAS něco od Synology (rozhodně musím doporučit, viz například NAS nadoma: Vybral jsem si Synology DS214se. Třeba se budou hodit zkušenosti), tak byste měli vědět, že hledání duplicit je i jedna z funkcí, kterou umí přímo toto zařízení.

Pokud hledáte ještě něco dalšího pro Linux (výše uvedený dupeGURU má verzi pro Linux), tak můžete zkusit FSlint ale neočekávejte nějaké pokročilejší schopnosti analýzy.

PS: Deduplikace má, jak jinak, řadu dalších významů. Třeba v databázovém světě, kde je to v zásadě kompresní technologie, umožňující ukládat data tak, aby se zamezilo jejich opakování či uložení duplicitních data. Uplatňuje se v zálohování, v cloudových úložištích i v databázových systémech.

Související příspěvky

TIP#557: Praktické tipy pro Kodi: Knihovny a hlavně změna jazyka knihovny filmů a seriálů
TIP#689: Jaké jsou alternativy pro Adobe Lightroom?
TIP#624: Jak na počítači lépe prohlížet obrázky a fotografie? Pomocí prohlížečů fotografií

Foto Fotografie Hudba Linux MP3 OS X Úložiště Windows Zálohování

Předchozí článekTIP#468: Jak oslovit přes Facebook někoho tak, aby to neviděli další lidéDalší článek TIP#470: K čemu slouží ve Windows příkaz ipconfig? Třeba k smazání DNS cache

Nejnovější příspěvky

  • TIP#3253: Co je to latence a proč to hraje roli (nejen) při hraní her
  • TIP3252: Chladit notebooky podložkou? Co byste měli vědět
  • TIP#3251: Kouzelná meteostanice ATMOS řeší problém, o kterém ani nevíte
  • TIP#3250: Jak zabránit tomu, aby se Mac po restartu znovu otevřel se všemi aplikacemi z poslední relace
  • TIP#3249: Zálohovat počítači či NAS? Rozhodně ano. Ale kam a jak? Včetně velkého přehledu cloudových služeb

Nejčtenější

Přispět na provoz můžete

Přispějte. 500 Kč můžete změnit dle vlastního uvážení. Z částky zaplatíme DPH a pochopitelně daně platbou na účet 331049001/5500, spec. symbol 365. Částku si můžete změnit. Z platby odvádíme DPH a daníme ji.

Zdejší tipy na zajímavé/užitečné věci obsahují affialiate odkazy na Alzu/Aliexpres

... nebo placeným odběrem

Staňte se platícím odběratelem newsletteru. 5 USD/měsíc, 50 USD/rok nebo dle vlastního uvážení od 100 USD/rok. Každou středu a neděli nálož informací.

Kontakt a tak

Kontakt: 365tipu@gmail.com

Veškerý obsah zde uveřejněný je CC-BY-NC-SA