Trable s českými titulky a jak na ně

Trable s českými titulky a jak na ně
, , návod

V mnoha internetových diskuzích zaměřených na multimediální zařízení se kupí dotazy na problémy s češtinou v titulcích. Jakým způsobem jsou titulky zakódované? Kde vznikají problémy s jejich kompatibilitou? Odpovědi najdete v tomto článku.

Kapitoly článku:
  1. Trable s českými titulky a jak na ně
  2. Kódování češtiny, tipy a triky
  3. Závěr a dodatky

Kódování češtiny



Už bylo zmíněno, že výhodou obrázkových a napevno vložených titulků je odpadnutí problémů se špatným zobrazení některých znaků. To je problém textových titulků, jež nejsou ničím jiným než obyčejným textovým souborem, který až na výjimky neobsahuje explicitní informace o použitém kódování ani diakritice. Avšak kódování je něčím, bez čeho by žádný textový soubor nemohl ani existovat. Kódování a diakritika se proto dá zjistit (upravovat) pomocí textového editoru nebo pomocí editoru titulků.


Textový editor PSPad, takový lepší poznámkový blok.

Jedním z takových textových editorů je PSPad, kde se použité kódování zobrazuje na dolní liště programu. Změna kódování se provádí v položce menu Formát, změna diakritiky zase přes Formát → Písmo (pro české titulky musí být zaškrtnutý skript Středoevropský).

U kódování je na výběr mezi Windows (CP1250), ISO 8859-2, UTF-8 a několika dalšími, které však multimediální zařízení obvykle nepodporují. Jde o kódování bří. Kamenických („CP895“) a Latin II (CP852) z dob DOSu. Novější UTF-16 LE a UTF-16 BE zřejmě nemá moc velkou podporu kvůli dvojnásobné velikosti oproti UTF-8 (Matroška používá UTF-8).


Je potřeba nastavit správnou diakritiku/skript.

Windows (CP1250, WinCS, WinEE) je asi nejpodporovanějším typem kódování češtiny (i dalších jazyků) v titulcích zobrazitelných na multimediálních zařízeních. Je to zřejmě dáno dominancí Microsoftu na poli OS začátkem 90. let minulého století (v době, kdy existovalo 6 různých kódování češtiny). Se starším ISO 8859-2 (ISO Latin 2, CP912) má společné to, že CP1250 obsahuje všechny tisknutelné znaky ISO 8859-2, ale 14 jich má jiný kód a kódy v rozsahu 128-159 jsou v CP1250 tisknutelné. Chybné nastavení kódování se ukáže např. při pokusu o zobrazení znaku „ť“.


Odstrašující příklad špatného zobrazování některých českých znaků (v tomto případě znak „té s háčkem“).

Původní ASCII (American Standard Code for Information Interchange) kódování zabíralo 7 bitů, ale „neumělo“ češtinu. Kódování CP1250, ISO 8859-2, Kamenických i CP852 zabírá 8 bitů (1 Byte), ale problémem těchto kódování je fakt, že text nemůže zobrazit více abeced zároveň. Pro zobrazení více abeced vzniklo kódování UTF-8 vycházející z normy ISO/EIC 10646 (Unicode), jakýkoliv znak ASCII vyžaduje 1 Byte (8 bitů), jakýkoliv český Unicode znak zabere 2 Byty (16 bitů). Z těchto důvodů je UTF-8 výhodnější než předešlá kódování (když je podporované přehrávačem).

Tabulka českých znaků Unicode

Znak
HTML entita
Dec
Hex
UTF-8 v URL
ÁÁÁÁ%C3%81
ČČČČ%C4%8C
ĎĎĎĎ%C4%8E
ÉÉÉÉ%C3%89
ĚĚĚĚ%C4%9A
ÍÍÍÍ%C3%8D
ŇŇŇŇC5%87
ÓÓÓÓ%C3%93
ŘŘŘŘ%C5%98
ŠŠŠŠ%C5%A0
ŤŤŤŤ%C5%A4
ÚÚÚÚ%C3%9A
ŮŮŮŮ%C5%AE
ÝÝÝÝ%C3%9D
ŽŽŽŽ%C5%BD
áááá%C3%A1
čččč%C4%8D
ďďďď %C4%8F
éééé%C3%A9
ěěěě%C4%9B
íííí%C3%AD
ňňňň%C5%88
óóóó%C3%B3
řřřř%C5%99
šššš%C5%A
ťťťť%C5%A5
úúúú%C3%BA
ůůůů%C5%AF
ýýýý%C3%BD
žžžž%C5%BE


Tipy a triky



Chybějící podpora češtiny v titulcích dokáže pořádně pokazit zážitek ze sledování filmu, protože málokomu vyhovují znaky jako è, ĉ nebo ⅔ tam, kde mají být písmena s háčky a čárkami. Asi nejrozumnější bude nejdřív zjistit, jestli je kódování přehrávače nastaveno správně, tj. CP1250, ISO 8859-2 nebo UTF-8.

Diakritika pak musí být zadána jako střední Evropa (Central Europe), popřípadě východní Evropa (East Europe). U vnitřních titulků MKV souborů musí být UTF-8 nastaveno vždy, u ostatních titulků je potřeba zjistit jejich kódování pomocí textového editoru nebo metodou „pokus/omyl".


I ve stolních přehrávačích je potřeba nastavit správné kódování a diakritiku titulků.

Pokud dané kódování není v menu přehrávače, je ještě možné, že na internetových stránkách výrobce bude novější firmware podporující dané kódování. Pokud ani to není k dispozici, nezbývá už nic jiného, než titulky upravit (pokud chcete titulky spustit na dané „mašině“), nebo je vložit napevno do filmu.


Náhled obrazovky AviDemuxu.

Druhou možnost lze provést pomocí editoru videa, jako je např. AviDemux nebo VirtualDub (s filtry VobSub). V případě AviDemux je nutné nejdřív zkonvertovat titulky na ISO 8859-2 nebo UTF-8 (např. v PSPadu), protože nepodporuje CP1250 (rozdíl v kódování českých znaků v ISO 8859-2 a CP1250 je patrný z tabulky v dodatcích na konci článku). V AviDemux je potřeba nastavit video na např. MPEG-4 ASP (Xvid4), v sekci Filtry dále vybereme Titulky a např. Subtitler.

V nastavení samotného filtru lze nastavit soubor s titulky, písmo (TTF), kódování, barvu, velikost a umístění, automatické rozdělování a zpoždění v ms. Výsledek je možné zjistit pomocí Náhledu, ale zpracování výsledného videa může trvat od několika desítek minut až po několik hodin! Závisí to samozřejmě na výkonu používaného počítače.


Titulky vyříznuté z Náhledu.

Daleko rychlejší bývá úprava titulků, kdy někdy stačí upravit kódování, případně diakritiku (v PSPadu Formát >> Písmo >> Skript: Středoevropský) nebo odstranit háčky a čárky (např. v utilitě Diakritika 1.0). Pak je tu možnost převést textové titulky na VobSub (IDX/SUB) např. pomocí aplikace SubtitleCreator. V SubtitleCreator je ale ovládání v Angličtině a česká diakritika se nastavuje v menu Formatting >> character encoding: central Europe.


Takto vypadá pracovní prostředí aplikace Subtitle Workshop.

Pak existuje celá řada dalších programů na úpravu titulků, se kterými je možné převést titulky do formátu, který stolní přehrávač ovládá. Za zmínku stojí určitě následující:

Subtitles Wizard (13 formátů titulků), Nástroj na titulky, Subtitle Workshop (56 formátů titulků u v. 1.05), Titulky, SrtToSub konvertor (jen anglicky, ze .str do .sub a naopak), DivXLand Media Subtitler (jen anglicky, 30 formátů titulků), SubRip 1.50 Beta 4 (titulky z DVD do BMP nebo TXT).
Nejpopulárnější programy pro editaci videa
Nejnovější články
Rok 2019: 80 % datových toků tvoří video Rok 2019: 80 % datových toků tvoří video
Nárůst 4K streamingu způsobí, že už v roce 2019 bude 80 % datových toků v Internetu tvořeno videem. Cisco dále tvrdí, že po celosvětové síti budou přenášeny 2 zettabajty dat, což odpovídá více než 500 miliardám filmů na DVD.
Dnes,  aktualita,  Pavel Zubatý
Kamera Canon ME20F-SH s citlivostí ISO 4.000.000 Kamera Canon ME20F-SH s citlivostí ISO 4.000.000
Společnost Canon představila novou videokameru, která je vybavena full frame Full HD snímačem. Ten nabídne citlivost ISO 4 miliony a schopnost snímat videa i v extrémně špatném světle. Je vybavena EF bajonetem.
Včera,  aktualita,  Milan Šurkala
Xtreamer vylepšuje: Wonder Pro a Wonder Plus Xtreamer vylepšuje: Wonder Pro a Wonder Plus
Přehrávač Xtreamer Wonder je na trhu již nějaký ten pátek, a proto se nyní ke slovu dostává jeho nástupce, respektive hned dva. Připravte se na hardwarově nadmíru vybavené kousky, Android 5.1 a zajímavou cenovku.
27.7.2015,  aktualita,  Jakub Doležal
Grundig pojede na Androidu Grundig pojede na Androidu
Společnost Grundig uzavřela dohodu se softwarovým gigantem Google. Značka se proslavila v dobách CRT, ale upadla s nástupem technologie LCD. Opět na výsluní ji má dostat platforma Android TV.
22.7.2015,  aktualita,  Pavel Zubatý
Xiaomi Mi TV 2S: zatraceně levné 4K Xiaomi Mi TV 2S: zatraceně levné 4K
Vyrobit levné 4K už výrobci umí, ale skloubit moderní technologickou výbavu a přitom nízkou cenu, umí už jen Xiaomi. Jeho nová generace Mi TV totiž opět přináší prakticky nejlepší parametry a konkurenti tak mají co dohánět.
20.7.2015,  aktualita,  Jakub Doležal