Trable s českými titulky a jak na ně

Trable s českými titulky a jak na ně
, , návod

V mnoha internetových diskuzích zaměřených na multimediální zařízení se kupí dotazy na problémy s češtinou v titulcích. Jakým způsobem jsou titulky zakódované? Kde vznikají problémy s jejich kompatibilitou? Odpovědi najdete v tomto článku.

Kapitoly článku:
  1. Trable s českými titulky a jak na ně
  2. Kódování češtiny, tipy a triky
  3. Závěr a dodatky

Kódování češtiny



Už bylo zmíněno, že výhodou obrázkových a napevno vložených titulků je odpadnutí problémů se špatným zobrazení některých znaků. To je problém textových titulků, jež nejsou ničím jiným než obyčejným textovým souborem, který až na výjimky neobsahuje explicitní informace o použitém kódování ani diakritice. Avšak kódování je něčím, bez čeho by žádný textový soubor nemohl ani existovat. Kódování a diakritika se proto dá zjistit (upravovat) pomocí textového editoru nebo pomocí editoru titulků.


Textový editor PSPad, takový lepší poznámkový blok.

Jedním z takových textových editorů je PSPad, kde se použité kódování zobrazuje na dolní liště programu. Změna kódování se provádí v položce menu Formát, změna diakritiky zase přes Formát → Písmo (pro české titulky musí být zaškrtnutý skript Středoevropský).

U kódování je na výběr mezi Windows (CP1250), ISO 8859-2, UTF-8 a několika dalšími, které však multimediální zařízení obvykle nepodporují. Jde o kódování bří. Kamenických („CP895“) a Latin II (CP852) z dob DOSu. Novější UTF-16 LE a UTF-16 BE zřejmě nemá moc velkou podporu kvůli dvojnásobné velikosti oproti UTF-8 (Matroška používá UTF-8).


Je potřeba nastavit správnou diakritiku/skript.

Windows (CP1250, WinCS, WinEE) je asi nejpodporovanějším typem kódování češtiny (i dalších jazyků) v titulcích zobrazitelných na multimediálních zařízeních. Je to zřejmě dáno dominancí Microsoftu na poli OS začátkem 90. let minulého století (v době, kdy existovalo 6 různých kódování češtiny). Se starším ISO 8859-2 (ISO Latin 2, CP912) má společné to, že CP1250 obsahuje všechny tisknutelné znaky ISO 8859-2, ale 14 jich má jiný kód a kódy v rozsahu 128-159 jsou v CP1250 tisknutelné. Chybné nastavení kódování se ukáže např. při pokusu o zobrazení znaku „ť“.


Odstrašující příklad špatného zobrazování některých českých znaků (v tomto případě znak „té s háčkem“).

Původní ASCII (American Standard Code for Information Interchange) kódování zabíralo 7 bitů, ale „neumělo“ češtinu. Kódování CP1250, ISO 8859-2, Kamenických i CP852 zabírá 8 bitů (1 Byte), ale problémem těchto kódování je fakt, že text nemůže zobrazit více abeced zároveň. Pro zobrazení více abeced vzniklo kódování UTF-8 vycházející z normy ISO/EIC 10646 (Unicode), jakýkoliv znak ASCII vyžaduje 1 Byte (8 bitů), jakýkoliv český Unicode znak zabere 2 Byty (16 bitů). Z těchto důvodů je UTF-8 výhodnější než předešlá kódování (když je podporované přehrávačem).

Tabulka českých znaků Unicode

Znak
HTML entita
Dec
Hex
UTF-8 v URL
ÁÁÁÁ%C3%81
ČČČČ%C4%8C
ĎĎĎĎ%C4%8E
ÉÉÉÉ%C3%89
ĚĚĚĚ%C4%9A
ÍÍÍÍ%C3%8D
ŇŇŇŇC5%87
ÓÓÓÓ%C3%93
ŘŘŘŘ%C5%98
ŠŠŠŠ%C5%A0
ŤŤŤŤ%C5%A4
ÚÚÚÚ%C3%9A
ŮŮŮŮ%C5%AE
ÝÝÝÝ%C3%9D
ŽŽŽŽ%C5%BD
áááá%C3%A1
čččč%C4%8D
ďďďď %C4%8F
éééé%C3%A9
ěěěě%C4%9B
íííí%C3%AD
ňňňň%C5%88
óóóó%C3%B3
řřřř%C5%99
šššš%C5%A
ťťťť%C5%A5
úúúú%C3%BA
ůůůů%C5%AF
ýýýý%C3%BD
žžžž%C5%BE


Tipy a triky



Chybějící podpora češtiny v titulcích dokáže pořádně pokazit zážitek ze sledování filmu, protože málokomu vyhovují znaky jako è, ĉ nebo ⅔ tam, kde mají být písmena s háčky a čárkami. Asi nejrozumnější bude nejdřív zjistit, jestli je kódování přehrávače nastaveno správně, tj. CP1250, ISO 8859-2 nebo UTF-8.

Diakritika pak musí být zadána jako střední Evropa (Central Europe), popřípadě východní Evropa (East Europe). U vnitřních titulků MKV souborů musí být UTF-8 nastaveno vždy, u ostatních titulků je potřeba zjistit jejich kódování pomocí textového editoru nebo metodou „pokus/omyl".


I ve stolních přehrávačích je potřeba nastavit správné kódování a diakritiku titulků.

Pokud dané kódování není v menu přehrávače, je ještě možné, že na internetových stránkách výrobce bude novější firmware podporující dané kódování. Pokud ani to není k dispozici, nezbývá už nic jiného, než titulky upravit (pokud chcete titulky spustit na dané „mašině“), nebo je vložit napevno do filmu.


Náhled obrazovky AviDemuxu.

Druhou možnost lze provést pomocí editoru videa, jako je např. AviDemux nebo VirtualDub (s filtry VobSub). V případě AviDemux je nutné nejdřív zkonvertovat titulky na ISO 8859-2 nebo UTF-8 (např. v PSPadu), protože nepodporuje CP1250 (rozdíl v kódování českých znaků v ISO 8859-2 a CP1250 je patrný z tabulky v dodatcích na konci článku). V AviDemux je potřeba nastavit video na např. MPEG-4 ASP (Xvid4), v sekci Filtry dále vybereme Titulky a např. Subtitler.

V nastavení samotného filtru lze nastavit soubor s titulky, písmo (TTF), kódování, barvu, velikost a umístění, automatické rozdělování a zpoždění v ms. Výsledek je možné zjistit pomocí Náhledu, ale zpracování výsledného videa může trvat od několika desítek minut až po několik hodin! Závisí to samozřejmě na výkonu používaného počítače.


Titulky vyříznuté z Náhledu.

Daleko rychlejší bývá úprava titulků, kdy někdy stačí upravit kódování, případně diakritiku (v PSPadu Formát >> Písmo >> Skript: Středoevropský) nebo odstranit háčky a čárky (např. v utilitě Diakritika 1.0). Pak je tu možnost převést textové titulky na VobSub (IDX/SUB) např. pomocí aplikace SubtitleCreator. V SubtitleCreator je ale ovládání v Angličtině a česká diakritika se nastavuje v menu Formatting >> character encoding: central Europe.


Takto vypadá pracovní prostředí aplikace Subtitle Workshop.

Pak existuje celá řada dalších programů na úpravu titulků, se kterými je možné převést titulky do formátu, který stolní přehrávač ovládá. Za zmínku stojí určitě následující:

Subtitles Wizard (13 formátů titulků), Nástroj na titulky, Subtitle Workshop (56 formátů titulků u v. 1.05), Titulky, SrtToSub konvertor (jen anglicky, ze .str do .sub a naopak), DivXLand Media Subtitler (jen anglicky, 30 formátů titulků), SubRip 1.50 Beta 4 (titulky z DVD do BMP nebo TXT).
Nejpopulárnější programy pro editaci videa
Nejnovější články
Evolveo WINPC Q4: nastává éra Windows? Evolveo WINPC Q4: nastává éra Windows?
Miniaturní multimediální centra byla vždy doménou především Linuxu, ale dnes se podíváme na zkušeného hráče, který se této kategorii dlouho vyhýbal. Ano, otestujeme Windows v mini počítači se spotřebou 12 W. Máme tu snad konečně silného protivníka?
28.8.2015,  recenze,  Jakub Doležal
Samsung zlevňuje SUHD TV Samsung zlevňuje SUHD TV
Jihokorejský gigant Samsung se rozhodl snížit cenu svých prémiových televizorů s přívlastkem SUHD. Nejvíc znatelné slevy jsou podle magazínu Forbes patrné na americkém trhu (několik tisíc dolarů). Jiné trhy si na výraznější slevy budou muset počkat.
25.8.2015,  aktualita,  Pavel Zubatý,  3 komentáře
Evolveo Android Box Q4 4K: s Androidem na 4K? Evolveo Android Box Q4 4K: s Androidem na 4K?
Android na mobilních telefonech zásadně dospěl a díky své popularitě se dostává i na multimediální centra. Jak si poradí s 4jádrovým procesorem, podporou H.265 a především akcelerací videa v rozlišení 4K? To nám prozradí box od Evolveo.
25.8.2015,  recenze,  Jakub Doležal,  10 komentářů
Xtreamer WinKey: Windows 10 + Kodi Xtreamer WinKey: Windows 10 + Kodi
Windows 10 jsou již oficiálně venku a pomalu se tak ke slovu dostávají výrobci hardwaru. Xtreamer si pro nás připravil mini počítač s Atomem o velikosti USB flashdisku, nasadil pasivní chlazení a již v základu nabízí oblíbené Kodi.
24.8.2015,  aktualita,  Jakub Doležal,  1 komentář
Doporučená multimediální centra: srpen 2015 Doporučená multimediální centra: srpen 2015
Co nového se tento měsíc událo v oblasti multimediálních center? Jak to tak vypadá, výrobci nepřestávají přicházet s novými modely, které mezi sebou soutěží o Vaši přízeň. A jaké produkty Vám teď můžeme doporučit?
20.8.2015,  návod,  Jakub Doležal,  9 komentářů