Recenze  |  Aktuality  |  Články
Doporučení  |  Diskuze
Filmy a seriály, streamovací služby
Televize  |  Projektory
Audio a domácí kina
Multimediální centra  |  Ostatní
Svět hardware  |  Digimanie
Svět mobilně

Trable s českými titulky a jak na ně

17.1.2011, Pavel Zubatý, návod
V mnoha internetových diskuzích zaměřených na multimediální zařízení se kupí dotazy na problémy s češtinou v titulcích. Jakým způsobem jsou titulky zakódované? Kde vznikají problémy s jejich kompatibilitou? Odpovědi najdete v tomto článku.
Kapitoly článku:
  1. Trable s českými titulky a jak na ně
  2. Kódování češtiny, tipy a triky
  3. Závěr a dodatky

Kódování češtiny


Už bylo zmíněno, že výhodou obrázkových a napevno vložených titulků je odpadnutí problémů se špatným zobrazení některých znaků. To je problém textových titulků, jež nejsou ničím jiným než obyčejným textovým souborem, který až na výjimky neobsahuje explicitní informace o použitém kódování ani diakritice. Avšak kódování je něčím, bez čeho by žádný textový soubor nemohl ani existovat. Kódování a diakritika se proto dá zjistit (upravovat) pomocí textového editoru nebo pomocí editoru titulků.


Textový editor PSPad, takový lepší poznámkový blok.

Jedním z takových textových editorů je PSPad, kde se použité kódování zobrazuje na dolní liště programu. Změna kódování se provádí v položce menu Formát, změna diakritiky zase přes Formát → Písmo (pro české titulky musí být zaškrtnutý skript Středoevropský).

U kódování je na výběr mezi Windows (CP1250), ISO 8859-2, UTF-8 a několika dalšími, které však multimediální zařízení obvykle nepodporují. Jde o kódování bří. Kamenických („CP895“) a Latin II (CP852) z dob DOSu. Novější UTF-16 LE a UTF-16 BE zřejmě nemá moc velkou podporu kvůli dvojnásobné velikosti oproti UTF-8 (Matroška používá UTF-8).


Je potřeba nastavit správnou diakritiku/skript.

Windows (CP1250, WinCS, WinEE) je asi nejpodporovanějším typem kódování češtiny (i dalších jazyků) v titulcích zobrazitelných na multimediálních zařízeních. Je to zřejmě dáno dominancí Microsoftu na poli OS začátkem 90. let minulého století (v době, kdy existovalo 6 různých kódování češtiny). Se starším ISO 8859-2 (ISO Latin 2, CP912) má společné to, že CP1250 obsahuje všechny tisknutelné znaky ISO 8859-2, ale 14 jich má jiný kód a kódy v rozsahu 128-159 jsou v CP1250 tisknutelné. Chybné nastavení kódování se ukáže např. při pokusu o zobrazení znaku „ť“.


Odstrašující příklad špatného zobrazování některých českých znaků (v tomto případě znak „té s háčkem“).

Původní ASCII (American Standard Code for Information Interchange) kódování zabíralo 7 bitů, ale „neumělo“ češtinu. Kódování CP1250, ISO 8859-2, Kamenických i CP852 zabírá 8 bitů (1 Byte), ale problémem těchto kódování je fakt, že text nemůže zobrazit více abeced zároveň. Pro zobrazení více abeced vzniklo kódování UTF-8 vycházející z normy ISO/EIC 10646 (Unicode), jakýkoliv znak ASCII vyžaduje 1 Byte (8 bitů), jakýkoliv český Unicode znak zabere 2 Byty (16 bitů). Z těchto důvodů je UTF-8 výhodnější než předešlá kódování (když je podporované přehrávačem).

Tabulka českých znaků Unicode

Znak
HTML entita
Dec
Hex
UTF-8 v URL
ÁÁÁÁ%C3%81
ČČČČ%C4%8C
ĎĎĎĎ%C4%8E
ÉÉÉÉ%C3%89
ĚĚĚĚ%C4%9A
ÍÍÍÍ%C3%8D
ŇŇŇŇC5%87
ÓÓÓÓ%C3%93
ŘŘŘŘ%C5%98
ŠŠŠŠ%C5%A0
ŤŤŤŤ%C5%A4
ÚÚÚÚ%C3%9A
ŮŮŮŮ%C5%AE
ÝÝÝÝ%C3%9D
ŽŽŽŽ%C5%BD
áááá%C3%A1
čččč%C4%8D
ďďďď %C4%8F
éééé%C3%A9
ěěěě%C4%9B
íííí%C3%AD
ňňňň%C5%88
óóóó%C3%B3
řřřř%C5%99
šššš%C5%A
ťťťť%C5%A5
úúúú%C3%BA
ůůůů%C5%AF
ýýýý%C3%BD
žžžž%C5%BE


Tipy a triky


Chybějící podpora češtiny v titulcích dokáže pořádně pokazit zážitek ze sledování filmu, protože málokomu vyhovují znaky jako è, ĉ nebo ⅔ tam, kde mají být písmena s háčky a čárkami. Asi nejrozumnější bude nejdřív zjistit, jestli je kódování přehrávače nastaveno správně, tj. CP1250, ISO 8859-2 nebo UTF-8.

Diakritika pak musí být zadána jako střední Evropa (Central Europe), popřípadě východní Evropa (East Europe). U vnitřních titulků MKV souborů musí být UTF-8 nastaveno vždy, u ostatních titulků je potřeba zjistit jejich kódování pomocí textového editoru nebo metodou „pokus/omyl".


I ve stolních přehrávačích je potřeba nastavit správné kódování a diakritiku titulků.

Pokud dané kódování není v menu přehrávače, je ještě možné, že na internetových stránkách výrobce bude novější firmware podporující dané kódování. Pokud ani to není k dispozici, nezbývá už nic jiného, než titulky upravit (pokud chcete titulky spustit na dané „mašině“), nebo je vložit napevno do filmu.


Náhled obrazovky AviDemuxu.

Druhou možnost lze provést pomocí editoru videa, jako je např. AviDemux nebo VirtualDub (s filtry VobSub). V případě AviDemux je nutné nejdřív zkonvertovat titulky na ISO 8859-2 nebo UTF-8 (např. v PSPadu), protože nepodporuje CP1250 (rozdíl v kódování českých znaků v ISO 8859-2 a CP1250 je patrný z tabulky v dodatcích na konci článku). V AviDemux je potřeba nastavit video na např. MPEG-4 ASP (Xvid4), v sekci Filtry dále vybereme Titulky a např. Subtitler.

V nastavení samotného filtru lze nastavit soubor s titulky, písmo (TTF), kódování, barvu, velikost a umístění, automatické rozdělování a zpoždění v ms. Výsledek je možné zjistit pomocí Náhledu, ale zpracování výsledného videa může trvat od několika desítek minut až po několik hodin! Závisí to samozřejmě na výkonu používaného počítače.


Titulky vyříznuté z Náhledu.

Daleko rychlejší bývá úprava titulků, kdy někdy stačí upravit kódování, případně diakritiku (v PSPadu Formát >> Písmo >> Skript: Středoevropský) nebo odstranit háčky a čárky (např. v utilitě Diakritika 1.0). Pak je tu možnost převést textové titulky na VobSub (IDX/SUB) např. pomocí aplikace SubtitleCreator. V SubtitleCreator je ale ovládání v Angličtině a česká diakritika se nastavuje v menu Formatting >> character encoding: central Europe.


Takto vypadá pracovní prostředí aplikace Subtitle Workshop.

Pak existuje celá řada dalších programů na úpravu titulků, se kterými je možné převést titulky do formátu, který stolní přehrávač ovládá. Za zmínku stojí určitě následující:

Subtitles Wizard (13 formátů titulků), Nástroj na titulky, Subtitle Workshop (56 formátů titulků u v. 1.05), Titulky, SrtToSub konvertor (jen anglicky, ze .str do .sub a naopak), DivXLand Media Subtitler (jen anglicky, 30 formátů titulků), SubRip 1.50 Beta 4 (titulky z DVD do BMP nebo TXT).