Trable s českými titulky a jak na ně

, , návod

V mnoha internetových diskuzích zaměřených na multimediální zařízení se kupí dotazy na problémy s češtinou v titulcích. Jakým způsobem jsou titulky zakódované? Kde vznikají problémy s jejich kompatibilitou? Odpovědi najdete v tomto článku.

Kapitoly článku:
  1. Trable s českými titulky a jak na ně
  2. Kódování češtiny, tipy a triky
  3. Závěr a dodatky



reklama

Kódování češtiny



Už bylo zmíněno, že výhodou obrázkových a napevno vložených titulků je odpadnutí problémů se špatným zobrazení některých znaků. To je problém textových titulků, jež nejsou ničím jiným než obyčejným textovým souborem, který až na výjimky neobsahuje explicitní informace o použitém kódování ani diakritice. Avšak kódování je něčím, bez čeho by žádný textový soubor nemohl ani existovat. Kódování a diakritika se proto dá zjistit (upravovat) pomocí textového editoru nebo pomocí editoru titulků.


Textový editor PSPad, takový lepší poznámkový blok.

Jedním z takových textových editorů je PSPad, kde se použité kódování zobrazuje na dolní liště programu. Změna kódování se provádí v položce menu Formát, změna diakritiky zase přes Formát → Písmo (pro české titulky musí být zaškrtnutý skript Středoevropský).

U kódování je na výběr mezi Windows (CP1250), ISO 8859-2, UTF-8 a několika dalšími, které však multimediální zařízení obvykle nepodporují. Jde o kódování bří. Kamenických („CP895“) a Latin II (CP852) z dob DOSu. Novější UTF-16 LE a UTF-16 BE zřejmě nemá moc velkou podporu kvůli dvojnásobné velikosti oproti UTF-8 (Matroška používá UTF-8).


Je potřeba nastavit správnou diakritiku/skript.

Windows (CP1250, WinCS, WinEE) je asi nejpodporovanějším typem kódování češtiny (i dalších jazyků) v titulcích zobrazitelných na multimediálních zařízeních. Je to zřejmě dáno dominancí Microsoftu na poli OS začátkem 90. let minulého století (v době, kdy existovalo 6 různých kódování češtiny). Se starším ISO 8859-2 (ISO Latin 2, CP912) má společné to, že CP1250 obsahuje všechny tisknutelné znaky ISO 8859-2, ale 14 jich má jiný kód a kódy v rozsahu 128-159 jsou v CP1250 tisknutelné. Chybné nastavení kódování se ukáže např. při pokusu o zobrazení znaku „ť“.


Odstrašující příklad špatného zobrazování některých českých znaků (v tomto případě znak „té s háčkem“).

Původní ASCII (American Standard Code for Information Interchange) kódování zabíralo 7 bitů, ale „neumělo“ češtinu. Kódování CP1250, ISO 8859-2, Kamenických i CP852 zabírá 8 bitů (1 Byte), ale problémem těchto kódování je fakt, že text nemůže zobrazit více abeced zároveň. Pro zobrazení více abeced vzniklo kódování UTF-8 vycházející z normy ISO/EIC 10646 (Unicode), jakýkoliv znak ASCII vyžaduje 1 Byte (8 bitů), jakýkoliv český Unicode znak zabere 2 Byty (16 bitů). Z těchto důvodů je UTF-8 výhodnější než předešlá kódování (když je podporované přehrávačem).

Tabulka českých znaků Unicode

Znak
HTML entita
Dec
Hex
UTF-8 v URL
ÁÁÁÁ%C3%81
ČČČČ%C4%8C
ĎĎĎĎ%C4%8E
ÉÉÉÉ%C3%89
ĚĚĚĚ%C4%9A
ÍÍÍÍ%C3%8D
ŇŇŇŇC5%87
ÓÓÓÓ%C3%93
ŘŘŘŘ%C5%98
ŠŠŠŠ%C5%A0
ŤŤŤŤ%C5%A4
ÚÚÚÚ%C3%9A
ŮŮŮŮ%C5%AE
ÝÝÝÝ%C3%9D
ŽŽŽŽ%C5%BD
áááá%C3%A1
čččč%C4%8D
ďďďď %C4%8F
éééé%C3%A9
ěěěě%C4%9B
íííí%C3%AD
ňňňň%C5%88
óóóó%C3%B3
řřřř%C5%99
šššš%C5%A
ťťťť%C5%A5
úúúú%C3%BA
ůůůů%C5%AF
ýýýý%C3%BD
žžžž%C5%BE


Tipy a triky



Chybějící podpora češtiny v titulcích dokáže pořádně pokazit zážitek ze sledování filmu, protože málokomu vyhovují znaky jako è, ĉ nebo ⅔ tam, kde mají být písmena s háčky a čárkami. Asi nejrozumnější bude nejdřív zjistit, jestli je kódování přehrávače nastaveno správně, tj. CP1250, ISO 8859-2 nebo UTF-8.

Diakritika pak musí být zadána jako střední Evropa (Central Europe), popřípadě východní Evropa (East Europe). U vnitřních titulků MKV souborů musí být UTF-8 nastaveno vždy, u ostatních titulků je potřeba zjistit jejich kódování pomocí textového editoru nebo metodou „pokus/omyl".


I ve stolních přehrávačích je potřeba nastavit správné kódování a diakritiku titulků.

Pokud dané kódování není v menu přehrávače, je ještě možné, že na internetových stránkách výrobce bude novější firmware podporující dané kódování. Pokud ani to není k dispozici, nezbývá už nic jiného, než titulky upravit (pokud chcete titulky spustit na dané „mašině“), nebo je vložit napevno do filmu.


Náhled obrazovky AviDemuxu.

Druhou možnost lze provést pomocí editoru videa, jako je např. AviDemux nebo VirtualDub (s filtry VobSub). V případě AviDemux je nutné nejdřív zkonvertovat titulky na ISO 8859-2 nebo UTF-8 (např. v PSPadu), protože nepodporuje CP1250 (rozdíl v kódování českých znaků v ISO 8859-2 a CP1250 je patrný z tabulky v dodatcích na konci článku). V AviDemux je potřeba nastavit video na např. MPEG-4 ASP (Xvid4), v sekci Filtry dále vybereme Titulky a např. Subtitler.

V nastavení samotného filtru lze nastavit soubor s titulky, písmo (TTF), kódování, barvu, velikost a umístění, automatické rozdělování a zpoždění v ms. Výsledek je možné zjistit pomocí Náhledu, ale zpracování výsledného videa může trvat od několika desítek minut až po několik hodin! Závisí to samozřejmě na výkonu používaného počítače.


Titulky vyříznuté z Náhledu.

Daleko rychlejší bývá úprava titulků, kdy někdy stačí upravit kódování, případně diakritiku (v PSPadu Formát >> Písmo >> Skript: Středoevropský) nebo odstranit háčky a čárky (např. v utilitě Diakritika 1.0). Pak je tu možnost převést textové titulky na VobSub (IDX/SUB) např. pomocí aplikace SubtitleCreator. V SubtitleCreator je ale ovládání v Angličtině a česká diakritika se nastavuje v menu Formatting >> character encoding: central Europe.


Takto vypadá pracovní prostředí aplikace Subtitle Workshop.

Pak existuje celá řada dalších programů na úpravu titulků, se kterými je možné převést titulky do formátu, který stolní přehrávač ovládá. Za zmínku stojí určitě následující:

Subtitles Wizard (13 formátů titulků), Nástroj na titulky, Subtitle Workshop (56 formátů titulků u v. 1.05), Titulky, SrtToSub konvertor (jen anglicky, ze .str do .sub a naopak), DivXLand Media Subtitler (jen anglicky, 30 formátů titulků), SubRip 1.50 Beta 4 (titulky z DVD do BMP nebo TXT).
Nejpopulárnější programy pro editaci videa
Nejnovější články
Doporučená multimediální centra: květen 2016
Co nového se událo mezi multimediálními centry za uplynulý měsíc? Budeme v roce 2016 vybírat pouze mezi záplavou dokonalých modelů s podporou 4K, nebo nás opět čeká pátrání mezi hordami nedokončených prototypů? Jaký model Vám můžeme nyní doporučit?
2.5.2016,  návod,  Jakub Doležal
DJI Osmo RAW, stabilizátor pro Zenmuse X5R se 4/3" čipem
DJI posouvá laťku kvality obrazu znovu o něco výše a představuje Osmo RAW. Stabilizátor je doplněn o kameru Zenmuse X5R s velkým 4/3" senzorem a možností měnit objektivy. Podporuje i CinemaDNG záznam.
21.4.2016,  aktualita,  Milan Šurkala
Víceúčelová videokamera Canon ME200S-SH
Canon představil novou víceúčelovou kameru ME200S-SH. Podporuje klasické objektivy Canon EF, EF-S i Cinema EF. Nechybí autofokus pomocí Dual Pixel CMOS AF technologie a potěší vypínatelný IR filtr pro infračervený záznam.
17.4.2016,  aktualita,  Milan Šurkala
Lytro Cinema, 755 RAW megapixelů a až 300 fps
Společnost Lytro přešla z light-field fotoaparátů na profesionální systémy pro virtuální realitu a 3D záznam. Posledním počinem je Lytro Cinema, což je kamera schopná až 300fps záznamu a dosahuje rozlišení až 755 megapixelů.
14.4.2016,  aktualita,  Milan Šurkala
Televize vzduchem nebo přes internet?
Mít doma televizor nestačí. Abyste na něj mohli koukat, musíte do něj nějak dostat televizní signál. A máte v podstatě čtyři možnosti – vysílání, satelit, kabelová televize nebo nejmoderněji IPTV. Jaký je v tom rozdíl?
13.4.2016,  inzerce,  PR článek