Trable s českými titulky a jak na ně

Trable s českými titulky a jak na ně
, , návod
V mnoha internetových diskuzích zaměřených na multimediální zařízení se kupí dotazy na problémy s češtinou v titulcích. Jakým způsobem jsou titulky zakódované? Kde vznikají problémy s jejich kompatibilitou? Odpovědi najdete v tomto článku.
Kapitoly článku:
  1. Trable s českými titulky a jak na ně
  2. Kódování češtiny, tipy a triky
  3. Závěr a dodatky



reklama

Kódování češtiny


Už bylo zmíněno, že výhodou obrázkových a napevno vložených titulků je odpadnutí problémů se špatným zobrazení některých znaků. To je problém textových titulků, jež nejsou ničím jiným než obyčejným textovým souborem, který až na výjimky neobsahuje explicitní informace o použitém kódování ani diakritice. Avšak kódování je něčím, bez čeho by žádný textový soubor nemohl ani existovat. Kódování a diakritika se proto dá zjistit (upravovat) pomocí textového editoru nebo pomocí editoru titulků.


Textový editor PSPad, takový lepší poznámkový blok.

Jedním z takových textových editorů je PSPad, kde se použité kódování zobrazuje na dolní liště programu. Změna kódování se provádí v položce menu Formát, změna diakritiky zase přes Formát → Písmo (pro české titulky musí být zaškrtnutý skript Středoevropský).

U kódování je na výběr mezi Windows (CP1250), ISO 8859-2, UTF-8 a několika dalšími, které však multimediální zařízení obvykle nepodporují. Jde o kódování bří. Kamenických („CP895“) a Latin II (CP852) z dob DOSu. Novější UTF-16 LE a UTF-16 BE zřejmě nemá moc velkou podporu kvůli dvojnásobné velikosti oproti UTF-8 (Matroška používá UTF-8).


Je potřeba nastavit správnou diakritiku/skript.

Windows (CP1250, WinCS, WinEE) je asi nejpodporovanějším typem kódování češtiny (i dalších jazyků) v titulcích zobrazitelných na multimediálních zařízeních. Je to zřejmě dáno dominancí Microsoftu na poli OS začátkem 90. let minulého století (v době, kdy existovalo 6 různých kódování češtiny). Se starším ISO 8859-2 (ISO Latin 2, CP912) má společné to, že CP1250 obsahuje všechny tisknutelné znaky ISO 8859-2, ale 14 jich má jiný kód a kódy v rozsahu 128-159 jsou v CP1250 tisknutelné. Chybné nastavení kódování se ukáže např. při pokusu o zobrazení znaku „ť“.


Odstrašující příklad špatného zobrazování některých českých znaků (v tomto případě znak „té s háčkem“).

Původní ASCII (American Standard Code for Information Interchange) kódování zabíralo 7 bitů, ale „neumělo“ češtinu. Kódování CP1250, ISO 8859-2, Kamenických i CP852 zabírá 8 bitů (1 Byte), ale problémem těchto kódování je fakt, že text nemůže zobrazit více abeced zároveň. Pro zobrazení více abeced vzniklo kódování UTF-8 vycházející z normy ISO/EIC 10646 (Unicode), jakýkoliv znak ASCII vyžaduje 1 Byte (8 bitů), jakýkoliv český Unicode znak zabere 2 Byty (16 bitů). Z těchto důvodů je UTF-8 výhodnější než předešlá kódování (když je podporované přehrávačem).

Tabulka českých znaků Unicode

Znak
HTML entita
Dec
Hex
UTF-8 v URL
ÁÁÁÁ%C3%81
ČČČČ%C4%8C
ĎĎĎĎ%C4%8E
ÉÉÉÉ%C3%89
ĚĚĚĚ%C4%9A
ÍÍÍÍ%C3%8D
ŇŇŇŇC5%87
ÓÓÓÓ%C3%93
ŘŘŘŘ%C5%98
ŠŠŠŠ%C5%A0
ŤŤŤŤ%C5%A4
ÚÚÚÚ%C3%9A
ŮŮŮŮ%C5%AE
ÝÝÝÝ%C3%9D
ŽŽŽŽ%C5%BD
áááá%C3%A1
čččč%C4%8D
ďďďď %C4%8F
éééé%C3%A9
ěěěě%C4%9B
íííí%C3%AD
ňňňň%C5%88
óóóó%C3%B3
řřřř%C5%99
šššš%C5%A
ťťťť%C5%A5
úúúú%C3%BA
ůůůů%C5%AF
ýýýý%C3%BD
žžžž%C5%BE


Tipy a triky


Chybějící podpora češtiny v titulcích dokáže pořádně pokazit zážitek ze sledování filmu, protože málokomu vyhovují znaky jako è, ĉ nebo ⅔ tam, kde mají být písmena s háčky a čárkami. Asi nejrozumnější bude nejdřív zjistit, jestli je kódování přehrávače nastaveno správně, tj. CP1250, ISO 8859-2 nebo UTF-8.

Diakritika pak musí být zadána jako střední Evropa (Central Europe), popřípadě východní Evropa (East Europe). U vnitřních titulků MKV souborů musí být UTF-8 nastaveno vždy, u ostatních titulků je potřeba zjistit jejich kódování pomocí textového editoru nebo metodou „pokus/omyl".


I ve stolních přehrávačích je potřeba nastavit správné kódování a diakritiku titulků.

Pokud dané kódování není v menu přehrávače, je ještě možné, že na internetových stránkách výrobce bude novější firmware podporující dané kódování. Pokud ani to není k dispozici, nezbývá už nic jiného, než titulky upravit (pokud chcete titulky spustit na dané „mašině“), nebo je vložit napevno do filmu.


Náhled obrazovky AviDemuxu.

Druhou možnost lze provést pomocí editoru videa, jako je např. AviDemux nebo VirtualDub (s filtry VobSub). V případě AviDemux je nutné nejdřív zkonvertovat titulky na ISO 8859-2 nebo UTF-8 (např. v PSPadu), protože nepodporuje CP1250 (rozdíl v kódování českých znaků v ISO 8859-2 a CP1250 je patrný z tabulky v dodatcích na konci článku). V AviDemux je potřeba nastavit video na např. MPEG-4 ASP (Xvid4), v sekci Filtry dále vybereme Titulky a např. Subtitler.

V nastavení samotného filtru lze nastavit soubor s titulky, písmo (TTF), kódování, barvu, velikost a umístění, automatické rozdělování a zpoždění v ms. Výsledek je možné zjistit pomocí Náhledu, ale zpracování výsledného videa může trvat od několika desítek minut až po několik hodin! Závisí to samozřejmě na výkonu používaného počítače.


Titulky vyříznuté z Náhledu.

Daleko rychlejší bývá úprava titulků, kdy někdy stačí upravit kódování, případně diakritiku (v PSPadu Formát >> Písmo >> Skript: Středoevropský) nebo odstranit háčky a čárky (např. v utilitě Diakritika 1.0). Pak je tu možnost převést textové titulky na VobSub (IDX/SUB) např. pomocí aplikace SubtitleCreator. V SubtitleCreator je ale ovládání v Angličtině a česká diakritika se nastavuje v menu Formatting >> character encoding: central Europe.


Takto vypadá pracovní prostředí aplikace Subtitle Workshop.

Pak existuje celá řada dalších programů na úpravu titulků, se kterými je možné převést titulky do formátu, který stolní přehrávač ovládá. Za zmínku stojí určitě následující:

Subtitles Wizard (13 formátů titulků), Nástroj na titulky, Subtitle Workshop (56 formátů titulků u v. 1.05), Titulky, SrtToSub konvertor (jen anglicky, ze .str do .sub a naopak), DivXLand Media Subtitler (jen anglicky, 30 formátů titulků), SubRip 1.50 Beta 4 (titulky z DVD do BMP nebo TXT).
Nejnovější články
BenQ CineHome W1700: konečně levnější 4K projektor s HDR BenQ CineHome W1700: konečně levnější 4K projektor s HDR
Domácí projektory s nativním 4K rozlišením a podporou HDR pořád nepatří mezi nejdostupnější, situace se však zlepšuje. Dokazuje to také novinka od BenQ, která se bude prodávat za méně než 40 tisíc korun.
Dnes, aktualita, Jáchym Šlik
Philips TV se zárukou 5 let? Využijte nové akce Philips TV se zárukou 5 let? Využijte nové akce
Pokud budete pod stromeček pořizovat nový televizor Philips s Ambilight, můžete získat prodlouženou pětiletou záruku. Stačí produkt zakoupit u některého z vybraných prodejců a do měsíce jej zaregistrovat na internetu.
Dnes, aktualita, Jáchym Šlik
Toshiba prodala divizi televizorů čínskému HiSense Toshiba prodala divizi televizorů čínskému HiSense
Toshiba pokračuje v ořezávání své společnosti a zbavuje se divize Visual Solutions, která se zabývá také televizory. Novým vlastníkem je čínský výrobce HiSense, ale zatím není jasné, zda značku Toshiba zachová.
Včera, aktualita, Jáchym Šlik
Amazon chce Prime Video zdarma, ale s reklamami Amazon chce Prime Video zdarma, ale s reklamami
Služba Amazon Prime Video by v budoucnu mohla mít bezplatnou verzi, která by obsahovala reklamy. Amazon navíc jedná také s filmovými studii či televizními stanicemi, takže by neměla být nouze o obsah třetích stran.
Včera, aktualita, Jáchym Šlik1 komentář
Vimeo začíná podporovat videa v HDR, brzy přidá 8K Vimeo začíná podporovat videa v HDR, brzy přidá 8K
Vimeo oznámilo, že začíná podporovat videa s vysokým dynamickým rozsahem, která si zatím mohou vychutnat třeba majitelé vybraných zařízení od Applu. Služba reaguje také na zvyšující se rozlišení, brzy proto umožní nahrát až 8K videa.
Včera, aktualita, Jáchym Šlik