Fonetické abecedy v jazykových slovnících a v HTML
David Zbíral
Úvod
Je několik způsobů, jak zapisovat výslovnost fonetickou abecedou do elektronických slovníků, popřípadě i jak zajistit její správné vytištění; záleží na tom, jaký slovník či formát používáte.
Není to tak snadné, jak by mohlo; fonetická abeceda IPA byla dělána bez výhledu na elektronizaci fonetických zápisů a běžné fonty zase bez předpokladu, že jimi bude zapisována fonetická abeceda.
Způsoby zápisu se dají obecně rozdělit minimálně do čtyř skupin:
1.) Spokojení se s takovou fonetickou abecedou, která si vystačí se znaky ASCII či s takovými znaky, které jsou v příslušném kódování k dispozici. Příkladem je „počeštěný“ přepis či na angličtinu zaměřená fonetická abeceda SAMPA.
2.) Užívání specifických kódů pro speciální znaky. To je velmi dobrá volba. Problémy dělá podpora příslušných kódů v programech. Pokud si tvoříte vlastní program, máte to v rukou a můžete problémům předejít. Naopak pokud se musíte spoléhat například na prohlížeč, tak pro některé znaky IPA budete muset užívat znaky náhradní. Níže se rozebírají kódy zapsané do HTML ve formě &#[číslo];, například ə pro schwa („obrácené e“). Některé z těchto kódů pro znaky IPA správně nezobrazují ani ty nejnovější prohlížeče (psáno 6/2004; Phoenix 0.5 to zobrazuje hodně dobře, Mozilla 1.7 stejně tak, Internet Explorer 6 bohužel ledacos špatně, Netscape 4 selhává dost, ale už se používá minimálně). Ale ve fontu Lucida Sans Unicode – který je dostatečně rozšířený na to, aby se s ním dalo počítat, a lze si ho ostatně stáhnout – je to o dost lepší než v Times New Roman.
Lingea Lexicon: má vlastní kódy pro zápis fonetické abecedy, takže pokud používáte ten, přečtěte si o ní v sekci věnované Lingea Lexiconu (podsekce o tvorbě hesel, viz zde).
HTML: některé kódy určené k zápisu fonetické abecedy do HTML se rozebírají níže ve zvláštní kapitole a tam jsou také podrobnější informace.
3.) Užívání speciálního fontu. Zcela spolehlivé, ale vyžaduje to jeho nainstalování na každém počítači, kde se to má správně zobrazit. Odkazy na takové fonty (často zdarma) najdete níže ve zvláštní kapitole.
4.) Používání obrázků. To je vlastně jen pro ty, kdo umějí programovat či znají HTML. Nejjistější pokud jde o zobrazení, nejnešikovnější pokud jde o čistotu kódu, případně i rychlost načtení. Také strojové zpracování a případné budoucí překódování či změny formátu dělá potíže. Spíše nedoporučuji, ale pokud chcete mít jistotu, tak to může být užitečné; obrázky jsou k dispozici na http://www.blahedo.org/ascii-ipa.html, stačí si tu stránku uložit. Ale nejsou tam všechny, např. nosové otevřené o.
Níže najdete odkazy, kde se lze dovědět o všech těchto způsobech víc. Obecně platí: než vytvoříte nějaký vlastní systém, podívejte se, jak to dělají ostatní a zda by nebylo lepší některý systém převzít.
HTML a fonetická abeceda
V HTML je asi nejlepší užívání nikoli speciálního fonetického fontu, nýbrž některého rozšířenějšího fontu založeného na UNICODE, např. Lucida Sans Unicode. Zde jste samozřejmě omezeni kódováním, neboť ne všechno se dá napsat např. do kódování windows-1250, ale toto omezení je vyřešeno užitím speciálních hexadecimálních kódů, z nichž některé se uvádějí níže a patrně všechny potřebné se uvádějí na jedněch stránkách věnovaných zápisu fonetické abecedy.
Ani Lucida neobsahuje všechny znaky, které jsou potřeba. Je myslím součástí běžné instalace Windows a lze ji stáhnout a nainstalovat.
Pokud vás zajímá převaděč z lingeovské fonetické abecedy do kódů HTML a umíte pracovat s makry, stáhněte si makra pro Word, kde jsem na to sestavil proceduru (hledejte ji pod názvem LingeaHTMLFonetickáAbeceda).
Následují kódy vybraných znaků užívaných abecedou International Phonetic Alphabet čili Alphabet Phonétique Internationale (IPA = API) k vložení do kódu HTML (vlastně jen pro ty, kdo umějí HTML nebo ty, kdo se to chtějí naučit: viz dobrý výukový materiál k HTML; například z Wordu to lze ale ukládat přímo, sám se o převod postará, takže není třeba se kódy učit). Přehlednou tabulku kódů, úplnější než soupis, který následuje, najdete na jiných stránkách.
Znovu upozorňuji, že vše závisí na podpoře prohlížeči; v nejrozšířenějším prohlížeči – Internet Exploreru – vůbec není dobrá, přinejmenším ve verzi 6, zvlášť pokud je pro zápis fonetické abecedy užíváno písmo Times New Roman. Doporučuji zkusit si i jiné fonty, zejména Lucida Sans Unicode. Obsahuje četné znaky IPA, které jsou v Times New Roman zobrazené v IE jako čtverečky. Lucida Sans Unicode je myslím takřka ve všech instalacích, čímž se otvírá vítaná možnost. Ale některé znaky zase nemá Lucida. Takže je nejlepší pročíst si následující kódy a rozhodnout se. Ať už zvolíte písmo Times New Roman nebo Lucida Sans Unicode, budete muset některá písmena psát nestandardními náhradními znaky. Samozřejmě je potřeba to psát pořád stejně. Já používám Lucidu. Nemusí to být přímo Lucida – je prostě potřeba font založený na Unicode, který má dané znaky propracované; soupis těchto fontů najdete na jiných stránkách. Budu v následujícím textu mluvit o Lucidě, která je asi nejrozšířenější, ale mám na mysli potenciálně většinu z těchto fontů.
Vykřičník v závorce značí, že to Internet Explorer 6 zobrazuje ve fontu Times New Roman zcela špatně, jako čtvereček (v takovém případě je také připojena poznámka o Lucida Sans Unicode; jak již bylo uvedeno, poznámka o Lucida Sans Unicode často platí i o dalších fontech založených na širším zpracování znakové sady UNICODE).
Možná se vám ani následující text nezobrazí správně; pro tento případ připojuji komentáře typu „a s tildou“; kódy by měly zůstat v pořádku. Kde dělá zobrazení v MSIE ve fontu Times New Roman problémy, tam uvádím obvykle jen popis, ne příslušný znak.
- ã (a s tildou): ã
- ẽ (e s tildou): ẽ. Ten ale zase není v Lucida Sans Unicode; v Lucidě doporučuji kombinaci e a znaku ̃.
- ə (schwa, „obrácené e“), např. v anglickém slově afford či francouzském slově le: ə.
- ε (epsilon): ε (v Lucida Sans Unicode vypadá trochu divně, moc ne jako epsilon, ale pořadím je normálně v části, kde je řecká abeceda, takže je to ono: je potřeba si na mírně neobvyklý vzhled zvyknout).
- fí: toto řecké písmeno se píše dvěma způsoby; ten, který se užívá v IPA, Times New Romen nemá; má ho Lucida, a to pod φ (bez problémů i v IE).
- ĩ (i s tildou): ĩ
- ł (přeškrtnuté l): lze zapsat do kódu přímo, pomocí AltGr+k.
- ʎ: ʎ (!). Znak pro palatální („měkké“) l. Má ho Lucida.
- labiodentální mf, např. v českém nymfa: ɱ (!). Ve fontu Lucida Sans Unicode tento znak je.
- n s ocáskem na levé nožce, pro [ň]: ɲ (!). Ve fontu Lucida Sans Unicode tento znak je.
- ŋ (n s ocáskem na pravé nožce směřujícím vlevo, pro [ng]): ŋ
- otevřené o („obrácené c“): ɔ (!). Ve fontu Lucida Sans Unicode tento znak je. Doporučená alternativa, pokud nechcete používat Lucidu: velké O.
- õ (o s tildou): õ. Ale pozor, francouzské nosové o je otevřené, takže je třeba ho zapisovat pomocí kombinace ɔ a tildy ̃
- ø (šikmo přeškrtnuté o): ø
- œ (ligatura o a e): œ
- R (čípkové r): ʀ (!). V Lucidě bez potíží v IE i Mozille. V Mozille bez potíží i v Times (mám ale podle vzhledu pocit, že je to způsobeno skutečností, že Mozilla problémové znaky nahrazuje právě znaky Lucidy).
- ∫ [š]: správný znak je ʃ (!). Ve fontu Lucida Sans Unicode tento znak je. Doporučená alternativa, pokud nechcete používat Lucidu: ∫.
- Pro [č] má Lucida také speciální kód spojující obě písmena: ʧ. Pokud se přikloníte k Lucidě, doporučuji používat ten.
- θ (théta): θ
- ð: ð
- ũ (u s tildou): ũ
- ỹ (y s tildou): ỹ (nosové zaokrouhlené i, např. ve francouzském un tak, jak se vyslovovalo ve 14. století: [ỹn]); chybí v Lucida Sans Unicode; tam je potřeba to řešit kombinací y a ̃.
- ɥ („překlopené h“): ɥ v Lucida Sans Unicode (v Times není); užíváno např. v přepise francouzského lui.
- „trojkové z“ [ž]: ʒ (!). Ve fontu Lucida Sans Unicode tento znak je. Doporučená alternativa, pokud nechcete používat Lucidu: ž (v databázích určených česky mluvícím).
- Co jsem nenašel v Times ani Lucidě: otevřené o s tildou, œ s tildou, epsilon s tildou (pokud víte, jak na to, popřípadě můžete potvrdit, že to nejde, dejte vědět). Tam je asi nutné to řešit náhradním znakem. Doporučené náhradní znaky: příslušný znak následovaný znakem ~ (tj. např. [œ~]) nebo ještě lépe znakem ̃, který je v Times i Lucidě vlnovkou nahoře mírně posunutou doleva (tj. nad předchozí písmeno) a který má navíc tu výhodu, že ho IE (minimálně od verze 6) „přilepí k písmeni“ – sníží ho dolů (což je dobře hlavně kvůli e s tildou a y s tildou a otevřenému o s tildou ve fontu Lucida; Phoenix ho nepřilepí, ale zobrazí, a to je hlavní; NN 4 tento znak neumí vůbec; u œ přilepení nefunguje ani v IE, ale stejně je to daleko lepší než psát obyčejnou vlnovku ~).
- Co není v Lucidě, ale v Times New Roman ano: z důležitých znaků jsem v Lucidě (vedle těch, které neobsahuje Times ani Lucida) nenašel e s tildou a y s tildou; je potřeba to řešit přes e či y následované znakem ̃.
- Poznámka k alternativnímu zápisu: některé znaky se dají také napsat např. v podobě ã, ale to rozhodně nedoporučuji; lepší je používat číselné kódy, protože je na ně větší spoleh ve všech prohlížečích a protože alternativní zápis dělá zmatek a vede k lidským chybám (např. ã funguje, ale &etilde; ne, atd.).
- Připomínám, že ve formátu PDF všechny znaky zůstanou na všech počítačích tak, jak vypadají na tom vašem; u PDF není potřeba, aby měl uživatel daný font nainstalovaný; na vzhled je možné se spolehnout. Formát PDF je na slovníky nevhodný, ale pro publikování prací obsahujících fonetické přepisy se tato jeho vlastnost může velmi hodit. Taky připomínám, že obrazovka se dá sejmout do systémové schránky klávesou PrtSc a posléze vložit (Ctrl+V) v některém fotoeditoru a uložit jako obrázek.
Jak si nainstalovat font a jak si prohlédnout znaky
Font si uložte z internetu někam na disk a pak jděte ve Windows do Start / Ovládací panely / Písma. Tam zvolte Soubor / Nainstalovat a procházením se dostaňte k příslušnému souboru s fontem, který jste si předtím uložili. Zvolte ho a stiskněte OK (či nějaké podobné tlačítko: může se možná lišit podle verze Windows). Poté, co font nainstalujete, si můžete pod Start/Všechny programy/Systémové nástroje/Mapa znaků prohlédnout, kde je který znak.
Odkazy jinam (IPA, speciální fonty fonetické abecedy aj.)
http://www.phon.ucl.ac.uk/home/wells/ipa-unicode.htm [IPA a decimální i hexadecimální kódy jejích znaků (např. pro zápis do HTML). Důležitý materiál, kde najdete mnoho znaků, které seznam uvedený výše neobsahuje.]
http://www.arts.gla.ac.uk/IPA/ipachart.html [Tabulka IPA (API) jako obrázek, odkazy na fonty.]
http://www.blahedo.org/ascii-ipa.html [Velmi užitečná srovnávací tabulka: fonetické znaky v UNICODE, v různých fonetických abecedách aj.]
www.orbilat.com/Fonts/ [Font Times NR Phonetic. Neobsahuje všechny znaky, ani některé důležité.]
http://www.phon.ucl.ac.uk/home/wells/fonts.htm [Speciální fonty zdarma ke stažení; spíše nedoporučuji; zdá se mi, že obsahuje víc znaků než Times NR Phonetic, ale zase neobsahuje některé obvykleji užívané.]
http://pirin.worklogic.com/rechnik/rechnik.plex?phon=ASK [Rozcestník na fonty ke stažení (ale je jich tu málo, jeden je Lucida, která je součástí obvyklé instalace Windows), srovnávací tabulka.]
http://users.otenet.gr/~bm-celusy/font.html [Rozcestník.]
Zkuste také zadat do svého oblíbeného vyhledavače Phonetic Fonts, Internetional Phonetic Alphabet Font.
Tyto stránky: jiné oddíly
Jazyky, slovníky: úvodní stránka, slovníky (databáze) ke stažení
Jazyky, slovníky: souhrn materiálů
Zavřenost a otevřenost samohlásek v současné francouzštině
Publikování této verze: 22. 6. 2008 22:49
Sepsání: červen 2004
Poslední celková revize: 5. 6. 2004
Počet normostran (v přepočtu): 6,5
Počet slov: 1881
Umístění: http://www.david-zbiral.cz/fonhtml.htm