← Jazyky, slovníky

Fonetické abecedy v jazykových slovnících a v HTML

David Zbíral

Úvod

Je několik způsobů, jak zapisovat výslovnost fonetickou abecedou do elektronických slovníků, popřípadě i jak zajistit její správné vytištění; záleží na tom, jaký slovník či formát používáte.

Není to tak snadné, jak by mohlo; fonetická abeceda IPA byla dělána bez výhledu na elektronizaci fonetických zápisů a běžné fonty zase bez předpokladu, že jimi bude zapisována fonetická abeceda.

Způsoby zápisu se dají obecně rozdělit minimálně do čtyř skupin:

 

1.) Spokojení se s takovou fonetickou abecedou, která si vystačí se znaky ASCII či s takovými znaky, které jsou v příslušném kódování k dispozici. Příkladem je „počeštěný“ přepis či na angličtinu zaměřená fonetická abeceda SAMPA.

 

2.) Užívání specifických kódů pro speciální znaky. To je velmi dobrá volba. Problémy dělá podpora příslušných kódů v programech. Pokud si tvoříte vlastní program, máte to v rukou a můžete problémům předejít. Naopak pokud se musíte spoléhat například na prohlížeč, tak pro některé znaky IPA budete muset užívat znaky náhradní. Níže se rozebírají kódy zapsané do HTML ve formě &#[číslo];, například ə pro schwa („obrácené e“). Některé z těchto kódů pro znaky IPA správně nezobrazují ani ty nejnovější prohlížeče (psáno 6/2004; Phoenix 0.5 to zobrazuje hodně dobře, Mozilla 1.7 stejně tak, Internet Explorer 6 bohužel ledacos špatně, Netscape 4 selhává dost, ale už se používá minimálně). Ale ve fontu Lucida Sans Unicode – který je dostatečně rozšířený na to, aby se s ním dalo počítat, a lze si ho ostatně stáhnout – je to o dost lepší než v Times New Roman.

Lingea Lexicon: má vlastní kódy pro zápis fonetické abecedy, takže pokud používáte ten, přečtěte si o ní v sekci věnované Lingea Lexiconu (podsekce o tvorbě hesel, viz zde).

HTML: některé kódy určené k zápisu fonetické abecedy do HTML se rozebírají níže ve zvláštní kapitole a tam jsou také podrobnější informace.

 

3.) Užívání speciálního fontu. Zcela spolehlivé, ale vyžaduje to jeho nainstalování na každém počítači, kde se to má správně zobrazit. Odkazy na takové fonty (často zdarma) najdete níže ve zvláštní kapitole.

 

4.) Používání obrázků. To je vlastně jen pro ty, kdo umějí programovat či znají HTML. Nejjistější pokud jde o zobrazení, nejnešikovnější pokud jde o čistotu kódu, případně i rychlost načtení. Také strojové zpracování a případné budoucí překódování či změny formátu dělá potíže. Spíše nedoporučuji, ale pokud chcete mít jistotu, tak to může být užitečné; obrázky jsou k dispozici na http://www.blahedo.org/ascii-ipa.html, stačí si tu stránku uložit. Ale nejsou tam všechny, např. nosové otevřené o.

 

Níže najdete odkazy, kde se lze dovědět o všech těchto způsobech víc. Obecně platí: než vytvoříte nějaký vlastní systém, podívejte se, jak to dělají ostatní a zda by nebylo lepší některý systém převzít.

HTML a fonetická abeceda

V HTML je asi nejlepší užívání nikoli speciálního fonetického fontu, nýbrž některého rozšířenějšího fontu založeného na UNICODE, např. Lucida Sans Unicode. Zde jste samozřejmě omezeni kódováním, neboť ne všechno se dá napsat např. do kódování windows-1250, ale toto omezení je vyřešeno užitím speciálních hexadecimálních kódů, z nichž některé se uvádějí níže a patrně všechny potřebné se uvádějí na jedněch stránkách věnovaných zápisu fonetické abecedy.

Ani Lucida neobsahuje všechny znaky, které jsou potřeba. Je myslím součástí běžné instalace Windows a lze ji stáhnout a nainstalovat.

Pokud vás zajímá převaděč z lingeovské fonetické abecedy do kódů HTML a umíte pracovat s makry, stáhněte si makra pro Word, kde jsem na to sestavil proceduru (hledejte ji pod názvem LingeaHTMLFonetickáAbeceda).

 

Následují kódy vybraných znaků užívaných abecedou International Phonetic Alphabet čili Alphabet Phonétique Internationale (IPA = API) k vložení do kódu HTML (vlastně jen pro ty, kdo umějí HTML nebo ty, kdo se to chtějí naučit: viz dobrý výukový materiál k HTML; například z Wordu to lze ale ukládat přímo, sám se o převod postará, takže není třeba se kódy učit). Přehlednou tabulku kódů, úplnější než soupis, který následuje, najdete na jiných stránkách.

Znovu upozorňuji, že vše závisí na podpoře prohlížeči; v nejrozšířenějším prohlížeči – Internet Exploreru – vůbec není dobrá, přinejmenším ve verzi 6, zvlášť pokud je pro zápis fonetické abecedy užíváno písmo Times New Roman. Doporučuji zkusit si i jiné fonty, zejména Lucida Sans Unicode. Obsahuje četné znaky IPA, které jsou v Times New Roman zobrazené v IE jako čtverečky. Lucida Sans Unicode je myslím takřka ve všech instalacích, čímž se otvírá vítaná možnost. Ale některé znaky zase nemá Lucida. Takže je nejlepší pročíst si následující kódy a rozhodnout se. Ať už zvolíte písmo Times New Roman nebo Lucida Sans Unicode, budete muset některá písmena psát nestandardními náhradními znaky. Samozřejmě je potřeba to psát pořád stejně. Já používám Lucidu. Nemusí to být přímo Lucida – je prostě potřeba font založený na Unicode, který má dané znaky propracované; soupis těchto fontů najdete na jiných stránkách. Budu v následujícím textu mluvit o Lucidě, která je asi nejrozšířenější, ale mám na mysli potenciálně většinu z těchto fontů.

Vykřičník v závorce značí, že to Internet Explorer 6 zobrazuje ve fontu Times New Roman zcela špatně, jako čtvereček (v takovém případě je také připojena poznámka o Lucida Sans Unicode; jak již bylo uvedeno, poznámka o Lucida Sans Unicode často platí i o dalších fontech založených na širším zpracování znakové sady UNICODE).

Možná se vám ani následující text nezobrazí správně; pro tento případ připojuji komentáře typu „a s tildou“; kódy by měly zůstat v pořádku. Kde dělá zobrazení v MSIE ve fontu Times New Roman problémy, tam uvádím obvykle jen popis, ne příslušný znak.

Jak si nainstalovat font a jak si prohlédnout znaky

Font si uložte z internetu někam na disk a pak jděte ve Windows do Start / Ovládací panely / Písma. Tam zvolte Soubor / Nainstalovat a procházením se dostaňte k příslušnému souboru s fontem, který jste si předtím uložili. Zvolte ho a stiskněte OK (či nějaké podobné tlačítko: může se možná lišit podle verze Windows). Poté, co font nainstalujete, si můžete pod Start/Všechny programy/Systémové nástroje/Mapa znaků prohlédnout, kde je který znak.

Odkazy jinam (IPA, speciální fonty fonetické abecedy aj.)

http://www.phon.ucl.ac.uk/home/wells/ipa-unicode.htm [IPA a decimální i hexadecimální kódy jejích znaků (např. pro zápis do HTML). Důležitý materiál, kde najdete mnoho znaků, které seznam uvedený výše neobsahuje.]

http://www.arts.gla.ac.uk/IPA/ipachart.html [Tabulka IPA (API) jako obrázek, odkazy na fonty.]

http://www.blahedo.org/ascii-ipa.html [Velmi užitečná srovnávací tabulka: fonetické znaky v UNICODE, v různých fonetických abecedách aj.]

www.orbilat.com/Fonts/ [Font Times NR Phonetic. Neobsahuje všechny znaky, ani některé důležité.]

http://www.phon.ucl.ac.uk/home/wells/fonts.htm [Speciální fonty zdarma ke stažení; spíše nedoporučuji; zdá se mi, že obsahuje víc znaků než Times NR Phonetic, ale zase neobsahuje některé obvykleji užívané.]

http://pirin.worklogic.com/rechnik/rechnik.plex?phon=ASK [Rozcestník na fonty ke stažení (ale je jich tu málo, jeden je Lucida, která je součástí obvyklé instalace Windows), srovnávací tabulka.]

http://users.otenet.gr/~bm-celusy/font.html [Rozcestník.]

Zkuste také zadat do svého oblíbeného vyhledavače Phonetic Fonts, Internetional Phonetic Alphabet Font.

Tyto stránky: jiné oddíly

Jazyky, slovníky: úvodní stránka, slovníky (databáze) ke stažení

Jazyky, slovníky: souhrn materiálů

Zavřenost a otevřenost samohlásek v současné francouzštině


Publikování této verze: 22. 6. 2008 22:49

Sepsání: červen 2004

Poslední celková revize: 5. 6. 2004

Počet normostran (v přepočtu): 6,5

Počet slov: 1881

Umístění: http://www.david-zbiral.cz/fonhtml.htm

← Jazyky, slovníky