← Jazyky, slovníky: úvodní stránka

Počítačové slovníky

David Zbíral

Upozornění

Před užíváním databází je nutné se seznámit s kapitolou o licenci a autorských právech. Všechny informace a data z těchto stránek užíváte na vlastní nebezpečí.

Databáze ke stažení

Samotné databáze v základním formátu

Najdete zde v současné době tyto dvojjazyčné databáze určené k užívání v některém elektronickém slovníku (jedná se ve všech případech o databáze cizojazyčno-české, použitelné oběma směry): anglickou, bulharskou, francouzskou, latinskou, německou, okcitánskou, řeckou (klasická řečtina), srbskou, starofrancouzskou, staroslověnskou, španělskou. Databáze jsou řazeny abecedně. Jsou přizpůsobeny importu do slovníku Millennium, ale formát je vhodný i pro jiné programy (popřípadě uzpůsobitelný za použití hromadného nahrazování, např. ve Wordu). Verze vybraných databází určená pro Lingea Lexicon je ke stažení níže. Ty databáze, které tu ve verzi určené pro Lingea Lexicon publikovány nejsou, si lze do vhodného formátu upravit pomocí níže publikovaného makra.

Autorství: u těch databází, kde není uvedeno jinak, je jejich autorem David Zbíral.

Databáze ve formátu pro Lingea Lexicon: ke stažení zde. Zejména u okcitánské a řecké databáze doporučuji verzi ve formátování pro Lingea Lexicon nebo v HTML, popř. PEKI, protože jejich verze v základním formátu svou kvalitou velmi zaostaly a zastaraly. Totéž platí do značné míry i o databázi francouzské.

Před užíváním databází je nutné seznámit se s kapitolou o licenci a autorských právech.

V čem databáze používat? Pokud jste rozhodnuti pro databáze v základním formátu, tak pro AJ, NJ a FJ doporučuji Millennium, protože se zároveň hledá jak v databázích základních, tak v databázích z těchto stránek. Pro ostatní jazyky (staroslověnština apod.) Millennium není vhodné; pro ty doporučuji PEKI. Jak databáze do PEKI importovat, se dovíte v kapitole PEKI.

 

Seznam zkratek a značek užívaných v těchto databázích

 

Anglicko-český / česko-anglický slovník [Cca 760 jednotek.]

Bulharsko-český / česko-bulharský slovník [Cca 270 jednotek. O využití této databáze prostřednictvím např. slovníku anglicko-českého viz níže „Využití elektronického slovníku pro širší účely“.]

Francouzsko-český / česko-francouzský slovník [Cca 9340 jednotek. Dosti spolehlivá a rozsáhlá databáze.]

Latinsko-český / česko-latinský slovník [Cca 5270 jednotek. O využití této databáze prostřednictvím např. slovníku anglicko-českého viz níže kapitolu „Využití elektronického slovníku pro širší účely“. Zaměření této databáze: většina je běžný slovní fond pro nejširší použití. Ale myslím, že databázi velmi ocení i ti, kteří čtou ve středověké latině či z ní překládají, protože z ní je tu i ledacos, co se běžně ve slovníku nenajde, např. včetně různých geografických názvů spojených s Bosnou, Dalmácií, Itálií, jižní Francií atd. a jsou sem zahrnuty i mnohé prameny, s nimiž autoři slovníků středověké latiny běžně nepracují. Autoři: David Zbíral a Anna Žáková.]

Německo-český / česko-německý slovník [Cca 610 jednotek. Viz výše anotaci francouzského slovníku pro postup importu.]

Okcitánsko-český / česko-okcitánský slovník [Cca 215 jednotek. Slovník středověké okcitánštiny. Obsahuje různé tvary, které se v textech vyskytují, třeba i takové, které jsou ojedinělé a lze je považovat za chybné; jeho cílem je usnadnit porozumění textům, ne prezentovat normu okcitánského jazyka. Nebere v potaz nářeční rozrůzněnost okcitánštiny.]

Řecko-český / česko-řecký slovník (klasická řečtina) [Cca 150 jednotek. Více doporučuji verzi v HTML, protože ta je barevná a správně zobrazuje řecký font. Přizpůsoben patrně nejpoužívanějšímu fontu SPIonic. Pokud váš slovník umožňuje zobrazení různé části hesla v různém fontu (např. Millennium ano), stáhněte si font SPIonic, nainstalujte ho a zvolte, aby cizojazyčná část pole byla formátována fontem Grenet či SPIonic. Pokud to váš slovník neumožňuje, budete nuceni si zvyknout na přepis (přesněji řečeno na rozložení znaků v Grenet či SPIonic). Pravidla psaní přízvuků aj. najdete pod touto kapitolou.]

Srbsko-český / česko-srbský slovník [Cca 170 jednotek. Dříve se neodlišovala srbština od chorvatštiny a mluvilo se o srbochorvatštině; tento slovník je vlastně „srbochorvatský“. Postupně doplňovaný soubor. O využití této databáze prostřednictvím např. slovníku anglicko-českého viz níže „Využití elektronického slovníku pro širší účely“.]

Starofrancouzsko-český / česko-starofrancouzský slovník [Cca 240 jednotek. Stará francouzština (9.-13. stol.).]

Staroslověnsko-český / česko-staroslověnský slovník [Cca 1900 jednotek. O využití této databáze prostřednictvím např. slovníku anglicko-českého viz níže „Využití elektronického slovníku pro širší účely“. O pravidlech transkripce, které se musely přizpůsobit tomu, co zvládne Millennium (přesněji kódování ANSI), viz níže pod kapitolou „Jazyky a textové editory“. Nejde jen o jednotky staroslověnské ve striktním smyslu (9.-11. stol.), ač ty převažují, nýbrž i o pozdější církevněslovanské tvary.]

Španělsko-český / česko-španělský slovník [Cca 2010 jednotek. Autorem naprosté většiny jednotek této databáze je Zdeněk Mareček, malou část dodal David Zbíral.]

Databáze uzpůsobené pro Lingea Lexicon

Najdete zde tyto balíčky slovníků ve formátu, který je vhodný pro Lingea Lexicon:

 

Pokud nastanou problémy při stahování: pokud se zobrazí hlášení „Stránku nelze zobrazit“, zkuste: 1.) zmáčknout Obnovit (popř. F5); 2.) klepnout na odkaz pravým tlačítkem myši a zadat Uložit cíl jako. Pokud soubor nejde stáhnout ani tak, upozorněte mě prosím e-mailem.

 

Slovník anglicko-český, německo-český, francouzsko-český a obráceně. Při česko-francouzském hledání databáze docházelo k problémům, neboť jde o databázi automaticky převedenou z poměrně obsažné databáze opačného směru, takže jsou příliš dlouhé řádky určené na heslová slova. Byla mírně upravena a snad už bude fungovat ve většině případů dobře. Když se u některého hesla LL kousne, hledejte hesla, v jejichž heslovém slově se daný výraz vyskytuje, a vymažte toto heslo nebo je instinktivně upravte. Neustálé problémy působí slova de, na, v, ve, o, být (a možná některá další). Slovník czfr-uziv4.udr lze také po rozbalení balíčku zcela odstranit; tím se o něj připravíte – což je nepříjemné, neboť je nejrozsáhlejší – ale vyhnete se velké části problémů (spočívajících v havarijním ukončování LL). Spíš doporučuji na to myslet a nehledat uvedená kritická slova.

Pokud se vám zdá start francouzského slovníku při používání slovníků z těchto stránek příliš pomalý a nestojí vám to za to, tak buď volte místo verze pro LL verzi v HTML (i ta však má své nevýhody), neboněkteré soubory s předponou czfr- či frcz- z podadresáře data vymažte. Doporučuji v takovém případě smazat (nebo raději jen přesunout do jiného adresáře pro budoucí použití) buď soubor czfr-uziv4.udr, nebo soubor czfr-uziv3.udr. Oba mají svou cenu, ale dost zpomalují start. Alespoň jeden z nich doporučuji ponechat. Problém pomalého startu způsobeného rozsáhlými uživatelskými slovníky by měla vyřešit možnost převodu do binárního formátu, která snad bude zpřístupněna ve vyšší verzi LL.

 

Slovník bulharsko-český, srbochorvatsko-český, staroslověnsko-český a obráceně.

 

Slovník španělsko-český, okcitánsko-český, starofrancouzsko-český a obráceně.

 

Slovník řecko-český (klasická řečtina). LL 2002 ještě nemá zakomponováno přiřazení konkrétního fontu značkám, takže doporučuji raději než verzi pro LL volit verzi v HTML. Pokud zvolíte přece jen HTML, tak je zatím třeba si zvyknout na rozložení kláves v SPIonic a umět si dekódovat např. slovíčko „w(j“ jako hós. Zobrazování kódu není bez chyb; snad ve vyšší verzi bude v pořádku a také bude zpřístupněna možnost přiřazení fontu. Doporučení: napište si řecké slovo ve wordovském dokumentu v SPIonic (např. v tabulce určené k vypisování slovíček) a do vyhledávacího okénka LL ho přeneste přes schránku. Znovu ale upozorňuji na možnost stáhnout si zcela totožný řecko-český slovník v HTML.

 

Latinsko-český slovník ve formátu pro Lingea Lexicon je připravován jako komerční produkt a není zde k dispozici ani se neposkytuje e-mailem.

 

Před užíváním těchto databází je nutné se seznámit s kapitolou o licenci a autorských právech.

 

Autorství: viz výše pod databázemi v základním tvaru nebo v samotném kódu slovníků poté, co si je stáhnete (dají se otevřít třeba v Poznámkovém bloku).

 

Nezapomeňte si uložit také seznam zkratek a značek užívaných v databázích.

 

K provozování těchto slovníků, stejně jako jakýchkoli slovníků vlastních, nemusíte být vlastníky plné licence; stačí si stáhnout bezplatnou demoverzi. Základní stránka pro registraci (jméno, e-mail) je http://www.lingea.cz/cz/demo_prev.htm.

Počty jednotek viz výše. I v Lingea Lexiconu vždy poznáte, co je součástí základní databáze a co naopak patří do uživatelského slovníku. Uživatelský slovník lze kdykoli editovat, vymazávat, doplňovat atd. Prostě příslušný slovník otevřete v Poznámkovém bloku a proveďte změny, které uznáte za vhodné.

 

Postup krok za krokem (pokud chcete používat jen jeden balíček, sledujte postup jen jednou, pokud chcete používat více z nich, proveďte ho pro každý balíček zvlášť):[1]

 

 

Vysvětlení čísel slovníků: v některých databázích jsou jen slovníky určitého čísla, např. Řecko-český slovník (1), Řecko-český slovník 3 apod. Liší se v tom, že slovník s implicitním indexem 1 obsahuje jednotky ručně dodělané a přehlédnuté, index 3 jednotky převedené automaticky sofistikovaným makrem ze slovníku opačného směru a projité jen v rychlosti či vůbec (u slovníku 3 bývá lepší formátování, ale někdy věcné chyby, např. přiřetězení určité fráze k ekvivalentu, k němuž nepatří) a konečně slovník 4 jednotky automaticky převedené méně sofistikovaným způsobem, kde nejsou chyby zřetězení, ale kde je o dost horší formátování; také slovníky 4 jsou projité jen v rychlosti či vůbec. Někde existuje jen slovník 3 a slovník 1 ještě vůbec nevznikl atd. Slovníky s indexem 2 jsou určeny pro budoucí binární verze.

Databáze obsažené v balíčcích ve většině rozhodně nejsou vzorem, jak by měly vypadat databáze pro LL, protože jde prostě o automaticky převedené a místy ručně upravené databáze, které byly původně přizpůsobeny slovníku Millennium. Zvlášť část česko-cizojazyčná není dobrá a ledacos se v ní nenajde, protože není správně členěná na hesla. Doporučuji užívat souběžně s Millenniem či jiným slovníkem, rozšířeným o databáze z těchto stránek.

Pokud pomineme malé množství příkladů a frází a skutečnost, že se řečtina zatím nezobrazuje v příslušném fontu, lze za formálně dost propracovanou považovat zejména databázi řecko-českou.

Pokud najdete v databázích nějakou chybu, dejte mi prosím vědět.

Databáze v HTML

Ke zobrazení slovníků v HTML vám stačí prohlížeč. Jsou k dispozici ve dvou podobách: (1) jako celé slovníkové tituly na jediné stránce a (2) jako malé soubory, které tvoří jednotlivá hesla a které si otvíráte ze správce souborů (Průzkumník apod.). Pro řečtinu vřele doporučuji, protože LL 2002 neumí zobrazovat řecké fonty, kdežto v těchto databázích je správně (pokud si font stáhnete). Samotné databáze, potřebné informace i údaje o výhodách a nevýhodách slovníků v HTML najdete na stránce Slovníky v podobě běžných stránek HTML.

Některé důvody, proč si databáze stáhnout

Postup importu do Millennia, případně dalších slovníků – zkrácená verze

Podrobněji viz pod anotacemi jednotlivých slovníků.

Následuje zkrácená a zjednodušená verze zaměřená na import těchto databází, ne na import vašich vlastních zdrojů.

Počkejte, až se vám stránka se slovíčky načte do konce. Pak pomocí Soubor / Uložit jako uložte na svůj disk či na disketu,[3] vstupte do uživatelského slovníku svého elektronického slovníku (Millennium: Soubor / Uživatelský slovník), zadejte import a zvolte tento soubor (který jste si předtím uložili). Pak stačí, pakliže jste tak ještě neučinili, vašemu elektronickému slovníku zadat, aby vyhledával i v uživatelském slovníku (tj. nejen v základní databázi), a slovník se vám tak dosti rozroste.

Správnost všech údajů zde nabízené databáze nelze samozřejmě zaručit, ale pokud na nějaký chybný narazíte, lze jej bez problémů z uživatelského slovníku odstranit nebo jej opravit a v Millenniu vždy poznáte podle ikonky vedle slova, zda je součástí základní databáze či uživatelského slovníku. Viz též níže mechanismus kontroly doplňujících databází.

Jak databázemi rozšířit jednotlivé slovníky (Millennium, Lingea atd.)

Jak si zajistit vždy aktuální verze

Zpřístupněte si ty ze zde publikovaných databází, které vás zajímají, offline (v MS Internet Exploreru pod nabídkou Oblíbené) a čas od času zadejte v prohlížeči Nástroje / Synchronizovat.

Jiná možnost: poznamenat si počet jednotek dané databáze v době, kdy tu stahujete, a osobně čas od času zkontrolovat na této stránce počty jednotek.

Další možnost: sledovat kapitolu Přírůstky a revize.

Obecně tyto osobní kontroly doporučuji víc než zpřístupnění offline.

Import aktualizované verze; import několika různých databází

Pokud máte v uživatelském slovníku jen materiál z těchto stránek, tak jej po stažení aktualizované verze celý vymažte a pak znovu importujte tuto aktualizovanou databázi (nestačí prostě importovat ji navíc k tomu, co už v předchozí je, to by se začaly mnohé informace příliš duplikovat, vedle sebe by koexistovala stará chybná i nová opravená verze dané jednotky atd.). Důvod je ten, že tyto databáze se i průběžně opravují, zpřesňují a rozšiřují v rámci jednotlivých hesel, tj. nejen doplňují novými jednotkami. Importovat novou bez vymazání staré je sice možné, ale znamená to, že vám ve slovníku vedle opravené verze zůstane také chybná verze dané jednotky.

Pokud ve svém uživatelském slovníku máte i materiály nepocházející z těchto stránek, např. slovíčka, která jste si sami vypsali, tak je dobré postupovat jinak: je sice také dobré si pravidelně zálohovat celý svůj uživatelský slovník, ale kromě toho si také už od počátku zálohovat zvlášť tyto vaše materiály; po vymazání uživatelského slovníku a po importu aktualizované verze importujete i tyto své materiály a uživatelský slovník tak bude znova kompletní. Praktický příklad: vypisujete si slovíčka do tabulky ve wordovském souboru a importujete si je do svého uživatelského slovníku a kromě toho si čas od času stahujete aktualizace databáze z těchto stránek. Proto je vhodné mít tyto soubory: 1.) přehledné wordovské apod. soubory, kam si slovíčka vypisujeme (psané do tabulky, pro nás obtížné věci zdůrazníme tučně či kurzívou atd., což se nijak ve výsledné databázi, která je „pouze text“, neprojeví): tyto soubory si tiskneme pro studijní účely; 2.) soubor se souhrnem všech vlastních slovíček, které nepocházejí z těchto stránek; 3.) souhrnný soubor obsahující celý exportovaný uživatelský slovník (abyste měli zálohu). Ale najděte si sami systém, který vám vyhovuje. Jen dejte pozor na to, že aktualizace těchto databází neznamená pouze doplnění novými jednotkami, ale i opravení překlepů, chyb a nepřesností (často opravení dosti významné), a proto je při každém importu nové verze slovníků z těchto stránek třeba tu starou smazat.[4]

Přírůstky a revize

 

Evidováno od února 2003. Na některé přírůstky jsem možná zapomněl. Údaje jsou přibližné. Informace o podílu revidovaných jednotek (40 % apod.) neznamená, že byly všechny znovu dohledávány, nýbrž že byly pročteny a prověření se dočkalo to, co bylo podezřelé.

Duplicity a přesnost údaje o počtu jednotek

Vzhledem k vyhledávacím chybám Millennia jsem někdy dal přednost neodstraňování přibližných duplicit. Je lepší, když to Millennium najde dvakrát, než vůbec. To může samozřejmě zkreslovat počet jednotek, ale jen mírně, ostatně podle počítání Millennia velká část zde publikovaných hesel obsahuje i o dost víc než jednu jednotku.

Prosba o upozorňování na chyby v těchto databázích

Kontrola: je samozřejmé, že v těchto doplňkových databázích se najdou mnohé chyby. Pokud s databázemi pracujete, tak si prosím střádejte do samostatného souboru všechny chyby, na které narazíte, a vždy když jich pár nastřádáte, tak mi soubor (nebo ještě lépe jen text z něj, zkopírovaný přes schránku do těla e-mailu) zašlete. Přispíváte tak zkvalitnění těchto databází, jejichž mechanismus kontroly je, zejména vzhledem k velmi omezeným časovým možnostem a absenci jakéhokoli finančního zabezpečení projektu, jen nedostatečný (konkrétněji: viz níže Mechanismus kontroly).

Zásady užité v jednotlivých databázích a doporučené pro jednotlivé jazyky

Obecné zásady lze najít níže v tomto dokumentu. Zde jsou vypsány zásady, kterých se snaží držet zde publikované databáze jednotlivých jazyků.

Francouzština

Francouzské znaky v databázi ke stažení na těchto stránkách jsou vizuálně špatné, byly totiž přizpůsobeny slovníku Millennium: ty, co se zdají špatné, by měly po importu vypadat naopak správně (kdežto kdyby zde vypadaly správně, tak se nesprávně konvertují). Importu do jiných slovníků, než je Millennium, to nemusí vyhovovat, ale lze to poměrně snadno v pokročilých textových editorech globálně zaměnit. Pokud pracujete s jinými slovníky a máte s mou databází nějaký problém, zkuste ho vyřešit právě zaměněním či překódováním.

Latina

Řečtina

Staroslověnština

Španělština

Zkratky a značky užívané v databázích

Seznam zkratek je dostupný v samostatném souboru.

Užité zdroje – obecná poznámka

Všechny zde publikované databáze jsou výsledkem práce s texty, nikoli plodem systematické lexikografické práce jdoucí po jednotlivých písmenech. Některé (např. latinsko-česká) se v poměrně značné míře zakládají na vlastní četbě a excerpování, takže někdy uvádějí i ledacos, co v jiných slovnících (přinejmenším těch, které jsou mi ve chvíli zpracovávání dostupné) chybí.

Jestliže se v databázi uvádí, že byl zdrojem zpracování daného hesla ten či onen slovník, tak u těch kvalitnějších (např. latinsko-česká) ve většině případů nejde o pramen jediný; přinejmenším bylo doplněno tu a tam nějaké synonymum (aniž by se na toto doplnění upozorňovalo značkou DZ či jinak); u slovníků cizojazyčno-cizojazyčných (latinsko-anglických apod.) též samozřejmě musím provést za použití svých znalostí či jiného slovníku (např. anglicko-českého) interpretaci významu a následné zpracování daného hesla v češtině. Často bylo též provedeno více či méně výrazné přeskupení. Přesně vzato v některých případech ani nejde o uvedení pramene; např. pokud v daném slovníku heslo není, tak slovník také zapíši a označuji tím, že byl zpracován, ne nutně, že nahlédnutí do něj vedlo k nějakému výsledku; to k němu doplňuji obvykle slovo „nic“ (např. „MLLM nic).

Např. poznámku „Pražák, LMALB“ je tedy třeba chápat tak, že byly zapracovány, často vedle dalších zdrojů (vlastní excerpta, fulltextové zdroje na internetu, dodání synonym aj.), všechny či téměř všechny základní významy (s případnou výjimkou těch chybných a rovněž některých v dnešní češtině zcela nesrozumitelných či nekorektních) uváděné pod daným heslem ve slovnících, jež se pod uvedenými zkratkami skrývají (Pražák, J. M. – Novotný, F. – Sedláček, J., Latinsko-český slovník, a kol., Latinitatis medii aevi Lexicon Bohemorum), a nikoli tak, že by šlo o jejich citaci – a už vůbec ne tak, že již není třeba v nich dané heslo nalistovávat, zvlášť proto, že také tam uváděné citace z pramenů významně pomohou k pochopení významu slova.

Přispěvatelé

Podíl na zde publikovaných databázích

Zdeněk Mareček

David Zbíral

Anna Žáková

Jiné přispění

Pavel Ponec

Vítězslav Sklář

Jan Vorba

 

Pokud jsem vás náhodou zapomněl uvést, tak rozhodně neváhejte se mi ozvat; rád bych, aby všichni přispěvatelé, kteří k tomu svolí, byli jmenovitě uvedeni, tak se ozvěte už kvůli přesnosti těchto stránek.

Licence, autorská práva

Zde publikované databáze je dovoleno používat k nekomerčním účelům v jakémkoli softwaru. Lze je pro vlastní potřebu upravovat a měnit jak co do formy, tak co do obsahu. Není dovoleno je jakýmkoli způsobem distribuovat. Jejich publikování na jiných internetových stránkách a na nosičích (CD přílohy časopisů věnovaných informačním technologiím apod.) a vůbec všechny druhy jejich distribuce, např. spolu s freewarovou nebo komerční platformou elektronického slovníku, jíž by sloužily jako databáze, popřípadě její část, jsou nezákonné bez předchozího výslovného písemného svolení autora (autorů). Kohokoli ale lze pochopitelně odkazovat na adresu této stránky, aby si databáze sám stáhl.

Také tyto stránky ani jejich části není dovoleno převzít a publikovat je jinde či je jakkoli šířit bez předchozího výslovného písemného svolení autora.

Rovněž publikování odvozených děl je bez předchozího výslovného písemného svolení autora nezákonné.

 

Za správnost databází se neručí. Autoři nepřebírají žádnou hmotnou, morální ani jakoukoli jinou myslitelnou zodpovědnost za případné přímé, nepřímé, následné či jiné škody vzniklé užíváním, nadužíváním, využíváním, zneužíváním nebo neužíváním těchto databází či jakýchkoli jiných informací uvedených na těchto stránkách.

Evidence doplnění a zpřehlednění této stránky

Aby čtenář jasně věděl, zda se tu od poslední návštěvy něco podstatného změnilo, byly vytvořeny dvě kapitoly: evidence přírůstků a tato kapitola. Ty přírůstky, které tvoří samostatnou stránku, jsou uvedeny jako hypertextový odkaz na příslušný materiál.

 

Zpřehlednění a úpravy souhrnu informací a doplnění informací o Lingea Lexiconu 7. 4. 2003.

Publikování jednoduché verze databází AJ, NJ a FJ uzpůsobených pro Lingea Lexicon 7. 4. 2003.

Zpřehlednění rozcestníku 13. 10. 2003.

Doplnění maker pro úpravu databází do tvaru vhodného pro Lingea Lexicon a PC Translator: 27. 10. 2003.

Doplnění informací o komplexním lexikografickém zpracovávání hesel pro Lingea Lexicon: 4. 12. 2003.

Další informace o formátování hesla pro Lingea Lexicon, přeskupení, zpřehlednění, oprava některých starších částí dokumentu: 7. 1. 2004.

Další informace o formátování hesla pro Lingea Lexicon a publikování databází v pokročilejším formátu určeném pro Lingea Lexicon: 20. 1. 2004.

Důležitá revize části o Lingea Lexiconu, upřesnění, rozšíření o několik obecných lexikografických zásad: 26. 1. 2004.

Doplnění nových a lépe fungujících slovníků česko-cizojazyčných ve formátu pro Lingea Lexicon do příslušných balíčků: 25. 2. 2004.

Fonetické abecedy a počítačové slovníky, fonetika a HTML: dodání stránky zpracovávající toto téma (14. 6. 2004).

Slovníky převedené do HTML: převedení všech databází z těchto stránek do formátu HTML, takže k jejich zobrazení stačí prohlížeč, např. Internet Explorer, a jejich publikování (21. 6. 2004).

 

Zanáším sem jen významnější revize a doplnění. Na něco jsem možná zapomněl.

Jednotlivé slovníky: anotace, návody, tipy

Pokud v následujícím textu hodnotím, tak toto hodnocení nemusí být prosto chyb a subjektivních soudů. Žádná z anotací však není psána na komerční objednávku, nýbrž podle mých zkušeností s daným slovníkem.

Který slovník zvolit?

Jednoznačně nejvíc doporučuji Lingea Lexicon, který umožňuje tvořit bohatě formátovaná a barevná hesla (podívejte se třeba na moje heslo intellego). Nevýhody: 1.) databáze jsou sice velmi dobré, ale placené, nyní asi 2000 Kč za nejrozsáhlejší verzi každé z nich; 2.) na internetu je málo zdarma dostupných databází ve formátu pro LL (pokud vím, tak nyní jen ty, které najdete na těchto stránkách). Nicméně z jednoduchých databází můžete do formátu pro LL převádět pomocí mých maker pro Word (viz níže kapitolu věnovanou LL).

provozování vlastních databází či např. databází z těchto stránek ovšem nepotřebujete nic kupovat, stačí bezplatná demoverze LL.

Pro jazyky užívající nelatinských abeced nyní doporučuji formát HTML či XML a převádění do zjednodušeného HTML pro slovník PEKI. Vývojářům ovšem i zde doporučuji, aby užívali formátování pro LL a do jiných formátů jen převáděli, např. mými makry LingeaHTML a SlovníkyHTMLdoXML, které jsou mezi makry. (XML je kvalitnější datová struktura než LL, nicméně u něj obvykle nelze využít mých četných wordovských maker, popř. skriptů ve VBS, a zejména jsem nenašel žádný dobrý slovníkový program, který by uměl pracovat s XML.)

Pokud chcete poměrně rozsáhlé slovníky AJ, NJ a FJ zdarma (byť se strukturou A=B), volte pro tyto jazyky Millennium. Dávají toho zadarmo dost. Millennium naopak rozhodně nedoporučuji používat jako platformu pro slovníky jiných jazyků, např. staroslověnsko-český z těchto stránek; k tomu používejte Lingea Lexicon nebo PEKI.

Výhodou PC Translatoru je velká databáze, nevýhodou je struktura A=B a poměrně vysoká cena.

Pokud jste si vytvořili databáze v jednoduchém formátu A=B či jste si je někde stáhli, můžete si je buď převést pomocí mých wordovských maker do formátu pro Lingea Lexicon (viz kapitolu o LL), nebo zvolit např. slovníky PEKI či Pokluda. Víc doporučuji PEKI. Pokud jsou to databáze AJ, NJ či FJ a vy chcete užívat Millennium, importujte je do Millennia.

Nejlepší je používat databází více, např. si koupit LL a vedle toho si ještě stáhnout Millennium – a stále ještě není možné zapomínat ani na tištěné slovníky. Je prastarou zásadou, že není dobré se spolehnout na jediný slovník.

Toto je jen orientační vodítko. Můžete si sami zkusit, co vám nejvíc vyhovuje.

Lingea Lexicon

Základní informace

Nastavení Lingea Lexiconu

Vyhledávání a práce s výsledkem hledání

#Ovoce

cherry

peach

strawberry

Uživatelské slovníky Lingea Lexiconu, import, demoverze

Příklad:

Title: "latina"
mask = "*-latina"
icon = "lg-rel"
view = "lg_latina"
t_en = "Latinsko-český slovník"
t_cz = "Latinsko-český slovník"

Title: "latina2"
mask = "*-latina2"
icon = "lg-usr"
view = "lg_latina"
t_en = "Latinsko-český slovník 2"
t_cz = "Latinsko-český slovník 2"

View: "lg_latina"

(a následovat budou definice; viz níže).

Takto lze aplikovat definiční soubor i většímu počtu slovníků téhož jazyka a směru než jen dvěma, teoreticky libovolnému počtu, a také lze mít více sekcí view a jednotlivým slovníkovým titulům (přesně řečeno sekcím Title) přiřadit tu sekci view, kterou chceme (za určitých okolností se může hodit mít dvě sekce view).

 

Komplexnější zpracování uživatelských hesel pro Lingea Lexicon: úvodní informace

Je vždy lepší zpracovávat hesla komplexně. K provozování uživatelských slovníků vám stačí bezplatná demoverze, nemusíte tedy vlastnit Lingea Lexicon, stačí si stáhnout demoverzi z http://www.lingea.cz/demo/d4encz1.exe. Jak zacházet s balíčky z těchto stránek: viz výše pod kapitolou věnovanou databázím určeným pro Lingea Lexicon.

Pokud si tvoříte v nějakém jazyce vlastní slovník, popřípadě si doplňujete některý slovník stažený z těchto stránek, máte s Lingea Lexiconem i jeho demoverzí možnost pojmout tuto práci komplexněji než jen nerozlišeně vypsat významy: učiní to práci se slovníkem účinnější, kvalitnější a přesnější. Bohužel zatím (12/2003) LL nehledá v uživatelském slovníku tak sofistikovaně jako v hlavní databázi.[11] Je ale dost možné, že Lingea vyhledávání v uživatelském slovníku vylepší. Že důkladné zpracovávání stojí za to i přes tento nedostatek, to není ani třeba připomínat.

Pokud chcete vědět, jak třeba může vypadat heslo pro LL (a vůbec to není složité!), podívejte se na obrázek ll-intellego.png. Ukázka jiného hesla: ll-divisor.png. Pozn.: světle fialové poznámky jsou soukromé poznámky určené k vymazání během konečné redakce.

 

Komplexnější lexikografická práce s Lingea Lexiconem vyžaduje osvojení několika údajů a zásad. V zásadě se lexikografická práce s LL dělí na dvě velké oblasti. První je editace definičního souboru: tam můžete určit, jak se má heslo z uživatelských slovníků zobrazovat (barvy, odsazení atd.). To je spíš pro pokročilejší nebo ty, kdo jsou ochotni tomu věnovat jistý čas. Pak je tu vlastní editace uživatelských slovníků. Jen tu je potřeba ovládnout (protože definiční soubor nemusíte tvořit, pokud si jej zkopírujete na této stránce níže nebo stáhnete v některém z balíčků databází z těchto stránek). Pokud se tedy definičním souborem nechcete zabývat, přeskočte celou kapitolu, která je mu věnovaná.

Definiční soubor

Lingea Lexicon užívá k tomu, aby věděl, jak zobrazit uživatelské heslo, definiční soubor user.udf v podadresáři data lingeovského adresáře. Definiční soubor může být v jedné instalaci pouze jeden. Určuje mimo jiné, na jaký slovník se mají dané formátovací zásady aplikovat. (Takový soubor vám pravděpodobně vznikl i instalací LL, ten ale doporučuji zazálohovat a poté jej nahradit definičním souborem z těchto stránek; je to zcela nutné zvlášť pokud chcete užívat mé databáze pro LL nebo postupovat přesně podle mých návodů níže.) v tomto definičním souboru si může uživatel sám definovat, jak má co vypadat: číslování významů, velikost a barva písma různých typů poznámek atd. Je to pro úplného laika poměrně složité a pracné, takže je lepší se spokojit s definičním souborem, který udělá někdo za vás. Proto pokud nechcete vzhled měnit, tak můžete následující text o definičním souboru přeskočit; jen si prostě nainstalujte některý z balíčků z těchto stránek, popřípadě nahraďte text svého user.udf v podadresáři data.

Důležité upozornění: když nemáte stejný definiční soubor jako ten, kdo databázi dělal, tak se vám některé cenné údaje (omezení významu, pramen zpracování apod.) vůbec nemusejí zobrazit (ověřeno, že když definiční soubor značku nezná, tak to, co je jí zformátováno, vůbec nezobrazí) nebo může docházet k havarijnímu ukončení LL. Takže velmi doporučuji užívat můj definiční soubor a měnit v něm jen málo významné detaily (barvy, proložení písma atd.) nebo vůbec nic.

Některé důležité informace o definičním souboru byly již uvedeny výše (např. jak aplikovat definiční soubor více slovníkům v témže směru hledání).

 

Struktura definičního souboru:

Nastavování formátu v definičním souboru.

Všechny značky jsou ve tvaru |aV, kde | je uvozovací znak, a je atribut a V je hodnota.

 

Atributy (komentáře v závorkách jsem doplnil já, převážně podle svých pokusů):

c color [barva písma dané položky]

d odsazení po zalomení řádku [d0 je bez odsazení, d1 je menší odsazení, d2 větší atd.; např. numb = "|d2" atd. definuje, že číslování má být odsazeno, a to odsazením velikosti 2. Velikost zarážek se dá nastavit v sekci view pod tabs (viz výše). Pokud do některé položky nejde odsazení vložit, zkuste ten postup, že na její začátek (ovšem jen pokud nebývá nikde jinde než na začátku řádku) dáte značku |n1 (zalomení před položkou) a až za tuto značku dejte odsazení.]

f font [|fI zapíná fonetickou abecedu. V LL 2002 dosud nelze měnit font v rámci jednoho hesla; LL 2002 ovládá vedle latinky též azbuku, řecké písmo a hebrejské písmo, ale zobrazuje je jako obrázky a pro uživatelské slovníky není tato funkce zpřístupněna; technická podpora byla tak laskavá, že navrhla pro příští verze toto vylepšení, takže v dalších verzích asi bude možné přiřadit kterékoli značce konkrétní font, což je vlastně nepostradatelné u jazyků užívajících nelatinských abeced.]

s size [velikost písma; např. |s7 zapne největší velikost, |s1 nejmenší, od |s8 včetně už jsou zase malá písma. s3 není třeba zadávat, protože je výchozí; někdy je výhodné velikost nezadávat; to se pak přebírá od okolí. Také barvu není nutné zadávat, pokud se vám hodí, aby ji ve vnořených značkách přebírala od nadřazené značky.]

l lang [|l1 je značka pro zdrojový jazyk, |l2 pro cílový jazyk. Značka, kterou je nutné užívat v případě provádění komplexnějšího popisu jazyka, je ale dobré jazyk nastavovat v každém případě, zejm. u značky odkazu (v mých databázích <x.>), fráze, sublemmatu, příkladu (samp2) a variant; když totiž jazyk není v definici příslušné značky nastaven a když uživatel klepne myší na něco, co je v této značce v těle hesla uzavřeno, tak se automaticky hledá heslo v opačném směru vyhledávání (např. u nastavení hledání na anglicko-české se hledá v takovém případě ve směru česko-anglickém), kdežto pokud nastavíme značkám správně jazyk (zejm. tam, kde značky obsahují segmenty ve výchozím; cílový je pro tělo hesla přednastavený a není třeba ho speciálně nastavovat každé značce), tak se uživateli po poklepání najde heslo ve správném směru.[13]]

b bold [tučné písmo; zapne se v definičním souboru pomocí |b+, netučné se zapne pomocí |b-.]

i italic [kurzíva; zachází se s ní stejně jako s bold]

u underln [podtržení; zachází se s ním stejně jako s bold]

h hspace [mezera; čím menší je číslo, tím větší je mezera; pevnou mezeru v uživatelských slovnících ani definičním souboru pro LL 2002 vkládat nelze]

n newln [zalomení řádku]

L list

 

Vypínání: provádí se značkou |x. , kde x = vypínaný atribut. Takže např. |b. vypne nastavení tučného písma, |s. vypne velikost atd. Kdyby se to do definice značky x nedalo, tak může být např. velikostí 1 celý zbytek hesla; totéž platí o barvách. Často je potřeba experimentovat a optimální řešení nějakou chvíli hledat (pokud chcete definiční soubor upravovat či doplňovat).

 

Definice barev:

V popisu položek v sekci #emph se na barvy odkazuje pomocí značky |cX, kde X je velké písmeno latinské abecedy.

Jaká konkrétní barva bude použita, je dáno implicitním nastavením těchto barev přímo v programu, avšak v podsekci #colo je možné si barvy měnit nebo si definovat barvy nové (za použití hexadecimálního kódu barvy se spojovníky dělícími jednotlivé barevné složky). Barva se definuje jako poměr složek RGB (R=red, G=green, B=blue). Hodnota každé složky se definuje jako hexadecimální číslo od 00 do FF.

Následující barvy jsou již předdefinovány (lze je ale předefinovat):

0 = "00-00-00" černá (Black)

R = "AF-00-00" červená (Red)

G = "00-AF-00" zelená (Green)

B = "00-00-AF" modrá (Blue)

X = "00-00-AF" rozšířená (eXtend)

A = "7F-7F-7F" šedá (grAy)

C = "00-AF-AF" modrozelená (Cyan)

Y = "AF-AF-00" žlutá (Yellow)

Je třeba poznamenat, že některé čachry s barvami kupodivu působí pád aplikace. Například když jsem do svého definičního souboru vložil barvu J = = "8E-54-AB", tak po zobrazení hesla obsahujícího značku, které byla tato barva přiřazena, aplikace spadla. Když jsem to dal jako X = "8E-54-AB", bylo vše v pořádku. Zkoušel jsem to v těsném sledu, aniž bych měnil cokoli jiného, takže jsem si jistý, že to je tím. Zdá se, jako by aplikace nepřipouštěla některá písmena v definicích barev. Zkoušel jsem opakovaně např. Q, P či J, a vedlo to k pádům.

 

 

Užívání kontra neužívání závorek ve zdrojovém textu:

Určité typy poznámek bývají v závorkách. Většina typů – ne-li všechny – se do závorek dává buď vždy, nebo nikdy, takže si lze ušetřit práci tím, že se do zdrojového souboru nebudou závorky psát a že se nastaví v definičním souboru, aby se daný výraz dával do závorek automaticky. #hida <s.střv.> <d.anglosas.> lán <n.pozemek o rozloze 60-120 akrů>: všechny tři poznámky se zobrazí v závorkách, pokud v definičním souboru je: d = "|s1|cM|b-|i-(%s)|b.|i.|c.|s." a totéž u definice značky s a n. %s znamená vlastní výraz uzavřený ve zdrojovém souboru do dané značky; je-li %s uzavřeno do závorek, znamená to, že se má automaticky napsat se závorkami. Já mám závorky u různých značek (např. b, d, f aj., viz níže, jak se značky používají). Dříve jsem závorky psal přímo do slovníku (a do definičního souboru jsem je tudíž nedával), nicméně ze systémového hlediska je to nadbytečné a ustoupil jsem od toho. Je daleko lepší to určit v definičním souboru, než to psát ručně.

Pozn.: obdobně se pracuje v definičním souboru s jakýmikoli dalšími znaky, např. s výslovností: ta se nechá uzavřít automaticky do hranatých závorek tak, že se ve střední části definice značky vyhrazené pro výslovnost napíše: [%s].

 

Definiční soubor – příklad. Následuje příklad definičního souboru. Je možné si jej pozměnit podle svých potřeb, ale doporučuji to provádět uvážlivě; např. barvy či velikost písma si klidně měňte tak, jak vám vyhovují, ale některými úpravami byste mohli způsobit, že se vám mé databáze nebudou zobrazovat správně a úplně.

 

Title: "uziv"
mask = "*-uziv"
icon = "lg-usr"
view = "lg_uziv"
t_en = "Uživatelský slovník"
t_cz = "Uživatelský slovník"

Title: "uziv2"
mask = "*-uziv2"
icon = "lg-rel"
view = "lg_uziv"
t_en = "Uživatelský slovník 2"
t_cz = "Uživatelský slovník 2"

Title: "uziv3"
mask = "*-uziv3"
icon = "lg-rel"
view = "lg_uziv"
t_en = "Uživatelský slovník 3"
t_cz = "Uživatelský slovník 3"

Title: "uziv4"
mask = "*-uziv4"
icon = "lg-rel"
view = "lg_uziv"
t_en = "Uživatelský slovník 4"
t_cz = "Uživatelský slovník 4"

Title: "latina"
mask = "*-latina"
icon = "lg-1"
view = "lg_uziv"
t_en = "Latinsko-český slovník"
t_cz = "Latinsko-český slovník"

Title: "latina1b"
mask = "*-latina1b"
icon = "lg-1"
view = "lg_uziv"
t_en = "Latinsko-český slovník 1b"
t_cz = "Latinsko-český slovník 1b"

Title: "latina2"
mask = "*-latina2"
icon = "lg-rel"
view = "lg_uziv"
t_en = "Latinsko-český slovník 2"
t_cz = "Latinsko-český slovník 2"

Title: "latina3"
mask = "*-latina3"
icon = "lg-usr"
view = "lg_uziv"
t_en = "Latinsko-český slovník 3"
t_cz = "Latinsko-český slovník 3"

Title: "latina4"
mask = "*-latina4"
icon = "lg-usr"
view = "lg_uziv"
t_en = "Latinsko-český slovník 4"
t_cz = "Latinsko-český slovník 4"

Title: "latina5"
mask = "*-latina5"
icon = "lg-usr"
view = "lg_uziv"
t_en = "Latinsko-český slovník 5"
t_cz = "Latinsko-český slovník 5"

Title: "latina6"
mask = "*-latina6"
icon = "lg-usr"
view = "lg_uziv"
t_en = "Latinsko-český slovník 6"
t_cz = "Latinsko-český slovník 6"

Title: "latinavar"
mask = "*-latinavar"
icon = "lg-rel"
view = "lg_uziv"
t_en = "Latinské varianty slov"
t_cz = "Latinské varianty slov"

Title: "latinaerr"
mask = "*-latinaerr"
icon = "lg-pink"
view = "lg_uziv"
t_en = "Chyby či nezmapované varianty"
t_cz = "Chyby či nezmapované varianty"

Title: "latinageo"
mask = "*-latinageo"
icon = "lg-green"
view = "lg_uziv"
t_en = "Latinská toponyma"
t_cz = "Latinská toponyma"

Title: "latinapr"
mask = "*-latinapr"
icon = "lg-blue"
view = "lg_uziv"
t_en = "Nezařazené latinské příklady"
t_cz = "Nezařazené latinské příklady"

Title: "latina0"
mask = "*-latina0"
icon = "lg-usr"
view = "lg_uziv"
t_en = "Latinsko-český slovníček"
t_cz = "Latinsko-český slovníček"

Title: "rectina"
mask = "*-rec"
icon = "lg-1"
view = "lg_uziv"
t_en = "Řecko-český slovník"
t_cz = "Řecko-český slovník"

Title: "rectina1b"
mask = "*-rec1b"
icon = "lg-1"
view = "lg_uziv"
t_en = "Řecko-český slovník 1b"
t_cz = "Řecko-český slovník 1b"

Title: "rectina2"
mask = "*-rec2"
icon = "lg-rel"
view = "lg_uziv"
t_en = "Řecko-český slovník 2"
t_cz = "Řecko-český slovník 2"

Title: "rectina3"
mask = "*-rec3"
icon = "lg-usr"
view = "lg_uziv"
t_en = "Řecko-český slovník 3"
t_cz = "Řecko-český slovník 3"

Title: "rectina4"
mask = "*-rec4"
icon = "lg-usr"
view = "lg_uziv"
t_en = "Řecko-český slovník 4"
t_cz = "Řecko-český slovník 4"

Title: "recerr"
mask = "*-recerr"
icon = "lg-pink"
view = "lg_uziv"
t_en = "Chyby či nezmapované varianty"
t_cz = "Chyby či nezmapované varianty"

Title: "okcit"
mask = "*-okcit"
icon = "lg-1"
view = "lg_uziv"
t_en = "Okcitánsko-český slovník"
t_cz = "Okcitánsko-český slovník"

Title: "okcit2"
mask = "*-okcit2"
icon = "lg-rel"
view = "lg_uziv"
t_en = "Okcitánsko-český slovník 2"
t_cz = "Okcitánsko-český slovník 2"

Title: "okcit3"
mask = "*-okcit3"
icon = "lg-usr"
view = "lg_uziv"
t_en = "Okcitánsko-český slovník 3"
t_cz = "Okcitánsko-český slovník 3"

Title: "okcit4"
mask = "*-okcit4"
icon = "lg-usr"
view = "lg_uziv"
t_en = "Okcitánsko-český slovník 4"
t_cz = "Okcitánsko-český slovník 4"

Title: "bulh"
mask = "*-bulh"
icon = "lg-1"
view = "lg_uziv"
t_en = "Bulharsko-český slovník"
t_cz = "Bulharsko-český slovník"

Title: "bulh2"
mask = "*-bulh2"
icon = "lg-rel"
view = "lg_uziv"
t_en = "Bulharsko-český slovník 2"
t_cz = "Bulharsko-český slovník 2"

Title: "bulh3"
mask = "*-bulh3"
icon = "lg-usr"
view = "lg_uziv"
t_en = "Bulharsko-český slovník 3"
t_cz = "Bulharsko-český slovník 3"

Title: "bulh4"
mask = "*-bulh4"
icon = "lg-usr"
view = "lg_uziv"
t_en = "Bulharsko-český slovník 4"
t_cz = "Bulharsko-český slovník 4"

Title: "stsl"
mask = "*-stsl"
icon = "lg-1"
view = "lg_uziv"
t_en = "Staroslověnsko-český slovník"
t_cz = "Staroslověnsko-český slovník"

Title: "stsl2"
mask = "*-stsl2"
icon = "lg-rel"
view = "lg_uziv"
t_en = "Staroslověnsko-český slovník 2"
t_cz = "Staroslověnsko-český slovník 2"

Title: "stsl3"
mask = "*-stsl3"
icon = "lg-usr"
view = "lg_uziv"
t_en = "Staroslověnsko-český slovník 3"
t_cz = "Staroslověnsko-český slovník 3"

Title: "stsl4"
mask = "*-stsl4"
icon = "lg-usr"
view = "lg_uziv"
t_en = "Staroslověnsko-český slovník 4"
t_cz = "Staroslověnsko-český slovník 4"

Title: "srb"
mask = "*-srb"
icon = "lg-1"
view = "lg_uziv"
t_en = "Srbochorvatsko-český slovník"
t_cz = "Srbochorvatsko-český slovník"

Title: "srb2"
mask = "*-srb2"
icon = "lg-rel"
view = "lg_uziv"
t_en = "Srbochorvatsko-český slovník 2"
t_cz = "Srbochorvatsko-český slovník 2"

Title: "srb3"
mask = "*-srb3"
icon = "lg-usr"
view = "lg_uziv"
t_en = "Srbochorvatsko-český slovník 3"
t_cz = "Srbochorvatsko-český slovník 3"

Title: "srb4"
mask = "*-srb4"
icon = "lg-usr"
view = "lg_uziv"
t_en = "Srbochorvatsko-český slovník 4"
t_cz = "Srbochorvatsko-český slovník 4"

Title: "stfr"
mask = "*-stfr"
icon = "lg-1"
view = "lg_uziv"
t_en = "Starofrancouzsko-český slovník"
t_cz = "Starofrancouzsko-český slovník"

Title: "stfr2"
mask = "*-stfr2"
icon = "lg-rel"
view = "lg_uziv"
t_en = "Starofrancouzsko-český slovník 2"
t_cz = "Starofrancouzsko-český slovník 2"

Title: "stfr3"
mask = "*-stfr3"
icon = "lg-usr"
view = "lg_uziv"
t_en = "Starofrancouzsko-český slovník 3"
t_cz = "Starofrancouzsko-český slovník 3"

Title: "stfr4"
mask = "*-stfr4"
icon = "lg-usr"
view = "lg_uziv"
t_en = "Starofrancouzsko-český slovník 4"
t_cz = "Starofrancouzsko-český slovník 4"

Title: "sp"
mask = "*-sp"
icon = "lg-1"
view = "lg_uziv"
t_en = "Španělsko-český slovník"
t_cz = "Španělsko-český slovník"

Title: "sp2"
mask = "*-sp2"
icon = "lg-rel"
view = "lg_uziv"
t_en = "Španělsko-český slovník 2"
t_cz = "Španělsko-český slovník 2"

Title: "sp3"
mask = "*-sp3"
icon = "lg-usr"
view = "lg_uziv"
t_en = "Španělsko-český slovník 3"
t_cz = "Španělsko-český slovník 3"

Title: "sp4"
mask = "*-sp4"
icon = "lg-usr"
view = "lg_uziv"
t_en = "Španělsko-český slovník 4"
t_cz = "Španělsko-český slovník 4"

View: "lg_uziv"
head = "|d0%entr%vari%morx%form%styl|n1"
tabs = "1,3,6,9"
#item:
entr = "|cB|s6|b+|l1%s|l.|b.|s.|c.|h1"
vari = "|h1|cB|s4%s|s.|c."
morx = "|h1|b+(%s)|b."
form = "|h1|cA(%s)|c."
styl = "|cG|i+%s|i.|c.|h1"
numb = "|n1|d1|cR|b+%s.|c.|b."
trans= "|d3|b+|l2%s|l.|b.|n1"
samp2= "|d3|l1|cK|i+%s|i.|c.|l.|h1|l2%t|l.|n1"
note2= "|d3|kM|l1|cM|i+%s|i.|c.|l.|h1|l2%t|l.|k.|n1"
#emph:
a = "|d1|s2|cB|l1|b-|i-%s|b.|i.|l.|c.|s.|n2"
b = "|s1|cV|b-|i-(%s)|b.|i.|c.|s."
c = "|n1|d1|s3|cM|b+|i-%s|b.|i.|c.|s.|d.|n1"
d = "|s1|cM|b-|i-(%s)|b.|i.|c.|s."
e = "|s3|cB|l1|b+%s|b.|l.|c.|s.|h1"
f = "|s1|cA|b-|i-(%s)|b.|i.|c.|s."
g = "|s2|cB|l1|b+%s|b.|l.|c.|s.|h1|n2"
h = "|cB|fI|b-|i-[%s]|b.|i.|f.|c."
i = "|cA|l1|i+|b-%s|i.|b.|l.|c."
j = "|h1|s2|cZ|l1|b-|i-~ %s|b.|i.|l.|c.|s."
k = "|h1|s2|cA|l1|b-|i-× %s|b.|i.|l.|c.|s."
m = "|s1|cB|l1|b-|i-(%s)|b.|i.|l.|c.|s."
n = "|s1|cA|b-|i-(%s)|b.|i.|c.|s."
o = "|cA%s|c."
p = "|s3|cM|l1|b-|i+%s|i.|l.|c.|s.|b-|c. "
q = "|s3|cK|l1|b-|i+%s|i.|l.|c.|s.|b-|c. "
r = "|n2"
s = "|s1|cB|b-|i-(%s)|b.|i.|c.|s."
u = "|s2|cA|b+(%s)|b.|s.|c.|n2"
v = "|s3|cB|i+|b-%s|i.|b.|c.|s."
w = "|s3|cA|l1|b-|i+%s|i.|l.|c.|s.|b-|c. "
x = "|s1|cA|l1|b-|i-%s|l.|b.|i.|c.|s."
y = "|n2|d3|s3|cR|l1|b-|i-{%s}|b.|i.|l.|c.|s."
z = "|s1|cF|b-|i-(%s)|b.|i.|c.|s."
1 = "|l1%s|l."
#colo:
D = "7B-7B-7B"
K = "44-44-44"
F = "B8-87-FA"
M = "80-80-FF"
N = "96-B1-CF"
s = "97-A2-B9"
v = "80-00-80"
z = "17-60-68"

Samotná tvorba hesel

Uživatelské slovníky (typu 2; na typ 1 doporučuji zcela rezignovat, protože nemá rozsáhlé možnosti, kterými disponuje typ 2) se nacházejí v podadresáři data. Jsou to prosté textové soubory s příponou .udr. Editují se v textových editorech, nejlépe asi v Poznámkovém bloku (NotePadu) nebo v CodePadu. Do těchto souborů se vpisují (či z jiného souboru přes schránku kopírují) hesla. Hesla lze průběžně upravovat, doplňovat či vymazávat.

K editaci hesla stačí si osvojit cca 20 formátovacích značek a několik zásad, které tu budou vypsány; další přijde se cvikem. Nejlepší ale bude pro představu uvést nejdříve příklady hesel a pak teprve připojit výklady a pravidla.

 

Příklady hesla.

 

#intellego

<g.ere, intellexi, intellectum> <a.intelligo>

=<v.alqd> poznat, seznat, uvědomit si, zvědět, zjistit, postřehnout, spatřit, vidět, vnímat <v.co>

=<v.absol.> usuzovat, <n.rozumově> poznávat

=<v.alqd> chápat <v.co>, rozumět <v.čemu>, pochopit <v.co>

<p.intellege> rozuměj, to jest

=<v.alqd> rozumět <v.čemu> <n.slyšet> <z.DZ>

?loqutus (sic!) fuit submisse, ita quod ... non intellexit verba eius <f.Fournier I, 371> <z.smysl submisse ověřen>

=<v.alqd> znát, vědět <v.co>

=<v.alqd> být známo <v.komu>, mít ponětí <v.o čem>

?intellego = je mi známo

=<v.alqd> rozumět <v.čemu>, mít porozumění <v.pro co> <z.chtěl jsem uvést Vg., Ž 5,2, ale tam není kontext vůbec jednoznačný, ač ČEP zde mít porozumění udává; jako příklad nepoužitelné, najít jiný>

=<v.alqd> uvědomovat si, pociťovat, vnímat <v.co>

=pochopit, dovtípit se, usoudit, domyslet se, snadno se domyslet

=<v.alqd pro alqa re> chápat, rozumět, představovat si <v.co pod čím> <z.DZ>

?Et pro aqua intelligunt pisces, et pro ligno oleum. = Vodou rozumějí ryby a stromem olej. <f.Forma qualiter heretici hereticant hereticos suos; 13. stol.> <z.zde podle Thouz. Rit. 284>

=<v.alqm/alqd> mít na mysli, mínit <v.koho/co> <z.DZ>

?Interrogatus quid ipse intellexit quando dixit... = Na dotaz, co měl na mysli, když řekl... <f.Fournier I, 202>

=<v.alqm/alqd per alqm/alqd> mínit <v.koho/co kým/čím> <z.DZ podle Fournier I, 222 dole>

?Quid intellegis per bonos christianos? = Co/koho míníš těmi dobrými křesťany? <f.Fournier I, 222> <z.o kterých jsi mluvila>

=<v.alqd de alqa re> spojovat co s čím <n.v myšlenkách>, chápat <v.co> jako týkající se <v.čeho> / jako řečené <v.o čem> <z.DZ; lze chápat jako výpustku, takže dál sledovat a zvažovat zapracování pod jiný hesl. oddíl>

?Intellexit [verbum illud] de divitibus qui malo modo et iniusto suas divicias ... acquirunt. = Spojoval to [rozuměj: ten výrok] s bohatými, kteří nabývají svého bohatství zle a nespravedlivě. <f.Fournier I, 208>

<m.lze chápat jako výpustku: intellexit verbum illud dictum...>

=<v.alqd> uznat <v.co> <n.uznej přece, že...>

=<v.alqd> myslet si <v.co>, představovat si <v.co>

=<v.alqd> myslet <v.na co>, mít na srdci <v.co>, starat se <v.o co>

=<v.alqd> vzít si k srdci <v.co>

=<v.alqd> dokázat si představit, zbádat <v.co> <z."zbádat" DZ; sem by také asi patřil význam mít porozumění z Vg., Ž 5,2; nicméně tam je kontext zcela nejistý; to mít porozumění ještě zvážit, hledat příklady>

=<v.alqm> vyznat se <v.v kom>, umět správně odhadnout/posoudit <v.koho> <z.LMALB "vyznat se, umět správně ocenit"; na "odhadnout/posoudit" upravil DZ>

=<v.alqd> rozvážit, zvážit, uvážit <v.co>

=<v.alqd> posoudit <v.co>

<z.snad, DZ; význam "posoudit" ve zdrojích neudán, ale naznačeno: intellegere je dle LMALB úsudek. Zřejmě to někdy konotaci posouzení, zhodnocení má. A "rozvážit" nalezeno; valence DZ>

<z.viz TDH 315:38>

=<e.dare intellegere> vysvětlit, vyložit <z.DZ ex Fournier I, 282>; oznámit, dát vědět <z.LMALB?>

?Pontius Ramfredi dederat intelligi quod non poterat salvari nisi per eos <f.Parnac 257r> <z.nevím, zda by někt. ještě jiný význam nebyl vhodnější>

=<e.intellegere <m.subst.>> <x.v. t.>

<c.různé příklady>

?quando ... loquebantur aliquando de Evangeliis et Epistolis dicto Bernardo, semper dicebat eis quod aliter intelligebantur <f.Fournier I, 353> <z.to je snad něco jako "mají být chápány jinak", ač je užito obyč. impf.>

<z.var. intellig-: intelligunt: Forma qualiter... viz výše, a několik dalších příkladů výše; dokonce i intellixit - Liber, ed. Thouz., 378>

<z.Pražák, MLLM, LMALB, Vg., DZ; Vg. projito vše kromě deuterokanon. knih>

 

Abyste věděli, jak takové heslo vypadá po zobrazení ve slovníku, můžete se podívat na obrázek hesla intellego či hesla divisor.

 

Jiný příklad:

 

#regalia

<c.subst. n. pl. <e.regalia <i.orum, n. pl.>>>

insignie <n.zejm. královské, ale i biskupské, opatské apod.> <z.DZ; Rubin, CC, 173 o biskupských insigniích, opatské doplnil DZ podle shodnosti insignií biskupa a opata; MLLM ani Pražák nic>

<c.subst. f. sg. <e.regalia <i.ae, f.>>>

obročí královského kostela <z.MLLM sub regalia nic víc a skutečně uvádí f., ae doplnil DZ; Pražák nic>

 

Následují formátovací zásady, doplněné někdy i o obecnější zamyšlení nad lexikografií.

 

 

a s vlnkou[19] \pag

e s vlnkou \pew

i s vlnkou \piv

o s vlnkou \pog

u s vlnkou \puv

„obrácené c“ s vlnkou \pcv (pro nosové otevřené o)

oe s vlnkou \pov

epsilon \pel

epsilon s vlnkou \pex

velké R \pRc

n s ocáskem na pravé nožce N

n s ocáskem na levé nožce (pro „ň“) \pnh

překlopené h \phi (např. ve francouzském lui)

fí \por

přeškrtnuté o \poh

œ \pou[20]

 

 

Tyto zásady zachycují ideální stav. Zdaleka nejsou všude v mých databázích dodrženy (zvlášť v těch částech, které pocházejí ze starší doby, je po nich nějaká stopa jen tu a tam).

 

Kontrola hesla. Pokud provedete nějakou úpravu v některém hesle uživatelského slovníku, je dobré ověřit, jak výsledek vypadá po zobrazení v LL, tj. si dané heslo nechat vyhledat. Za tím účelem je třeba uživatelský slovník znovu načíst. To uděláte buď opětovným spuštěním LL, nebo novým zvolením slovníku v LL pod nabídkou Soubor. Pokud chcete ověřovat změny v definičním souboru, nové zvolení nestačí; je nutné opětovné spuštění programu.

 

jakém editoru heslo psát a upravovat? Bezproblémové je psát uživatelský slovník v Poznámkovém bloku a do něj heslo vpisovat či kopírovat odjinud (např. z Wordu). Spíše nedoporučuji uživatelský slovník ve Wordu či v 602Textu přímo otvírat, ale klidně hesla ve Wordu či 602Textu pište a do slovníku otevřeného v Poznámkovém bloku je kopírujte přes Ctrl+C a Ctrl+V (Kopírovat – Vložit), pokud vám to tak vyhovuje. Osobně nejvíc doporučuji používat pro editaci hesel pro LL místo Poznámkového bloku CodePad, výborný, malý a t. č. bezplatně distribuovaný editor pro psaní ve všemožných programovacích a formátovacích jazycích, který umí vykreslovat text barevně, což editaci usnadňuje a zpříjemňuje; ke stažení je na http://shicola.d2.cz/codepad/download.php. Nejdřív je ale potřeba ho to naučit; pokud byste chtěli soubor s definicí syntaxe vhodnou pro editaci hesla pro LL (který respektuje mé značky, jak jsou vyloženy výše), můžete si ho stáhnout zde; po instalaci CodePadu jej zkopírujte do podadresáře Syntax Definitions a pak pod Syntax / Configure přiřaďte souborům *.udr soubor ll.def. Pokud byste takto postupovali a dospěli do fáze, kdy byste si nevěděli rady, nebo pokud byste nebyli rozhodnutí, zda je CodePad vhodný, můžete si přečíst více v tipech pro práci s počítačem ve speciální kapitole CodePad (stránka je rozsáhlá, mějte prosím strpení). Pokud se nechcete učit další novou věc, klidně užívejte Poznámkový blok, je to ale méně příjemné na oči než CodePad, který kód vykresluje barevně, a navíc tam lze vzít zpět jen jednu akci atd. – CodePad je na toto daleko lepší.

 

Při sepisování podkapitoly o formátování hesla mi velmi pomohly informace, které mi poskytla technická podpora Lingey, jíž tímto velmi děkuji.

Jak na speciální znaky (francouzské apod.)?

Níže najdete kombinace znaků, jejichž prostřednictvím lze vepsat do uživatelského slovníku speciální znaky. Údaje poskytla technická podpora LL. Převod do podoby vhodné pro LL je samozřejmě možné a žádoucí zautomatizovat hromadným nahrazováním ve Wordu či jiném textovém editoru, na které si lze – což je vůbec nejlepší – nahrát makro. Pokud si vypisujete slovíčka přímo do uživatelského slovníku Lingea Lexiconu, tak si to takto můžete (přesněji: měli byste, vzhledem k prostě textovému formátu slovníku), rovnou psát.

 

\`a obrácená čárka nad a e i o u

\'a normální čárka nad a c e g i l n o r s u y z

\^a stříška nad a c e g h i j o s u w y

\~a vlnka nad a i n o u

\:a dvě tečky nad a e i o u y

\-a proužek nad a e i o u

\.c tečka nad c e g i z

\"c háček nad c d e l n r s t z

\"a kroužek nad a u

\+a oblouček nad a e g i o u

\,c ocásek pod c g k l n r s t, směřující vlevo

\,a ocásek pod a e i u, směřující vpravo

\_d přeškrtnutí d h l o t

\@a speciální a d i k n o s y (a pro ligaturu ae, d pro znak ð, i pro ligaturu ij, o pro ligaturu oe, s pro ß; zkuste si do některého svého slovníku pod jakékoli heslo dát \@a \@d \@i \@k \@n \@o \@s \@y a hned uvidíte, který kód co zastupuje)

 

Příklad: slovo rêve bude ve zdrojovém souboru slovníku vypadat r\^eve. Pochopitelně není nutné psát všechny znaky s diakritikou těmito speciálními kódy. Např. výchozí kódování windows-1250 užívané Poznámkovým blokem obsaženým v české lokalizaci Windows zvládá (vedle českých písmen s diakritikou) i ç, ä, ë, ö, ü, â, î, ô, ę a některé další.

Bohužel tu nejde všechno, např. o s ocáskem doprava napsat nelze apod. Jde jen to, s čím programátoři počítali a co do programu zahrnuli. Tento seznam je asi pro LL 2002 úplný.

Jak si usnadnit práci psaním hesla ve Wordu a následným použitím makra

Je samozřejmě možné psát heslo přímo do textového souboru představujícího uživatelský slovník. Osobně se nyní přikláním k názoru, že je výhodnější heslo přímo psát v požadovaném formátování, a na přímou editaci jsem zcela přešel. Pro někoho ale může být výhodné psát hesla ve Wordu, např. do tabulky určené k vytištění a učení se slovíček, a nechat si je zčásti převést do potřebného formátu pomocí makra; makro spoustu značek doplní za vás a vy pak heslo jen ručně doopravíte.

Užívání maker je velice jednoduché (když je někdo naprogramuje a zpřístupní, což jsem udělal). Na jejich provozování potřebujete Microsoft Word.

 

 

Provádíte – jako všechny postupy z těchto stránek – na vlastní nebezpečí.

 

Dávám v souboru obsahujícím wordovská makra pro Lingea Lexicon k dispozici tato makra:

 

 

Makra vám ušetří čas: předpřipraví heslo do poměrně pokročilé podoby. Následují ukázky zpracování hesla makrem LingeaHeslo.

 

Původní podoba:

 

abattage m. bourání, demontáž ; kácení, mýcení, porážení ; odbourávání, lámání (skály), odtesání ; rubání ; porážení (dobytka), skolení, odstřel (zvěře) ; sklopení ; páčení ; stahovací roleta (krámu) ; vyložené karty ; verva, živost, zápal (fam.)

 

adhérer à qc. přidržovat se čeho, zastávat co, ztotožňovat se s čím

 

fortuna, ae, f.osud; úděl (daný osudem); příležitost; štěstí; neštěstí; rozhodnutí, výsledek; stav, postavení, poměry, okolnosti; (obvykle pl.) majetek, jmění, bohatství; Fortuna, ae, f. Štěstěna, bohyně štěstí; (střv.) právo na nalezené poklady; (střv.) nástrahy moře (MLLM jen jako fortuna maris, ale i vypouštěno: Bech, ed. Šanjek, Bosansko-humski..., 140:: dle MLLM od 13. stol.)

 

Výstup po zpracování makry:

 

#abattage

<g.m.>

=bourání, demontáž

=kácení, mýcení, porážení

=odbourávání, lámání <n.skály>, odtesání

=rubání

=porážení <n.dobytka>, skolení, odstřel <n.zvěře>

=sklopení

=páčení

=stahovací roleta <n.krámu>

=vyložené karty

=verva, živost, zápal <s.fam.>

 

#adhérer<v.\`a qc.>

přidržovat se <v.čeho>, zastávat <v.co>, ztotožňovat se <v.s čím>

 

#fortuna

<g.ae, f.>

=osud

=úděl <n.daný osudem>

=příležitost

=štěstí

=neštěstí

=rozhodnutí, výsledek

=stav, postavení, poměry, okolnosti

=<n.obvykle pl.> majetek, jmění, bohatství

=Fortuna, ae, f. Štěstěna, bohyně štěstí

=<s.střv.> právo na nalezené poklady

=<s.střv.> nástrahy moře <z.MLLM jen jako fortuna maris, ale i vypouštěno: Bech, ed. Šanjek, Bosansko-humski..., 140; dle MLLM od 13. stol.>

<z.Pražák, MLLM>

 

 

Dokonalý ten výstup nebude nikdy, je třeba to vždycky ručně dodělat, ale dost práce vám to ušetří. Doporučené je psát všechny poznámky ve výchozím wordovském dokumentu do speciálních závorek, např.:

absento, are, avi [a do druhého sloupce tabulky toto:] (trans.) vzdalovat; (intrans.) být vzdálen; (refl.) vzdalovat se, vzdálit se; nedostavit se k soudu; (absol. / ab alqa re) vzdálit se od církevního působiště.

hida, ae, f.(střv.) (anglosas.) lán

 

Zvažte sami, zda vám vyhovuje víc přímé psaní, nebo předpřipravení ve wordovské tabulce a poté převedení pomocí makra. Vzhledem k délce běhu makra LingeaHeslo je myslím výhodnější psát hesla přímo, než je po jednom přenášet. Ale ostatní makra mohou mít v mnoha případech použití (např. makro na hromadný převod celé wordovské tabulky).

Důkladná počítačová lexikografie: upozornění na možnost grantů a volby lexikografie jako tématu diplomové práce

Badatelům a studentům (zejm. postgraduálním) připomínám možnost podat si na lexikografickou práci grant a vysokoškolským studentům zase výbornou možnost vybrat si po konzultaci s předpokládaným vedoucím diplomové či jiné práce jako její téma důkladné počítačově-lexikografické zmapování např. určitého pramene či okruhu pramenů, popř. určité jazykové úrovně (současný francouzský studentský slang, staroanglické artušovské romance, německá terminologie týkající se vytváření stránek HTML, slovník skupiny Félibrige, okcitánské narativní básně 13. století, dalmatština v dokumentech dubrovnického archivu atd. atd.; vždy je ovšem třeba zvážit, pro koho slovník děláme, a případně tomu přizpůsobit cílový jazyk, například vyrobit slovník dalmatsko-anglický – byť za cenu větší časové investice a nějakých chyb navíc, zapříčiněných tím, že angličtina není lexikografův mateřský jazyk). Pokud by se slovník doplnil např. studií středního rozsahu a podrobné poznámky by se zařadily i pod jednotlivá hesla, tak by to jistě bylo jako téma přijato. Počítačová lexikografie je činnost, která má smysl a která je prospěšná poměrně rozsáhlému okruhu uživatelů, takže se výstupu vaší práce – pokud jej publikujete na internetu (tyto stránky jsou tomu otevřeny) – rozhodně nestane, že by zbůhdarma chytal prach v knihovním depozitáři.

Millennium

Základní informace

Adresa: http://www.pc-slovniky.cz.

Velmi rozsáhlý slovník, t. č. v základní (ale již tak velmi rozsáhlé) zdarma. Nesestaven z hesel, nýbrž z významových dvojic. Kvalita jednotek je různá,[23] ale pokud se v případě neuspokojivého výsledku nahlédne např. do knižního slovníku, tak jde o velmi vyhovující slovník. Nelze než velmi doporučit; poměr ceny ke kvalitě je t. č. jednoznačně nejpříznivější ze všech českých programů. Velká část návodů na těchto stránkách platí právě pro Millennium, takže nejsou shromážděny do této kapitoly.

Instalace Millennia: spustit soubor Setup.exe (v podadresáři Program toho adresáře, který obsahuje instalační balíček).

Millennium nedoporučuji jako platformu k importu slovníků jiných jazyků, např. španělsko-českého. Nabízí málo výhod, je založen na struktuře A=B a databáze jsou zbytečně velké (neboť jde o rozežrané accessovské soubory). Síla Millennia je v tom, že dává zadarmo sice jednoduché a málo formátované, ale rozsáhlé databáze AJ, NJ a FJ. Ale jako platformu volte raději LL či PEKI.

Nastavení slovníku Millennium

Uživatelský slovník, import

Postup importu je následující:

 

1.) Uložte kopii dokumentu obsahujícího slovíčka, která chcete importovat, jako pouze text (Uložit jako...).[24] [Pro pokročilejší: nejvýhodnější je využít (pokud pracujete ve Wordu) makro, které uloží soubor jako pouze text do konkrétního adresáře a provede automaticky určité změny: předřadí středníkům mezery (středníky totiž bez mezer matou v Millenniu někdy vyhledávání), zkazí francouzské znaky tak, aby po importu byly dobré, atd. Jedno takové makro jménem ImportMillennium si lze stáhnout mezi mými makry. Ale pozor, bude nutné v kódu upravit cesty tak, aby na vašem disku existovaly, např. z C:\David změnit na C:\Dokumenty.]

2.) Spusťte Millennium, otevřete uživatelský slovník (Soubor/Uživatelský slovník) a zvolte Import, najděte procházením textový soubor, který jste si před chvílí uložili, a zvolte ho. Jeho obsah se vám importuje do uživatelského slovníku. Pokud to již nemáte tak nastaveno, zvolte v nastavení, aby slovník hledal nejen v základní databázi, nýbrž i právě v uživatelském slovníku.

3.) Fakultativní krok: ověřte, zda import v pořádku proběhl, buď přímo v uživatelském slovníku nebo pokusným vyhledáním některé jednotky, o které víte, že v základní databázi není a že patří mezi slovíčka, která jste si právě do uživatelského slovníku importovali.

4.) Zazálohujte si uživatelský slovník (na disketu, na CD...), aby nedošlo ke ztrátě dat. Lze uskutečnit pomocí nabídky Export pod uživatelským slovníkem. Vzniklý soubor následně uložte na disketu či CD.

 

Další tipy a poznámky

 

PEKI

Různé

Adresa: http://pponec.net/peki/index_cs.htm.

Celková charakteristika: platforma pro Windows, Linux, MacOS a další operační systémy, na nichž je nainstalováno Java Runtime Environment. V PEKI lze provozovat nejrůznější slovníkové databáze; instalační balíček už sám četné zdarma dostupné databáze obsahuje (anglicko-česká, finsko-česká, italsko-česká, latinsko-česká, nizozemsko-česká, rusko-česká, ukrajinsko-česká aj.). Jde o freeware. Program je kvalitní. Pracuje se s ním pěkně, nemusí se mačkat žádná klávesová zkratka pro hledání apod., stačí prostě začít psát. Ovládání je jednoduché. Ve 3. sloupci umožňuje některé značky HTML, takže je možné dosáhnout barevného a přehledného zobrazení podobného této ukázce. Stačí mít databázi v potřebném formátu; některé takové najdete na těchto stránkách.

Databáze, struktura databází: Převažující struktura databází je A=B, A=C, A=D atd. s možností převracení slovníku, ale slovník částečně podporuje i značkování pomocí HTML (viz níže) a uvedená struktura je dána samotnými databázemi, nikoli tím, že by se PEKI vázal jen na ni. Maximální velikost jednoho databázového souboru je 2048 MB (2147483647 bajtů), což je tolik, že lexikografovu rozletu nic nebrání.

Ovládání slovníku: klávesa F11 skrývá či zobrazuje navigační tlačítka. Enter či Alt+Enter vstupuje do Podrobností nebo (pokud v nich jste) naopak do stručného zobrazení. Šipky či Alt+šipky posouvají na předchozí či následující heslo v abecedním pořadí. Pod nabídkou Nastavení si lze vybrat, zda se má skákat na hesla již během psaní (Rychlé hledání), nebo teprve poté, co se stiskne Enter.

 

Import: slovník není určen k přímému vkládání jednotek. Je potřeba dát je do textového souboru, ten někam uložit a poté pod Start / (Všechny) Programy / PEKI Dictionary / DataImport spustit vytvoření příslušné databáze. Postup je následující: pokud jsou to databáze, jež tvoří součást distribučního balíčku PEKI, tak stačí zaškrtávat či rušit zaškrtnutí. Pokud jste si zdrojový soubor někde stáhli, např. na těchto stránkách, či je váš vlastní, tak zmáčkněte vpravo nahoře Vytvořit, pak změňte parametry nově vzniklého popisu zdrojové databáze (autor, zdrojový soubor, oddělovač atd.) a klepněte na tlačítko Vytvořit umístěné dole. Tabulátor se dá do políčka Oddělovač vložit tak, že se napíše v Poznámkovém bloku a přenese se přes systémovou schránku (Ctrl+C).

Import databází z těchto stránek: pokud chcete vidět databáze barevně a rozhodli jste se pro PEKI, najdete postup o něco níže; je trošku složitější, ale nijak výrazně. Pokud jde naopak o databáze v základním formátu, tak postupujte takto: databázi si z internetu uložte někam na disk, spusťte Start / (Všechny) Programy / PEKI Dictionary / DataImport, dejte nahoře Vytvořit, změňte parametry (autora apod., a také samozřejmě zdrojový soubor: procházením najděte na svém disku příslušný slovníkový soubor stažený z těchto stránek), do políčka Oddělovač zkopírujte z Poznámkového bloku znak tabulátoru a stiskněte Vytvořit dole.

 

Různé tipy:

 

Řešení problémů:

PEKI a HTML; import databází v HTML z těchto stránek do PEKI

PEKI podporuje ve třetím sloupci (resp. čtvrtém, pokud započítáme sloupec pro výslovnost) značkování HTML a styly CSS, byť ne v úplnosti (Java Runtime Environment zatím nemá dobrou podporu kaskádových stylů). Hlavními nástroji, které se užijí pro značkování HTML určené pro PEKI, jsou v podstatě značky <font> a <br>, protože PEKI zatím nepodporuje <p> a <span>.

 

 

Jak do PEKI importovat barevné databáze z těchto stránek:

 

 

Výhody a nevýhody provozování těchto databází v PEKI: výsledek není zatím tak úhledný a přehledný jako mé databáze ve formátu pro Lingea Lexicon, ale u rozsáhlých slovníků má PEKI tu výhodu, že databáze načítá rychle (narozdíl od LL a prohlížeče) a oproti rozsáhlým databázím v jednotlivých souborech HTML (zejména česko-francouzské, která nyní na disku zabírá 66 MB, a taky francouzsko-české) zase tu výhodu, že databáze pro PEKI zabírá na disku výrazně méně místa a nezpomaluje operace jako je hledání souborů či antivirová kontrola. Navíc PEKI podporuje i různé fonty v rámci jednoho hesla, což je nepostradatelné u jazyků užívajících nelatinských abeced (tento rys nemá ani LL 2002). Také zadávání speciálních (např. francouzských) znaků do zadávacího řádku je zvládnuto mnohem lépe než v LL 2002 – lze užívat standardní zkratky (Shift+Ctrl+ý a poté příslušné písmeno pro accent grave aj.). Je to rozhodně mnohem lepší, než se spokojit se stažením databází v základním formátu.

Pokluda

Základní informace

Adresa: http://www.pokluda.cz/.

Jde o zajímavý program, freeware. Platforma, do které lze importovat slovíčka různých jazyků. Teoreticky můžete mít slovníků kolik chcete, stačí ten požadovaný vždy před začátkem práce otevřít. Instalační balíček v době, kdy jsem ho stahoval, obsahoval z databází jen ukázku anglicko-českého slovníku.

Jde o primárně platformu pro listovací slovník, takže dostat se do pole, kam se dá zadat vyhledávací dotaz, trvá o chvíli déle než v Millenniu, ale možnost prohledávat všechna pole, navíc velmi pokročile, je tu zpracována dokonce lépe.

Databáze: struktura A=B, neumožňuje barevné zobrazení bohatě formátovaných datových dokumentů. Databáze jsou soubory pro MS Access, což je zbytečně rozežraný formát.

Možnost volit si různé fonty pro jednotlivá pole je dobrá pro jazyky užívající cizích abeced.

Jak importovat z TXT: zvolit v rozbalovacím menu procházecího dialogu pod Import zobrazení všechny soubory, najít soubor. Pravděpodobně vám ohlásí chybu, ale při dalším otevření bude v pořádku. Pozor, co je ve vaší databázi vpravo, bude vlevo. Pokud nelistujete, ale hledáte, tak hledá i to, co je jen součástí řetězce, tj. nemusíte mít jedno slovíčko na řádku. Ale pozor, aby heslo bylo vidět; nedá se to posunovat.

Problémy s importem: někdy hlásí problémy s importem. V takové chvíli přichází na řadu něco, co umí změnit formát: třeba to můžete importovat do Millennia, odtud exportovat a pak importovat do slovníku Pokluda.

Různé poznámky: součástí Pokludy jsou ukázky – anglické databáze o cca 1000 slovíčcích. Nastavení v nabídce Soubor umožňuje nastavení tisku.

Ovládání: primárně listovací slovník, takže zbytečně dlouho trvá, než se dostanete k zadávacímu políčku pro hledání.

Vyhledávání: operátor AND. Možnost použít dotaz WHERE pro jazyk SQL. Možnost hledat i v poli výslovnost, poznámka atd. Možnosti dosti široké. Doporučuji hledání ovládat z klávesnice, ne myší.

Nedostatky: 1.) Není k dispozici možnost měnit velikost vyhrazenou v okně pro jednotlivá pole (obvykle, třeba v Průzkumníkovi nebo Salamanderovi, tažením myši na horní liště). 2.) Nelze užívat příkaz Kopírovat atd., tj. vložit nalezený údaj do schránky při běžném listování, jen v podrobnějším výpisu slovíčka.

Export: dobré možnosti exportu: jako TXT: dělí pole čárkami. RTF: exportuje jako oddělené tabulátory. Lze též exportovat jako soubor pro Excel, do tabulky. Šikovné.

Hodnocení: doporučuji, zvlášť těm, kteří mají vlastní databáze a nechtějí nebo nemohou věnovat tolik místa na disku, kolik vyžaduje Millennium, nebo kterým se zdá, že je Millennium příliš pomalé, že je nestabilní, že nemá dobře zvládnuté logické operátory a že je nešikovné, jelikož se nedá zastavit probíhající formátování nalezených jednotek (to vše je pravda), popřípadě kdo se nechce smířit s jeho vyhledávacími chybami, a zároveň nechtějí používat demoverzi Lingea Lexiconu, například kvůli trochu složitější struktuře hesel pro uživatelský slovník. Pokluda je ucházející program. Výhoda je, že umí pohodlně pracovat s mnoha slovníky; prostě dáte Otevřít a otevřete si jinou databázi. V Millenniu to jde oklikou taky, ale je to o něco pomalejší a náročnější na místo na disku. Nevýhoda je, že Pokluda je slovníkem listovacím, ne vyhledávacím; vyhledávat umí, ale chvíli trvá, než se dostanete do okénka, kam svůj dotaz můžete vepsat. Klávesou F3 pak skočíte na další výskyt. Pokud budete Pokludu používat, tak doporučuji užívat spíš jako alternativu než jako jediný slovník.

Pokročilé možnosti hledání: operátory NOT atd.

Zde stažitelné databáze a Pokluda: to, co jsem pro Millennium upravil, aby to tam bylo správně, např. è za č, ê za ę, je v Pokludě špatně, přesněji: zobrazuje to přesně, takže ta řízená zkaženost francouzské databáze vadí. Je snadné to opravit u distinktivních, např. všechna ŕ zaměňte za à atd., horší je to ale u č: tam to zaměňte ve Wordu jen v pravém sloupci po převedení mé databáze na tabulku. Ale pozor: pokud si zvyknete na to, že je to špatně a co co znamená, tak možná uděláte lépe, protože např. ŕ do pole na vyhledávání (Ctrl+F) napsat lze, kdežto à nikoliv (částečně lze vyřešit v Nástroje/Možnosti pod kartou nastavení písma; např. prostý Arial, když jsem ho nastavil, mi ledacos najednou ukazoval dobře, ale naopak další věci rozházel). Doporučuji si na zkaženost některých znaků francouzské databáze zvyknout a dodržovat tuto zkaženost i ve svých databázích (pokud se orientujete na Pokludu) z toho důvodu, abyste to byli schopni napsat nebo vložit přes schránku např. z wordovského souboru do pole pro vyhledávání.

Často kladené dotazy a časté problémy

Jak dostat do Pokludy speciální znaky, např. obrácené E (ə)?

Myslím, že to není t. č. možné. Nenašel jsem řešení, ale vím o několika „volných“ znacích, které Pokluda bere a které by se daly použít jako alternativa pro ty, které neumí. Je to r s čárkou (ve Wordu normálně napíšete čárku a R – ŕ), e s ocáskem dole (ę, napíše se Ctrl+Alt+ž, pak pustit a napsat e), î se stříškou, ô se stříškou (stříška se píše Ctrl+Alt+š, pak pustit a napsat příslušné písmeno) a asi i několik dalších tohoto druhu.

PC Translator

Základní informace

Adresa: http://www.langsoft.cz.

Slovníky: četné placené slovníky a překladače: angličtina, němčina, francouzština, ruština, italština, španělština, latina aj.

Hodnocení: postaveno na dvojicích slov, ne na komplexním zpracování hesla. S databázemi pracuje http://www.slovnik.cz, takže si databáze můžete vyzkoušet tam (ve značně rozsáhlé, snad dokonce úplné verzi, nevím to jistě). Významových dvojic je sice dost (u angličtiny t. č. asi 2,9 miliónu), ale nejde podle mého mínění o vhodný způsob, jak dělat slovníky.

Úprava zde publikovaných databází do tvaru vhodného pro import do PC Translatoru

Nápověda uvádí následující tvar jednotky:

cizí slovo \\ české slovo \t typ slova \c člen podstatného jména

„t“ představuje jeden znak určující typ slova (např. e = slovo elektrotechnické), „c“ představuje jeden (nepovinný) znak pro člen podstatného jména (např. v němčině der=r, die=e, das=s)

 

Tudíž je zřejmě třeba zvolit tento postup: hromadně v textovém editoru (typicky ve Wordu) nahradit všechny znaky „tabulátor-enter“ (ve Wordu ^t^p) za pouhý enter (^p), a to opakovaně. Tím se smažou tabulátory na konci řádku. Zůstanou dva typy jednotek: ty, které neobsahovaly dodatkové údaje v třetím sloupci (v daném řádku je už jen jediný tabulátor) a ty, které je obsahovaly (ty mají dva tabulátory). Pak nahradit všechny tabulátory za \\. Zkusit, zda to jde a zda vyhledávání funguje (pokud někdo PC Translator máte a zkoušeli jste to, tak se mi ozvěte, zda to jde). Pokud to nefunguje, tak ve Wordu provést všechny kroky až po nahrazení za zpětná lomítka, uložit si záložní kopii, pak převést celou databázi na tabulku (Tabulka / Převést), vymazat celý třetí sloupec tabulky, převést tabulku znovu na text (tamtéž) a pak teprve přikročit k nahrazení všech tabulátorů za \\.

Postup jsem vypracoval za vás. Obsahuje ho následující makro. Jak makro použít: otevřete si editor jazyka Visual Basic (ve Wordu zmáčkněte Alt+F11, popřípadě jděte do Nástroje / Makra / Editor...) a tam do šablony Normal přes schránku (Ctrl+C nebo Kopírovat) zkopírujte následující text:

 

Sub PCTranslatorÚpravaDatabázeDZ()
'Upraví databáze ze stránek Davida Zbírala do podoby (snad) vhodné pro PC Translator.
'Některé dodatkové informace (ty v třetím sloupci) se tímto ztratí. Chcete-li je
'zachovat, kombinujte automatické úpravy pomocí tohoto makra
'a úpravy ruční.
Selection.Find.ClearFormatting
Selection.Find.Replacement.ClearFormatting
With Selection.Find
  .text = "^t^p"
  .Replacement.text = "^p"
  .Forward = True
  .Wrap = wdFindContinue
  .Format = False
  .MatchCase = False
  .MatchWholeWord = False
  .MatchWildcards = False
  .MatchSoundsLike = False
  .MatchAllWordForms = False
End With
Selection.Find.Execute Replace:=wdReplaceAll
Selection.Find.Execute Replace:=wdReplaceAll
Selection.Find.Execute Replace:=wdReplaceAll
Selection.Find.Execute Replace:=wdReplaceAll
Selection.Find.Execute Replace:=wdReplaceAll
Selection.Find.Execute Replace:=wdReplaceAll
Selection.Find.Execute Replace:=wdReplaceAll
Selection.ParagraphFormat.Reset
Selection.WholeStory
Selection.ConvertToTable Separator:=wdSeparateByTabs, NumColumns:=3, _
  NumRows:=57, Format:=wdTableFormatNone, ApplyBorders:=True, ApplyShading _
  :=True, ApplyFont:=True, ApplyColor:=True, ApplyHeadingRows:=True, _
  ApplyLastRow:=False, ApplyFirstColumn:=True, ApplyLastColumn:=False, _
  AutoFit:=True, AutoFitBehavior:=wdAutoFitFixed
Selection.HomeKey Unit:=wdStory
Selection.HomeKey Unit:=wdStory
Selection.MoveRight Unit:=wdCell
Selection.MoveRight Unit:=wdCell
Selection.SelectColumn
Selection.Delete Unit:=wdCharacter, Count:=1
Selection.Rows.ConvertToText Separator:=wdSeparateByTabs, NestedTables:= _
  True
Selection.Find.ClearFormatting
Selection.Find.Replacement.ClearFormatting
With Selection.Find
  .text = "^t^p"
  .Replacement.text = "^p"
  .Forward = True
  .Wrap = wdFindAsk
End With
Selection.Find.Execute Replace:=wdReplaceAll
Selection.Find.Execute Replace:=wdReplaceAll
With Selection.Find
  .text = "^t"
  .Replacement.text = "\\"
  .Forward = True
End With
Selection.Find.Execute Replace:=wdReplaceAll
ActiveDocument.Save
End Sub

 

Potom se ujistěte, že jste v souboru s databází a že máte pořízenu její kopii. Všechny ostatní dokumenty raději zavřete, zvlášť v případě, že jste v užívání maker začátečníky. Pak kombinací Alt+F8 vyvolejte dialogové okno s makry. Ze seznamu vyberte makro PCTranslatorÚpravaDatabázeDZ a spusťte je. V lepším případě je hotovo; nemám program k dispozici, ale myslím, že by to mělo snad fungovat. Pokud jste to zkoušeli, tak mi prosím dejte vědět, jak to dopadlo.

Základy práce s elektronickým slovníkem

Snad bude dobře postup, jak pracovat s elektronickým slovníkem a vypisovat si slovíčka, v jednoduché formě poněkud konkretizovat pro ty, kdo s prací s elektronickým slovníkem dosud nemají mnoho zkušeností, a doplnit několik poznámek a tipů.

 

Začátky. Poté, co si z CD nebo z instalačního programu staženého z internetu elektronický slovník nainstalujete, podívejte se do nápovědy, v níž by mělo být popsáno, jak s ním efektivně pracovat. Pak jej spusťte, projděte si základní funkce a osvojte si jejich užívání. Prohlédněte si Nastavení, pokuste se zjistit nebo si domyslet, co které možnosti nastavení znamenají, a nastavte je tak, aby byly pro vás co nejvýhodnější. Na ledacos člověk přijde až během další práce.

 

Hledání a vypisování slovíček. Pokud váš slovník nabízí možnost automaticky vyhledávat slova vložená do schránky, je poměrně výhodné si tuto funkci zapnout (pokud vás bude obtěžovat, lze ji zase kdykoli vypnout). Konkrétní práce pak vypadá asi takto: při čtení textu v cizím jazyce či procházení učebnice apod. máte zapnutý počítač a v aktuálním okně máte otevřený soubor založený na bázi vzorníku, který najdete zde. Ten si vytvoříte velmi jednoduše: uložíte si tuto webovou stránku na disk či disketu (Soubor / Ulož jako); pak, až budete chtít s vypisováním slovíček začít, otevřete si tuto stránku, kterou jste si předtím uložili, vložíte si do schránky (Ctrl+C) část tabulky z vzorníku včetně znaků napravo od tabulky, v textovém editoru si vytvoříte nový soubor, zadáte Ctrl+V jednou nebo lépe opakovaně, např. dvacetkrát, a vytvoříte si tak např. šestistránkovou dvousloupcovou tabulku (nebo třísloupcovou, jak se vám to hodí). Pak si soubor uložíte (např. jako slovicka-aj-1.doc; můžete mít také jediný soubor na všechna anglická slovíčka, kupř. slaj.doc). Pak spustíte elektronický anglický slovník, minimalizujete ho a začnete normální práci s učebnicí, knihou atd. Když narazíte na neznámé slovíčko, napíšete si je do levého sloupce, pomocí šipky vlevo a tlačítka Shift, resp. označením myší (které je ovšem pomalejší) je vložíte do schránky a slovník je buď začne automaticky hledat (pokud podporuje funkci „Vkládat automaticky ze schránky“ a máte ji aktivovanou), nebo musíte jeho okno aktivovat a vložit do něj slovíčko prostřednictvím Ctrl+V a stisknout Enter. Když hledání dokončí, zobrazí vám jeho výsledek. Vy si vyhledaný výraz (výrazy) po svém zpracujete (vypíšete) nebo přes schránku zkopírujete do pravého sloupce. Pokud slovník požadovaný výraz nenašel nebo nejste s výsledkem hledání spokojeni, budete nuceni vyhledat výraz v knižním slovníku (pokud možno co nejrozsáhlejším a nejkvalitnějším). Výsledek tohoto hledání v knižním slovníku (nejlépe všechny nalezené významy, ne jen ten, který zrovna teď potřebujete) doplníte do téže buňky v pravém sloupci, přesunete se, např. pomocí šipek, do levého sloupce své tabulky o řádek níže a pokračujete v práci. Podobně postupujeme v případě překladu z češtiny do cizího jazyka, ovšem s tím, že cizí jazyk neovládáme tak dobře jako mateřský a na jazykový cit se v případě cizího jazyka můžeme spolehnout jen omezeně, a že je tedy nutno věnovat vyhledávání ještě větší pozornost. Při tomto směru překladu budeme nuceni hledat v knižních slovnících častěji, pokud nemáme opravdu velmi kvalitní elektronický slovník.

Zní to snad jako popis nějaké zdlouhavé operace (což je dáno snahou o maximální srozumitelnost), ale jakmile získáte v tomto postupu jistou zručnost a jakmile zjistíte, jaké možnosti Nastavení slovníku vám nejlépe vyhovují, jistě budete souhlasit, že je to celé otázka několika sekund (konkrétní čas závisí především na rychlosti vašeho psaní a na rychlosti vašeho počítače). Pozn.: Velmi doporučuji se naučit klávesové zkratky znaků užívaných v jazyce, s nímž pracujete.[25] (Pozn.: některé slovníky – včetně Millennia – umožňují uložení výsledku hledání do souboru; v Millenniu se toho docílí pomocí Ctrl+S či příslušným příkazem pod nabídkou, kterou vyvoláme pravým tlačítkem myši. V některých případech je příjemnější si výsledek hledání zaznamenávat takto, nikoli přes opisování či vkládání. Výše uvedený způsob je nicméně zřejmě lepší, zejména proto, že můžeme snadno vpisovat i své postřehy a poznámky, můžeme si členit heslo podle svého, dokument je graficky přehledný atd. Je třeba trochu experimentovat a hledat způsoby co nejúčinnější, nejrychlejší a našim potřebám nejlépe vyhovující. Word nabízí možnost jednoduchého převodu textu na tabulku pod Tabulka / Převést, kde si můžete ze souboru, kam jste si uvedeným způsobem slovíčka ukládali, převést tento text na tabulku; jako oddělovač vyberte tabulátor. Obdobně lze, pokud vám tento způsob vyhovuje více než oklika přes Poznámkový blok, převést tabulku na text oddělený tabulátory, to jest do formátu, který se dá importovat.[26]

Výsledky své práce (soubor se slovíčky) si neopomeňte zálohovat ještě minimálně na jedno médium (CD, disketa...).

Když ukončíte jistou etapu práce, výše popsaným způsobem si ze svého souboru importujte slovíčka do uživatelské databáze svého elektronického slovníku.[27] Postup importu se liší podle toho, jaký slovník používáte; viz výše pod anotacemi jednotlivých slovníků. Soubor si samozřejmě můžete vytisknout a s vytištěným dokumentem dále pracovat: zvýrazňovat, přeložit v půli a kontrolovat svou znalost daných slovíček a učit se je atd.

Poslední fází tohoto procesu by mohlo být zaslání vašich souborů se slovíčky níže popsaným, velmi jednoduchým způsobem na adresu správce těchto stránek (david.zbiral@post.cz; můžete také použít tento formulář), který pak vaši databázi připojí k té, která je zde již publikována, aby si ji kdokoli mohl stáhnout, popřípadě ji publikuje samostatně, pokud jde o databázi jazyka, který tu dosud chybí. Pokud se k tomuto poslednímu kroku rozhodnete, budu vám zavázán já i všichni uživatelé, kteří budou mít díky vám databázi zase o něco širší. Nemusíte se strachovat, že je vaše databáze příliš malá: každá troška je velkou pomocí. K e-mailu prosím připojte prohlášení o původnosti práce[28] a výslovné svolení k publikaci.

 

Práce se slovníky online: nepracuje se s nimi vždy nejlépe a nejefektivněji, ale tato práce se dá v mnohém ulehčit, např. už tím, že se naučíte rychle přeskakovat mezi okny pomocí Alt+Tab. Je dobré si též vložit často používané slovníky do „oblíbených položek“.[29]

 

Tipy pro práci s PC. Přehledně tematicky rozčleněné a poměrně obsáhlé tipy pro práci s PC (některé pro začátečníky, jiné i pro pokročilé) lze najít na adrese http://www.david-zbiral.cz/PC-tipy.htm. Najdete tu kapitoly o mnoha programech, o Wordu, o správě souborů, další poznámky o slovnících aj. Myslím, že by to mnoha lidem mohlo pomoci, pokud chtějí pracovat efektivněji s PC, aniž by se z nich museli stát profesionálové. U PC platí, že trocha časové investice do získání know-how alias savoir-faire vám uspoří v budoucnu mnoho času a úsilí. Je dobré trochu studovat materiály o práci s PC. Mnoho programů takové studium nevyžaduje, ale skutečně efektivní práce s PC (která výsledně práci velice šetří) takovouto investici vyžaduje vždy.

Projekt zkvalitnění elektronických slovníků

Úvodní poznámky o potřebnosti zkvalitnění elektronických slovníků

Kdo někdy trochu více pracoval s elektronickým a knižním slovníkem, bude pravděpodobně souhlasit s tvrzením, že elektronické slovníky nesmírně zrychlují a ulehčují práci. Avšak mnohé, zvláště zdarma distribuované elektronické slovníky dostatečně neuvádějí omezení významu a tzv. minimální kontext (a nenajdeme ho leckdy ani v rozšiřujících, placených databázích), tj. některá základní spojení, v nichž se příslušné slovo často používá (a tedy i návod, kde je lze takovým a takovým způsobem užít bez nebezpečí omylu), také tu často není valence a spojitelnost slova, gramatické zařazení atd. Mnohé elektronické slovníky najdou sice třeba značný počet ekvivalentů požadovaného výrazu v druhém jazyce, ale nespecifikují významové rozdíly mezi jednotlivými vyhledanými jednotkami a ne vždy uvádějí, v jakém kontextu lze ten který výraz či obrat použít a v jakém je naopak vhodné zvolit nějaký jiný. Krom toho žádný slovník, ani ten, který minimální kontext hojně uvádí, nemůže být dokonalý.

Varování před elektronickými slovníky, které lze často zaslechnout, je skutečně v mnoha případech do značné míry oprávněné. Ale problém (a to je nutno zdůraznit) nespočívá v samotných elektronických slovnících; ty svými možnostmi naopak daleko převyšují slovníky knižní. Problém tkví v kvalitě databáze. Níže nastíněný projekt si klade za cíl databázi elektronických slovníků doplňovat a zlepšovat (pokud jsou elektronické slovníky daného jazyka dostupné), popřípadě postupně vytvářet (pokud dostupné nejsou), a to s vynaložením jen toho úsilí, jež většinou potenciální účastníci projektu už nyní tak jako tak vynakládají.

Projekt zkvalitnění

Všem zájemcům, kteří pracují s cizími jazyky (studenti, amatérští i profesionální překladatelé, pedagogové atd.), navrhuji podílet se na projektu, jehož prvními skromnými plody jsou slovníky publikované na adrese http://www.david-zbiral.cz/jazyky.htm a také v tomto dokumentu.

Celý postup, jak přispět k úsilí o zkvalitnění elektronických slovníků, je velmi prostý. Vypisujte si vyhledaná slovíčka nikoli rukou do papírů, nýbrž do souboru v počítači. Zvlášť pokud pracujete s elektronickým slovníkem, jenž umožňuje hromadný import databáze (většina existujících produktů), rozhodně nebudete litovat vynaloženého úsilí, neboť z tohoto souboru lze potom snadno importovat slovíčka, která jste byli nuceni hledat v knižních slovnících apod., do svého slovníku elektronického, popřípadě do elektronického slovníku touto cestou doplnit vlastní poznámky o kontextu či významu, v jakém jste se s daným výrazem setkali v tisku či literatuře a který váš elektronický slovník neuvádí. Když pak budete znovu hledat tentýž výraz (mně se to alespoň stává dosti často) nebo si ho napoprvé zapamatujete pouze pasivně a při překladu do cizího jazyka budete uvažovat, jak převést svou myšlenku z mateřského jazyka do jazyka cizího, tak se vám tyto přírůstky k databázi budou velmi hodit. Samozřejmě že tyto textové soubory, do nichž jste si vypisovali slovíčka (mohly by být založeny na vzorníku, ušetříte si tak práci; záleží dost na tom, pro jaký slovník a pro jaké účely si slovíčka vypisujete), si lze vytisknout a dále s nimi pracovat (obtížná slovíčka si barevně zvýrazňovat atd.).

Jak si vypisovat slovíčka; postup importu

Jednoduchý praktický postup, jak si takovou soukromou databázi vytvářet, je tento: v textovém editoru si vytvořte soubor, do něj vložte tabulku (dvou nebo třísloupcovou). Do té pak vypisujte slovíčka; na straně levé by měly být vždy výrazy z cizího jazyka, na straně pravé jejich české ekvivalenty. Tabulku si nemusíte tvořit sami, udělal jsem to za vás: můj vzorníksi můžete uložit na vlastní disk třeba ihned. Z uloženého souboru obsahujícího vzorníky můžete přes schránku (Ctrl+C) rozkopírovat tabulku do vlastních souborů, do nichž si chcete vypisovat slovíčka. Když dospěje toto vaše vypisování slovíček (např. pro studijní účely, přípravu na zkoušky apod.) do určité fáze, kdy se rozhodnete tato slovíčka importovat do svého elektronického slovníku. Jak se to dělá, zjistíte v kapitolách věnovaných jednotlivým slovníkům: Millennium, Lingea Lexicon, Pokluda aj.

Doporučuji si v každém případě, a tím spíš pokud pracujete s jiným slovníkem než s těmi, které uvádím, celý postup importu zkusit hned když si do souboru vytvořeného na základě vzorníků vypíšete několik prvních slovíček. Tak zjistíte s předstihem, zda vám tento postup funguje, a pokud ne, tak můžete hledat jiné cesty, jak si vypisovat slovíčka tak, aby pak šla importovat do uživatelského slovníku.

 

Kdybyste měli s importem jakýchkoli jednotek problémy i přes pročtení návodů na těchto stránkách a nápovědy programu: v takovém případě se na mě zkuste obrátit a soubor mi zaslat s maximálním množstvím dostupných informací o tom, jaký formát mají jednotky mít (viz např. nápovědu daného slovníku či stránky dané společnosti), a údajem o zdroji jednotek. Já se pokusím jej zpracovat tak, aby šel do Millennia importovat bez problémů (neslibuji, že zrovna budu mít čas a samozřejmě taky nevím, zda to vůbec půjde). O něco bych za to chtěl požádat: o vaše svolení tyto jednotky publikovat na internetu (samozřejmě jen pokud jste jejich autory, a můžete tudíž takové svolení udělit). Připojte proto prosím i informace o své databázi, jak byla získána, jak jste byli pečliví při vypisování, jaký „vztah“ máte k danému jazyku (student angličtiny, čtenář-amatér perské poezie apod.) a případně další informace, abych mohl databázi nějakým způsobem zařadit. Svolení k publikování a prohlášení o původnosti práce prosím v mailu vyjádřete výslovně. Samozřejmě že své jednotky mi zašlete i pokud mou pomoc nepotřebujete, kvůli samotnému vytváření, rozrůstání, zkvalitňování a opravování databází elektronických slovníků.

Je škoda, že se tak málo lidí účastní projektu přispěvatelsky. Kdyby to bylo nějak enormně práce navíc, tak bych tuto neochotu se zapojit celkem chápal, ale záhadou mi je, proč se nezapojí víc lidí, když vypisovat si slovíčka do PC není práce navíc, ale naopak velké zefektivnění a zrychlení práce, jak brzy zjistí ti, kdo tento způsob vypisování začnou praktikovat. Chce to samozřejmě jistou časovou investici do začátku: osvojit si určité zásady, pročíst si některé části této stránky, zaučit se s užíváním počítačového slovníku. Ale pak to začne práci šetřit velmi výrazně.

Další tipy pro import a rozšiřování databází

Doporučené zásady pro vypisování slovíček, tipy

Aby uživatelský slovník sloužil tak, jak má, je dobré (a někdy přímo nutné) dodržovat zásady editace hesla. Ty obecné najdete zde, ty, které se slovník od slovníku liší, jsou v příslušných kapitolách.[31] Následující text je určen spíše pro jednoduché vypisování slovíček. O komplexní lexikografii se dovíte víc v kapitole Lingea Lexicon.

 

Samotný projekt, konkretizace

Zatím byla řeč o individuální části projektu, která podle mé zkušenosti každému jednotlivci velmi ulehčí práci s jazykem, překlady, porozumění textu atd. Ale vlastní projekt spočívá především ve spolupráci mezi uživateli elektronických slovníků. Navrhuji těm čtenářům, kteří si budou výše uvedeným způsobem doplňovat databázi svého elektronického slovníku, aby svou databázi dali k dispozici i dalším uživatelům, a to tím způsobem, že příslušný soubor (soubory) publikují na internetu.

Mechanismus kontroly

Předběžné poznámky

Je zřejmé, že mechanismus kontroly je slabinou celého projektu. Kontrola souborů, které mi dojdou, by byla stejně pracná jako hesla sestavit sám (nebo i pracnější). Hloubková kontrola není možná bez člověka, který by byl ochoten ji provádět, a bez finančního zabezpečení projektu. Už na mě bylo směřováno několik mailů či ústních námitek, které pochybují o možnosti dobrat se takto něčeho pozitivního. Jistý korespondent se nechal slyšet: „Nesdílím [...] Váš optimismus v tom, že volnou spoluprací většího okruhu lidí na vytváření slovníků se lze dopracovat něčeho pozitivně významného. [...] NIKDY BYCH NEPOUŽÍVAL K SERIÓZNÍ ČINNOSTI SLOVNÍK, O KTERÉM BYCH VĚDĚL, ŽE SE NA NĚM PODÍLELO MNOŽSTVÍ LIDÍ, ZA JEJICHŽ KVALIFIKOVANOST NIKDO NERUČÍ.“ Tento postřeh míří do samotného jádra problému (ač si neodpustím poznámku, že umím docela dobře číst i malá písmena). Zároveň se ale nevyhne několika nepřesnostem či ukvapeným soudům. Protože podobné, v zásadě oprávněné námitky jistě vyvstanou v té či oné podobě na mysli většině čtenářů, snad nebude od věci uvést několik poznámek, které by se pokusily vidět problém v trochu jiném světle.

Vlastní mechanismus kontroly

Nynější mechanismus kontroly je dosti skromný, ale musí to z časových a finančních důvodů stačit (ostatně je asi na místě tento problém řešit až ve chvíli, kdy by mi ve větší míře začaly docházet příspěvky). Obecně spočívá na těchto základech:

 

Doplnění, vylepšení, otázky

Pakliže víte o nějakých adresách, z nichž si lze stáhnout slovníky a které se necitují v rozcestníku, popřípadě o volně přístupných databázích slovíček, tak pošlete odkaz, nejlépe i s co nejoficiálněji znějící anotací, na adresu david.zbiral@post.cz (můžete použít též tento formulář). Pokud znáte lidi, kteří si vypisují slovíčka do PC nebo je k tomu lze přemluvit, tak je neváhejte s tímto projektem seznámit.

Jak si vytvořit nový slovník (využití elektronického slovníku pro širší účely)

Základní údaje a obecný popis pracovního postupu

Následují spíše obecné informace.

Nejsem si vědom žádného zákonného ani etického důvodu, který by bránil využití elektronického slovníku kromě jeho původního určení i k účelům dalším, pokud to ovšem nezapovídají příslušné licenční podmínky. Zejména si jej lze nainstalovat na disk několikrát (do různých adresářů) a jeden z exemplářů využívat pro účely práce s jinou databází, např. řekněme soukromým tibetsko-českým a česko-tibetským slovníkem, který si uživatel sám vytváří tak, že si popsaným způsobem postupně spisuje databázi tibetských slov (přepsaných do latinky), čas od času ji importuje do uživatelského slovníku a zvolí, aby program hledal pouze v uživatelském slovníku (zvlášť pokud si tyto tibetské výrazy tak jako tak vypisuje, tak není důvod, proč toho tímto způsobem nevyužít).[39] To stejné je samozřejmě možné s umělými jazyky a nejen s nimi; uživateli se otvírá celá škála využití. Pokud někdo pracuje s nějakým jazykem dlouhodobě a slovník daného jazyka není dostupný na Internetu, tak se tento postup, jenž na první pohled vypadá jako nerealizovatelný a přesahující lidské síly, ukáže sice jako pomalý, ale přinášející už záhy plody. Celý proces samozřejmě významně zrychlí spolupráce a sdílení výsledků individuálního úsilí s ostatními uživateli elektronických slovníků, zejména přes internet. (Tip: ani v tomto případě nezapomínejte na antivirovou kontrolu.)

Je samozřejmé, že do uživatelského slovníku můžeme připojovat nejen slovíčka, která si sami vypíšeme ze slovníků, popřípadě slovíčka v souborech na internetu, které jsou k tomu přímo určeny a mají požadovaný formát vhodný pro import, nýbrž v zásadě veškeré databáze tohoto typu (výraz v jednom jazyce – jeho ekvivalent v jiném jazyce), které někde získáme a se kterými si dokážeme pohrát tak, aby nabyly správného formátu (viz výše příklad se zaměňováním „ : “ za „tabulátor“, tipy pro složitější převody na http://www.david-zbiral.cz/PC-tipy.htm, oddíl věnovaný funkci Nahradit).

Vývoj vlastní platformy (pro programátory)

Zvažuji provozování slovníků na vlastní platformě, k jejímuž vytvoření by bylo použito jádra prohlížeče Mozilla (který je distribuován jako otevřený kód a jeho využití k vytvoření odvozeného díla je za splnění určitých podmínek zákonné). Slovníky by byly ve formátu XML či HTML a jejich stylopis v CSS, respektive by byly do XML či HTML dynamicky generovány z databáze, ale program by uměl navíc oproti prohlížeči prohledávat fulltext s použitím operátorů AND, NOT, OR, NEAR (s nastavením přesné vzdálenosti slov, již by bylo možné zadat i rozsahem, např. NEAR1-2; NEAR2 by mohlo znamenat právě ve vzdálenosti 2, někdy se to hodí) a "" (přesný výraz), přičemž mezera mezi dvěma hledanými výrazy by znamenala nalezení obou nezávisle (tj. ani operátor OR, ani AND, protože ty se týkají fulltextu, kdežto mezera by znamenala nalezení nezávislých heslových slov), přizpůsobil by se specifickému užití na zobrazování slovníků, takže by nabídl veškerý komfort slovníkové platformy, jejž prohlížeč využívaný pro práci se slovníky nemá, slovníky by naindexoval, aby se prohledávání zrychlilo, zobrazoval by výsledky nalezené v jednotlivých slovníkových titulech podobně přehledně jako Lingea Lexicona umožnil by prohledávání pomocí vícera kritérií (třeba: najít všechna slova, která mají germánskou etymologii, jejichž etymon začíná na b a která jsou poprvé dosvědčena v 11. století; pokud jsou hesla korektně formátovaná, jako ve fiktivním příkladu <firstocc>1038</firstocc> <etym><geogr>germ.</geogr>baro</etym>, tak to vůbec není nemožné – stačí, tak si to aspoň představuji, naindexovat zvlášť jednotlivá pole a při hledání za použití vícera kritérií to použít. Hledalo by se buď základním heslovým hledáním (bez formuláře, jednoduchým políčkem), nebo pokročilým hledáním přes formulář, který by právě měl kolonky zahrnující všechny značky (políčka Etymologie atd.). Tam by uživatel zadal kritéria (včetně možnosti zástupných znaků) a program by mu hesla těmto kritériím odpovídající vyhledal.

Výhodou navázání na zdrojový kód Mozilly je, že by takřka nebylo potřeba programovat nic, co se týká zobrazování – CSS ani speciální znakové entity pro zápis fonetické abecedy, francouzských znaků apod. – tato část práce je hotova. Asi jen jedna věc by byla potřeba pokud jde o vlastní zobrazení, a to doprogramování nadstandardní vlastnosti CSS add-afterbegin add-beforeend: např. kulaté a hranaté závorky uzavírající některé poznámky a různé oddělovače (čárka a mezera oddělující ekvivalenty apod.) by pak nebyly ve zdrojovém kódu slovníku, kde jsou nadbytečné a kód „špiní“, nýbrž v definici stylu dané značky ve stylopise, která by pak vypadala např. takto:
n {font-size: 11pt; color: gray; add-afterbegin: "("; add-beforeend: ")";}
vyslovnost {font-size: 12pt; color: orange; add-afterbegin: "["; add-beforeend: "]";}
ekv {font-size: 13pt; color: black; add-beforeend: ", "}
ekv:last-child {add-beforeend: "";}
atd.

 

[elsl-s]

 

Pokud byste uměli takovou platformu naprogramovat, ať už na základě Mozilly či ne, ozvěte se na david.zbiral@post.cz. Ukázku, jak po zobrazení může heslo vypadat, najdete zde, větší vzorek zde.

Samozřejmě dejte vědět také pokud víte o něčem, co podobné možnosti má. Hledal jsem takový program na internetu, ale bez úspěchu. Nikde jsem nenalezl ani náznak takových možností.

Rozcestník

Rozcestník s odkazy na četné slovníky dostupné na internetu najdete na stránce Slovníky a jazyky na internetu – rozcestník. Pokud víte o něčem, co stojí za zmínku a v rozcestníku chybí, tak mi prosím pošlete e-mailem zprávu obsahující: 1.) adresu příslušných stránek, 2.) co nejobjektivněji a nejneosobněji formulovanou anotaci, co lze na dané adrese nalézt.

Speciální znaky v počítačových slovnících a textových editorech

Cizí abecedy a počítačové slovníky: jak zapisovat speciální znaky?

Stránky s fonty cizích abeced ke stažení (odkaz)

Viz zvláštní kapitolu na stránce Slovníky a jazyky na internetu – rozcestník.

Cizí jazyky a textové editory; speciální znaky

Různé

Vypisuji sem některé poznatky z práce s Wordem. Mnohé z nich mají obecnější dosah.

 

Řečtina

Fonetika, fonetické abecedy, zápis International Phonetic Alphabet do HTML (odkaz)

Viz zvláštní stránku zpracovávající témata fonetické abecedy, International Phonetic Alphabet a HTML aj.

Závěrečné slovo, hlavní úkoly a pobídnutí k zájmu o počítačovou lexikografii

Dosavadní počet návštěv dává tušit, že tato práce nebyla zbytečná. Vypisování do PC práci v konečném důsledku spíš šetří a umožňuje to práci zúročit importem do elektronického slovníku a rozšířením jeho databáze, a stačí trochu úsilí věnovat do kvality vypisování, ovládnutí jistých formálních zásad uvedených na této stránce a do následného zaslání.

Rozšiřování a zkvalitňování databází počítačových slovníků je naléhavě třeba. Máme tyto základní úkoly:

 


Publikování této verze: 18. 11. 2006 23:43

Počet normostran (v přepočtu): 154

Počet slov: 38532

Umístění: http://www.david-zbiral.cz/El-slovniky-plnaverze.htm



[1] Pokud máte plnou verzi LL a chcete používat jen balíček AJ NJ FJ, tak nemusíte stahovat demoverzi; prostě rozbalte balíček lingea.exe do podadresáře data plné verze. Pokud máte plnou verzi LL, ale chcete používat i jiné balíčky než jen AJ NJ FJ, stáhněte si demoverzi, balíček lingea.exe si nainstalujte do podadresáře data plné verze a ostatní balíčky každý do podadresáře data jedné instalace demoverze. Pokud plnou verzi nevlastníte, stáhněte si demoverzi v každém případě a nainstalujte si ji do několika různých adresářů podle toho, kolik balíčků (těchto nebo svých vlastních) chcete používat. Pozn.: pro ty, kteří jsou jen trochu pokročilejší, je tato poznámka spíš zamlžující než vysvětlující.

[2] Uživatelský slovník typu 1 je běžný uživatelský slovník s názvem např. encz-usr.udr (který je umístěn ve složce uživatelských souborů, běžně Dokumenty/Lexicon, a který je pro jeden směr jednoho slovníku vždy jen jediný). Uživatelské slovníky typu 2 jsou uloženy v podadresáři data a mají daleko větší možnosti.

[3] Popřípadě klikněte na titulek pravým tlačítkem myši, zvolte Uložit cíl jako a během stahování můžete pracovat v jiném okně či pokračovat v četbě této stránky.

[4] Není třeba se bát, že nějaké jednotky zmizely, a to ani když výsledný počet jednotek v uživatelském slovníku je nižší: znamená to maximálně, že byly odstraněny ty chybné a sloučeny ty, které se duplikují.

[5] V absolutních číslech jen asi 420, ale celkový počet klesl asi o 300 odstraněním těch duplicit, které byly zhodnoceny jako naprosté či ve všech druzích slovníkového softwaru zbytečné. Takže přibylo asi 720 jednotek, nikoli jen 420.

[6] Např. příklad „su\ me\n komi/zoij a)\n seauto\n h(=| qe/leij“ s. v. „a)/n“.

[7] Zdá se mi, že vše, co vezme Poznámkový blok ve formátu ANSI, vezme i Millennium a Lingea Lexicon: ověřeno zatím na tomto ę, na o s týmž obloučkem a na jerech (kde je výsledek negativní, stejně jako je nelze uložit v ANSI).

[8] Následuje text, který věc zbytečně komplikuje; je určen pro pokročilejší a těm, kdo mají rádi přesnost: teoreticky je možné jich provozovat v jedné instalaci i více než šest a dát např. rumunsko-českému i bulharsko-českému shodně předponu encz. Ale je tu tato zásadní nevýhody: v (domněle) anglicko-českém směru hledání by se hledalo jak v rumunsko-českém, tak v bulharsko-českém slovníku, takže by se nám tam zbytečně pletla slovíčka, která nehledáme. To je řešitelné vytvořením nové sady, viz níže.

[9] Za návod vděčím technické podpoře Lingey.

[10] Ono to totiž nejde, tak alespoň dopadl můj pokus. Ani když zadáte masku usr, tak to nepřetrumfne výchozí nastavení pro zobrazení běžného uživatelského slovníku.

[11] Příklad: Když zadám dotaz "jáchym + fiore", tak LL nezobrazí toliko mé uživatelské heslo "Jáchym z Fiore", nýbrž ukáže více výsledků (a také nezdůrazní v uživatelské jednotce "Jáchym z Fiore" ty nalezené součásti vyhledávacího dotazu oranžově, lze ovšem zvažovat, zda je zrovna absence zvýraznění opravdu na škodu). Užívání operátorů tu jednoznačně není plnohodnotné: Jáchym + Fiore by mělo najít jen hesla, která obsahují obě tato slova (což splňuje jen má uživatelská jednotka). Že se v uživatelském slovníku nehledá stejně sofistikovaně jako v hlavním, mi Lingea potvrdila s odůvodněním, že uživatelské slovníky jsou v textovém formátu, kdežto základní v binárním. Každopádně i prostý textový formát sofistikovaně zpracovat lze, ale načítání by trvalo déle. Nejlepším řešením by asi bylo zpřístupnit uživatelům program, který by převedl soubory z textového formátu do binárního. Převedení do binárního formátu, pokud to správně chápu, slovník zároveň zašifruje. V binárním formátu tedy určitě nebude možné jej editovat. Takže by bylo třeba postupovat tak, že budete mít vždy vedle slovníku v binárním formátu i soubor textový, na jehož základě byl binární slovník vytvořen, a právě do textového budete opravovat chyby a doplňovat nové jednotky; po určitém čase byste si zase z tohoto zdrojového textového slovníku vytvořili kopii v binárním formátu. V další verzi LL by takový nástroj měl být, jen mám ze své komunikace s Lingeou obavy, aby se daly zpracovat hromadně celé tituly, a nikoli jen vkládat přes formulář v uživatelském rozhraní programu jednotlivá hesla; to by byla pro uživatelskou lexikografii katastrofa. Možnost editace celého slovníku bohužel bude, jak se zdá, opravdu vyřazena a možnost načítání textových slovníků také, což lexikografy přinutí zůstat u demoverze LL 2002. Tyto informace o další verzi jsou však nepotvrzené. Apeloval jsem na Lingeu, aby uvedené rysy, velmi přínosné pro uživatelskou i profesionální lexikografii, ponechala; uvidíme, k jaké koncepci se nakonec rozhodne.

[12] Poznámka pro ty, které zajímají podrobnosti: Samotné běžné značkování by ani tak nevadilo, problém je v takovém případě se zalamováním řádků. Kdyby se dalo v uživatelském slovníku aplikovat členění head, tak prostě stačí do head dát, že se za ní mají řádky zalomit (a nedávat to do značky entr). Pokud to nejde (a mně se to nepodařilo), tak nelze zalomení řádků ovlivnit jednotně a vidím v zásadě 3 možnosti: 1.) vložit zalomení v definičním souboru do entr a tvary <g.> pak psát na samostatný řádek (to se pak řádek zalomí před tvary a vzdálí je tak od heslového slova, což je pochopitelně nevhodné); 2.) vložit zalomení v definičním souboru do entr, ale psát tvary, uzavřené do speciální značky, na stejný řádek jako heslové slovo (to ale bude mít dva negativní důsledky: nalezení hesla pouze v „okolí“, ne jeho okamžité zobrazení, a vypsání tvarů včetně formátovacích značek do levého podokna s výsledky hledání, místo aby v tomto podokně byla jen nalezená heslová slova), 3.) vložit zalomení v definičním souboru nikoli za entr, nýbrž za samotné tvary (takže značka pro tvary bude vypadat třeba takto: g = "|s2|cB|b+%s|b.|c.|s.|h1|n2") a tvary v uživatelském slovníku psát na samostatný řádek, což je patrně nejlepší z těchto možností, ale má to přece jen negativní důsledek: nejednotu zalomení. U slov, kde jiné tvary, přesněji řečeno značku g, neuvedeme (např. proto, že jiné tvary nemají), nedojde vůbec k zalomení a první význam bude hned za heslovým slovem, bez zalomení řádku. Lze to zčásti řešit tak, že se ještě vloží zalomení před číslování významů: numb = "|n1|d1|cR|b+%s.|c.|b.". Tím dospějeme k tomuto stavu: kde jsou gramatické tvary, tam budou za nimi dvě zalomení řádku (n2 za g); kde nejsou gramatické tvary, ale je číslování významů, dojde k jednomu zalomení (kvůli n1 před numb; je to nekonzistentní, ale přehlednější než nemít tam zalomení vůbec); kde nejsou tvary ani číslování, tam k zalomení nedojde. Řešením může být místní formátování: simulovat tvary i tam, kde nejsou: vložit tam <g. > a nic do nitra této značky nepsat. Možná je pro snadnější pozdější zpracování a automatizované změny neužívat v takovém případě simulaci <g.>, nýbrž si nadefinovat speciální značku, která bude obsahovat jen zalomení 2 řádků: např. r = "|n2" a pak ji aplikovat na novém řádku za heslovým slovem prostě takto: <r.>. Řešením 3, byť takto graficky vylepšeným, samozřejmě vzniká jistá vnitřní nekonzistentnost slovníku. Nicméně je to asi řešení nejlepší (pakliže se sekcí head – která všechny tyto problémy velmi šikovně řeší – opravdu v uživatelských slovnících nelze zacházet). Jakmile by v budoucnu šlo pracovat s head v uživatelských slovnících, tak se všechna <r. > prostě vymažou, definice se předefinují a je hotovo.

[13] Pro přesnost: pokud existuje v tom či onom směru (a právě jen v jednom ze dvou směrů) lemma přesně toho znění, tak se najde i bez nastavení jazyka, protože se prohledávají, pokud uživatel neurčil jinak, automaticky oba směry na přesné výskyty. Ale pokud se kryje jen částečně nebo pokud jej obsahují oba směry (např. „a“ jako latinská předložka a „a“ jako česká spojka), tak pokud nenastavíme pro některé značky, že jejich jazyk je jazyk výchozí (tj. pokud do definice příslušné značky nedáme |l1), tak místo aby LL našel „okolí“ v požadovaném směru, najde „okolí“ ve směru nežádoucím. Závěr: rozhodně jazykový atribut |l používat, zvlášť u značky odkazu, sublemmatu a fráze. Nezapomeňte na konci definice atribut vypnout pomocí „l.“. U příkladu (samp2), kde se to v jednom odstavci láme, se dá např.: "|d3|l1|i+%s|i.|l.|h1|l2%t|l.|n1".

[14] Někdy ale snese o něco víc: např. u hesla obsahujícího následující příklad o 212 znacích se nekouše: ?Intellexit [verbum illud] de divitibus qui malo modo et iniusto suas divicias ... acquirunt. = Spojoval to (rozuměj: ten výrok) s bohatými, kteří nabývají svého bohatství zle a nespravedlivě. <f.Fournier I, 208>.

[15] Technická podpora potvrdila, že o tom ví. Úprava se ale patrně v nejbližší době nechystá.

[16] Můj pokus dopadl tak, že se u 3997 znaků podle wordovského počítání se ještě nekouše, výše ano (pro představu: jde o .

[17] Samozřejmě že je třeba posuzovat jinak dva výskyty v díle téhož autora a dva výskyty v dílech různých autorů atd.

[18] Pro pokročilejší: definice vypadá třeba takto: h = "|cR|fI|b-|i-[%s]|b.|i.|f.|c.". Fonetickou abecedu zapíná značka |fI. Segment „[%s]“ už sám o sobě říká, že má být výraz uzavřen do hranatých závorek (takže je nepište do textu slovníku). Pozn.: pokud se nastaví do hlavičky note2= "|cR|fI[%s]|f.|c.|n1", tak bude fonetickou abecedu zapínat také znak % na začátku řádku (který aplikuje to, co je definováno pod note2). Ale lepší je používat značku <h.>.

[19] Tato vlnovka se v LL u některých velikostí písma jeví jako rovná čárka.

[20] Za poskytnutí většiny těchto kódů vděčím technické podpoře LL.

[21] Příklad:

#paenito

<g.ere, ui, -> <a.penito>

<c.impers. <e.paenitet me>>

=lituji, je mi líto, želím, mrzí mě, nelíbí se mi, nejsem spokojen

=stydím se

<c.pers.>

=kát se

[22] Např. Václav Vlasák – Stanislav Lyer, Česko-francouzský slovník / Dictionnaire tchèque-français, I-II, Státní pedagogické nakladatelství, Praha 1993.

[23] Příklad nepříliš dobře zpracované jednotky: pro wise woman nalézá „kouzelnice, porodní babička [sic!], věštkyně“, zatímco zásadní významy „vědma, porodní bába“ nikoli.

[24] Alternativní postup, pokud např. chcete importovat jen část nebo je soubor příliš rozsáhlý a je tedy třeba postupovat po etapách: označte (např. myší) tabulku se slovíčky od prvního slova až po poslední, a to včetně formátovacích znaků napravo od tabulky. Vložte označený segment do schránky (Ctrl+C nebo příkaz Kopírovat). Otevřete si velmi jednoduchý textový editor, nejlépe Poznámkový blok (obvyklá cesta k Poznámkovému bloku: Start / Programy / Příslušenství) a obsah schránky do něj vložte (Ctrl+V nebo příkaz „Vložit“). Pak soubor uložte pod vámi zvoleným názvem a pokračujte následujícím bodem běžného postupu.

[25] Postup, jak zjistit klávesovou zkratku znaku, který často používáme: Vložit / Symbol, najít příslušný symbol, myší na něj klepnout; zobrazí se nám zkratka, kterou symbol má, vyzkoušíme si její funkčnost a naučíme se ji nazpaměť. Pokud daný znak klávesovou zkratku nemá, lze ji nadefinovat v téže nabídce pod tlačítkem Klávesová zkratka). Tímto způsobem zanedlouho budete psát složité znaky stejně snadno jako ď nebo ó. Někomu tento způsob vyhovuje mnohem lépe než užívání cizí klávesnice (např. francouzské), která dané znaky obsahuje. V případě užívání těchto symbolů ovšem dejte pozor, zda je váš textový editor při dalším otevření souboru nezmění, např. è na č.

[26] Wordovská makra, která by rozhodně mohla zajímat ty, kdo importují do slovníku Millennium nebo ukládají z Millennia slovíčka do souboru a pak je upravují do přehlednější formy: viz http://mujweb.cz/www/david.zbiral/NewMacros.bas (ImportFrSlovnik pro nahrazení speciálních znaků tak, aby to grafickou podobu pokazilo, ale naopak aby to Millennium interpretovalo správně, např. ê nahradí za ę, a též makro FrSlovnikTerms pro převod souboru, jejž využíváte pro funkci „ukládání do souboru“, které provede opačný postup, znaky tak napraví do fr. podoby, např. ę nahradí za ê, převede text do přehledné tabulky atd.). Makra nesmírně šetří čas a námahu, vyplatí se s nimi naučit pracovat a upravovat je přímo v MS Visual Basicu. Dodržujte při použití jistou opatrnost, užívejte jen v kopiích svých dokumentů, viz též varování v http://mujweb.cz/www/david.zbiral/PC-tipy.htm. Je nutno tato makra v MS Visual Basicu jemně přizpůsobit vašim potřebám, např. co se týče cest, kam se soubory ukládají, atd.

[27] Raději si však import vyzkoušejte hned po vypsání např. 3 prvních slovíček, jednak abyste si postup zažili, jednak (a především) abyste zjistili, jestli bez problémů funguje. Pokud nefunguje, pročtěte si ještě jednou výše uvedený návod. I pokud jste dodrželi pracovní postup ve všech bodech, pokuste se raději o import ještě jednou. Jestliže nepomůže ani to, obraťte se s dotazem na někoho ve svém okolí, kdo dobře rozumí počítačům.

[28] U slovníků je původnost kamenem úrazu, a to samozřejmě nejen u elektronických. Bylo by iluzí se domnívat, že tvůrci slovníků vše berou z vlastních excerpt; ve skutečnosti v naprosté většině případů bohatě využívají – a je to dobře – práce předchozích lexikografů. To stejné pochopitelně děláme my. Původnost není problémem ani tak u jednoduchých hesel zaznamenávající pouze základní významy (tam je obvykle vše celkem jasné a moc vlastního leckdy ani přidat nelze), jako spíš u komplexně zpracovaných hesel, které jen opisují významy z některého slovníku. Tak by bylo lepší nepostupovat. Důležité je, aby byl původní slovník ve svém celku, ne nutně v každém jednotlivém hesle: aby dodával jednotky a významy v jiných slovnících neobsažené, aby přeskupil ekvivalenty a významy v rámci hesla (pokud autor považuje jiné uspořádání příslušného hesla za účelnější), atd.

[29] Pokud jde o využití maker a skriptů, je možné: pokud je umíte trochu programovat a online slovník má transparentní zadání vyhledávacího řetězce, takže adresa s výsledky vypadá třeba takto: http://www.dictionary.com/engver/index.php?ring+of+power a vy jste hledali sousloví „ring of power“, tak už jste pochopili vyhledávací mechanismus a můžete s ním v makru či skriptu pracovat a práci si tak ulehčit: např. by si makro nechalo něco napsat do okénka, automaticky by to začalo vyhledávat, pak by to vložilo do wordovského souboru výsledek hledání (to už je těžší a ne vždy možné) a vepsalo to i váš dotaz, takže byste měli hotové heslo bez kopírování přes schránku či vpisování jak ve Wordu, tak do kolonky na stránkách atd. Ale to je jen pro poučenější uživatele, kteří zvládli základy skriptování. A ne vždy je jisté, že to za úsilí věnované programování bude stát.

[30] V nahrazování včetně takových věcí jako hledání tabulátoru či určitým stylem, barvou, tučností apod. formátovaného písma je Word naprosto nepřekonatelný. Neznám textový editor, který by měl složité hledání a nahrazování lépe zvládnuto než Word, ani jsem o žádném neslyšel.

[31] Ne všechny byly dodrženy ve zde publikovaných databázích. Důvod je jednoduchý: 1.) ne vše, co se mi dostalo do rukou, se mi podařilo žádoucím způsobem upravit, 2.) většina těchto zásad se formulovala postupně, během práce s elektronickými slovníky, tzn. že ty položky databáze, které byly vytvořeny před jejich formulováním, s nimi nejsou v souladu. Někdy lze chyby opravit jen s vynaložením velkého úsilí (a někdy vůbec). Proto je lépe se snažit těmito zásadami od počátku řídit.

[32] Šipky lze kombinovat pro delší skoky s klávesou Ctrl.

[33] Některé tipy pro práci s PC lze nalézt na adrese http://mujweb.cz/www/david.zbiral/PC-tipy.htm.

[34] Poznámka o oboustrannosti slovníků: samozřejmě že by bylo lepší tvořit databázi z každé strany zvlášť. Ale na druhou stranu jednotka zpracovaná jako francouzsko-česká má jistou cenu i pro překlad z češtiny do francouzštiny. Proto je dobré obě dávat do stejného slovníku (Millennium na tomto základu pracuje). Jednotky se tak mohou „duplikovat“, tj. nám slovník může najít jednak naši jednotku, kterou jsme zpracovali jako francouzsko-českou, tak naši jednotku, kterou jsme zpracovali jako česko-francouzskou. Tato duplicita je ale mnohem lepší než nenajít nic. Např. consterné, -e ohromený, vyděšený, zděšený, konsternovaný, překvapený (nepříjemně), zmatený je očividně jednotka patřící do slovníku francouzsko-českého. Ale náš čas je omezený: zpracovat kvůli hledání jednotky consterné také česko-francouzsky hesla „ohromený“, „zmatený“ atd. by nám dalo moc práce. Proto to nyní neuděláme, počkáme na jindy, až budeme hledat naopak slovo „ohromený“; teprve tehdy zpracujeme heslo „ohromený“ česko-francouzsky. Do té doby prostě když budeme hledat „ohromený“, tak v oboustranně řešeném slovníku najdeme heslo „consterné, -e ohromený, vyděšený, zděšený, konsternovaný, překvapený (nepříjemně), zmatený“, což očividně není ideální, protože by bylo vhodnější najít „ohromený stupéfait, éberlué; consterné“, ale je to lepší, než když jsou striktně oddělené slovníky česko-francouzský a francouzsko-český, kde bychom vůbec neměli možnost využít své francouzsko-české jednotky alespoň zčásti i pro hledání česko-francouzské. Závěr: oboustranné slovníky jsou striktně lexikograficky vzato méně šikovné než jednostranné (a vlastně „chybné“), ale pokud si doplňujeme uživatelský slovník, je škoda jednotek nevyužít v obou směrech, byť nikdy nejsou v obou směrech stejně plnohodnotné. Zoufat si nad tím, že „se to tak dělat nemá“, je plané. Jedna věc je ideál, druhá věc jsou reálné časové možnosti.

[35] Příklad: pokud napíšete do levého sloupce „snow“ a do pravého „sníh, sněžit, zbělet, balamutit“ a někdy později (po importu databáze, jejíž je tato položka součástí, do uživatelského slovníku) budete hledat slovo „balamutit“, tak lepší elektronický slovník najde i balamutit, třebaže je na samotném konci hesla, ale nemusí to být případ všech elektronických slovníků. (Slovník Millennium toto hledání podporují, tj. najdou slovo „balamutit“ i tehdy, když je uprostřed nebo na konci hesla.)

[36] To v případě nastavení „vždy nahoře“, které je pro někoho výhodnější než „při opuštění minimalizovat“, to záleží na tom, čemu každý uživatel uvykne.

[37] Viz např. Ella Sekaninová, Dvojjazyčná lexikografia v teórii a praxi, Veda (Vydavateľstvo Slovenskej akadémie vied), Bratislava 1993, s. 134.

[38] Pozn.: u speciálních znaků není důležité, zda vypadají správně v daném souboru, nýbrž zda je program, do jehož databáze je importujete, správně interpretuje; proto také najdete mnohé podivné znaky v některých zde publikovaných souborech. Proto také zvlášť v případě francouzštiny doporučuji zasílání přímo souborů ve formátu Word nebo HTML, neboť mám sestavená makra, která mi velmi rychle převedou speciální znaky do podoby, která je vizuálně špatná, ale po převodu do slovníku je naopak interpretována správně (kdežto vizuálně správná je interpretována špatně).

[39] Tento způsob práce není pouhou teorií: já takto skutečně pracuji s latinou, srbštinou, bulharštinou, staroslověnštinou, španělštinou a dalšími jazyky a díky rychlosti hledání v elektronických slovnících se mi to časově vyplácí. Kromě toho je z této činnosti i nějaký zveřejnitelný výstup pro rozvoj a zkvalitnění elektronických slovníků.

[40] Např. model „zadej výraz, vyplivnu ti patnáct slovíček bez jakéhokoli komentáře a ty si vyber“, je neúčinný, zvlášť při překladu z mateřského jazyka do cizího, kde se nemůžeme dost dobře spolehnout na jazykový cit. To neznamená, že hesla konstruovaná jako česko-cizojazyčná a hesla konstruovaná jako cizojazyčno-česká nemohou být součástí téže databáze, ale není možné jen vrstvit kolem výrazu jazyka A věnec výrazů jazyka B bez minimálního kontextu a omezení významu; tak bohužel pracuje slovník Millennium – ale od toho jsou tu mj. zde publikované databáze, zatím zejm. ta francouzská, které se snaží zavést část osvědčených lexikografických zásad i do elektronických slovníků).

← Jazyky, slovníky: úvodní stránka