Počítačové slovníky
David Zbíral
Upozornění
Před užíváním databází je nutné se seznámit s kapitolou o licenci a autorských právech. Všechny informace a data z těchto stránek užíváte na vlastní nebezpečí.
Najdete zde v současné době tyto dvojjazyčné databáze určené k užívání v některém elektronickém slovníku (jedná se ve všech případech o databáze cizojazyčno-české, použitelné oběma směry): anglickou, bulharskou, francouzskou, latinskou, německou, okcitánskou, řeckou (klasická řečtina), srbskou, starofrancouzskou, staroslověnskou, španělskou. Databáze jsou řazeny abecedně. Jsou přizpůsobeny importu do slovníku Millennium, ale formát je vhodný i pro jiné programy (popřípadě uzpůsobitelný za použití hromadného nahrazování, např. ve Wordu). Verze vybraných databází určená pro Lingea Lexicon je ke stažení níže. Ty databáze, které tu ve verzi určené pro Lingea Lexicon publikovány nejsou, si lze do vhodného formátu upravit pomocí níže publikovaného makra.
Autorství: u těch databází, kde není uvedeno jinak, je jejich autorem David Zbíral.
Databáze ve formátu pro Lingea Lexicon: ke stažení zde. Zejména u okcitánské a řecké databáze doporučuji verzi ve formátování pro Lingea Lexicon nebo v HTML, popř. PEKI, protože jejich verze v základním formátu svou kvalitou velmi zaostaly a zastaraly. Totéž platí do značné míry i o databázi francouzské.
Před užíváním databází je nutné seznámit se s kapitolou o licenci a autorských právech.
V čem databáze používat? Pokud jste rozhodnuti pro databáze v základním formátu, tak pro AJ, NJ a FJ doporučuji Millennium, protože se zároveň hledá jak v databázích základních, tak v databázích z těchto stránek. Pro ostatní jazyky (staroslověnština apod.) Millennium není vhodné; pro ty doporučuji PEKI. Jak databáze do PEKI importovat, se dovíte v kapitole PEKI.
Seznam zkratek a značek užívaných v těchto databázích
Anglicko-český / česko-anglický slovník [Cca 760 jednotek.]
Bulharsko-český / česko-bulharský slovník [Cca 270 jednotek. O využití této databáze prostřednictvím např. slovníku anglicko-českého viz níže „Využití elektronického slovníku pro širší účely“.]
Francouzsko-český / česko-francouzský slovník [Cca 9340 jednotek. Dosti spolehlivá a rozsáhlá databáze.]
Latinsko-český / česko-latinský slovník [Cca 5270 jednotek. O využití této databáze prostřednictvím např. slovníku anglicko-českého viz níže kapitolu „Využití elektronického slovníku pro širší účely“. Zaměření této databáze: většina je běžný slovní fond pro nejširší použití. Ale myslím, že databázi velmi ocení i ti, kteří čtou ve středověké latině či z ní překládají, protože z ní je tu i ledacos, co se běžně ve slovníku nenajde, např. včetně různých geografických názvů spojených s Bosnou, Dalmácií, Itálií, jižní Francií atd. a jsou sem zahrnuty i mnohé prameny, s nimiž autoři slovníků středověké latiny běžně nepracují. Autoři: David Zbíral a Anna Žáková.]
Německo-český / česko-německý slovník [Cca 610 jednotek. Viz výše anotaci francouzského slovníku pro postup importu.]
Okcitánsko-český / česko-okcitánský slovník [Cca 215 jednotek. Slovník středověké okcitánštiny. Obsahuje různé tvary, které se v textech vyskytují, třeba i takové, které jsou ojedinělé a lze je považovat za chybné; jeho cílem je usnadnit porozumění textům, ne prezentovat normu okcitánského jazyka. Nebere v potaz nářeční rozrůzněnost okcitánštiny.]
Řecko-český / česko-řecký slovník (klasická řečtina) [Cca 150 jednotek. Více doporučuji verzi v HTML, protože ta je barevná a správně zobrazuje řecký font. Přizpůsoben patrně nejpoužívanějšímu fontu SPIonic. Pokud váš slovník umožňuje zobrazení různé části hesla v různém fontu (např. Millennium ano), stáhněte si font SPIonic, nainstalujte ho a zvolte, aby cizojazyčná část pole byla formátována fontem Grenet či SPIonic. Pokud to váš slovník neumožňuje, budete nuceni si zvyknout na přepis (přesněji řečeno na rozložení znaků v Grenet či SPIonic). Pravidla psaní přízvuků aj. najdete pod touto kapitolou.]
Srbsko-český / česko-srbský slovník [Cca 170 jednotek. Dříve se neodlišovala srbština od chorvatštiny a mluvilo se o srbochorvatštině; tento slovník je vlastně „srbochorvatský“. Postupně doplňovaný soubor. O využití této databáze prostřednictvím např. slovníku anglicko-českého viz níže „Využití elektronického slovníku pro širší účely“.]
Starofrancouzsko-český / česko-starofrancouzský slovník [Cca 240 jednotek. Stará francouzština (9.-13. stol.).]
Staroslověnsko-český / česko-staroslověnský slovník [Cca 1900 jednotek. O využití této databáze prostřednictvím např. slovníku anglicko-českého viz níže „Využití elektronického slovníku pro širší účely“. O pravidlech transkripce, které se musely přizpůsobit tomu, co zvládne Millennium (přesněji kódování ANSI), viz níže pod kapitolou „Jazyky a textové editory“. Nejde jen o jednotky staroslověnské ve striktním smyslu (9.-11. stol.), ač ty převažují, nýbrž i o pozdější církevněslovanské tvary.]
Španělsko-český / česko-španělský slovník [Cca 2010 jednotek. Autorem naprosté většiny jednotek této databáze je Zdeněk Mareček, malou část dodal David Zbíral.]
Databáze uzpůsobené pro Lingea Lexicon
Najdete zde tyto balíčky slovníků ve formátu, který je vhodný pro Lingea Lexicon:
Pokud nastanou problémy při stahování: pokud se zobrazí hlášení „Stránku nelze zobrazit“, zkuste: 1.) zmáčknout Obnovit (popř. F5); 2.) klepnout na odkaz pravým tlačítkem myši a zadat Uložit cíl jako. Pokud soubor nejde stáhnout ani tak, upozorněte mě prosím e-mailem.
Slovník anglicko-český, německo-český, francouzsko-český a obráceně. Při česko-francouzském hledání databáze docházelo k problémům, neboť jde o databázi automaticky převedenou z poměrně obsažné databáze opačného směru, takže jsou příliš dlouhé řádky určené na heslová slova. Byla mírně upravena a snad už bude fungovat ve většině případů dobře. Když se u některého hesla LL kousne, hledejte hesla, v jejichž heslovém slově se daný výraz vyskytuje, a vymažte toto heslo nebo je instinktivně upravte. Neustálé problémy působí slova de, na, v, ve, o, být (a možná některá další). Slovník czfr-uziv4.udr lze také po rozbalení balíčku zcela odstranit; tím se o něj připravíte – což je nepříjemné, neboť je nejrozsáhlejší – ale vyhnete se velké části problémů (spočívajících v havarijním ukončování LL). Spíš doporučuji na to myslet a nehledat uvedená kritická slova.
Pokud se vám zdá start francouzského slovníku při používání slovníků z těchto stránek příliš pomalý a nestojí vám to za to, tak buď volte místo verze pro LL verzi v HTML (i ta však má své nevýhody), neboněkteré soubory s předponou czfr- či frcz- z podadresáře data vymažte. Doporučuji v takovém případě smazat (nebo raději jen přesunout do jiného adresáře pro budoucí použití) buď soubor czfr-uziv4.udr, nebo soubor czfr-uziv3.udr. Oba mají svou cenu, ale dost zpomalují start. Alespoň jeden z nich doporučuji ponechat. Problém pomalého startu způsobeného rozsáhlými uživatelskými slovníky by měla vyřešit možnost převodu do binárního formátu, která snad bude zpřístupněna ve vyšší verzi LL.
Slovník bulharsko-český, srbochorvatsko-český, staroslověnsko-český a obráceně.
Slovník španělsko-český, okcitánsko-český, starofrancouzsko-český a obráceně.
Slovník řecko-český (klasická řečtina). LL 2002 ještě nemá zakomponováno přiřazení konkrétního fontu značkám, takže doporučuji raději než verzi pro LL volit verzi v HTML. Pokud zvolíte přece jen HTML, tak je zatím třeba si zvyknout na rozložení kláves v SPIonic a umět si dekódovat např. slovíčko „w(j“ jako hós. Zobrazování kódu není bez chyb; snad ve vyšší verzi bude v pořádku a také bude zpřístupněna možnost přiřazení fontu. Doporučení: napište si řecké slovo ve wordovském dokumentu v SPIonic (např. v tabulce určené k vypisování slovíček) a do vyhledávacího okénka LL ho přeneste přes schránku. Znovu ale upozorňuji na možnost stáhnout si zcela totožný řecko-český slovník v HTML.
Latinsko-český slovník ve formátu pro Lingea Lexicon je připravován jako komerční produkt a není zde k dispozici ani se neposkytuje e-mailem.
Před užíváním těchto databází je nutné se seznámit s kapitolou o licenci a autorských právech.
Autorství: viz výše pod databázemi v základním tvaru nebo v samotném kódu slovníků poté, co si je stáhnete (dají se otevřít třeba v Poznámkovém bloku).
Nezapomeňte si uložit také seznam zkratek a značek užívaných v databázích.
K provozování těchto slovníků, stejně jako jakýchkoli slovníků vlastních, nemusíte být vlastníky plné licence; stačí si stáhnout bezplatnou demoverzi. Základní stránka pro registraci (jméno, e-mail) je http://www.lingea.cz/cz/demo_prev.htm.
Počty jednotek viz výše. I v Lingea Lexiconu vždy poznáte, co je součástí základní databáze a co naopak patří do uživatelského slovníku. Uživatelský slovník lze kdykoli editovat, vymazávat, doplňovat atd. Prostě příslušný slovník otevřete v Poznámkovém bloku a proveďte změny, které uznáte za vhodné.
Postup krok za krokem (pokud chcete používat jen jeden balíček, sledujte postup jen jednou, pokud chcete používat více z nich, proveďte ho pro každý balíček zvlášť):[1]
- Pokud jste tak ještě neučinili, nainstalujte si Lingea Lexicon (pokud jste jeho vlastníky), popřípadě jeho bezplatnou demoverzi, kterou si lze stáhnout z http://www.lingea.cz/demo/d4encz1.exe. Základní stránka pro registraci (jméno, e-mail) je http://www.lingea.cz/cz/demo_prev.htm.
- Pokud jste nainstalovali demoverzi a nechcete si zkoušet anglickou databázi LL (jež je součástí instalačního balíčku demoverze) nebo jste si ji už dostatečně zkusili, odstraňte všechny soubory začínající na řetězec lg z podadresáře data (aby vám nepřekážely anglicko-české ukázky např. u slovníku staroslověnsko-českého). Pozor, tento pokyn neplatí pro uživatele plné verze; z plné verze žádné soubory nemažte!
- Stáhněte si z balíčků ty, které chcete používat (angličtina, francouzština, němčina, bulharština, srbochorvatština, staroslověnština, španělština, okcitánština, stará francouzština, klasická řečtina) ty, které chcete používat. Jde o samorozbalovací archivy. Pokud nastanou problémy při stahování a zobrazí se hlášení „Stránku nelze zobrazit“, zkuste: 1.) zmáčknout Obnovit (popř. F5); 2.) klepnout na odkaz pravým tlačítkem myši a zadat Uložit cíl jako. Pokud soubor nepůjde stáhnout ani takto, upozorněte mě prosím e-mailem.
- Spusťte balíček a rozpakujte ho tím do samostatného pracovního adresáře. V následujících krocích se postup rozděluje pro různé skupiny uživatelů.
- Pokud si dosud uživatelské slovníky nevedete a nevíte o tom, že byste někdy v minulosti pracovali s definičním souborem user.udf, tak se proklikejte k adresáři data, který je podadresářem toho adresáře, kde máte nainstalovaný slovník Lingea Lexicon či jeho demoverzi (dále jen „podadresář data“). Pokud podadresář data obsahuje soubor user.udf, tak jej odsud přesuňte jinam (někam, kde si ho chcete zálohovat). Potom si rozpakované soubory stažené v příslušném balíčku z těchto stránek (včetně mé verze souboru user.udf) prostě překopírujte do podadresáře data. Znovu spusťte LL a zkuste, zda se v uživatelských slovnících hledá. Mělo by být hotovo. Pokud je s některým heslem problém a LL se kouše, když ho najde, tak otevřete soubor s příslušným slovníkem a heslo intuitivně upravte, popřípadě zcela vymažte.
- Pokud si již uživatelské slovníky daného jazyka vedete, nechcete se učit nic nového a zpracovávat si hesla komplexně, nevadí vám, že nebudete vidět některé důležité vysvětlující a kontextové poznámky, valenci sloves atd. ve slovnících z těchto stránek a chcete tyto jednotky prostě jen připojit ke svému uživatelskému slovníku, tak jednotlivé soubory z balíčku (kromě user.udf; ten ignorujte) otevřete v Poznámkovém bloku a jejich obsah pomocí Kopírovat a Vložit překopírujte do příslušných uživatelských slovníků (které si otevřete rovněž v Poznámkovém bloku). Pozn.: tento postup nedoporučuji.
- Pokud si již uživatelské slovníky vedete, a to slovníky ve složce uživatelských souborů (typicky Dokumenty/Lexicon), které nazývám uživatelskými slovníky typu 1, ale chcete vidět všechny informace v databázích z těchto stránek a chcete mít hesla přehlednější (barevností a formátováním) a následně též moci přehlednější hesla sami tvořit, tak se vám otvírá možnost přejít na to, co bych nazval uživatelskými slovníky typu 2.[2] v takovém případě si bezpečně zazálohujte stávající user.udf z adresáře data (pokud tam nějaký máte) a také stávající uživatelské slovníky. Potom přeneste obsah svých stávajících slovníků přes Kopírovat a Vložit (v Poznámkovém bloku) do slovníků stažených v balíčku z těchto stránek, a od té chvíle postupujte stejně jako ti, kdo si v době stažení balíčku ještě žádné uživatelské slovníky nevedli, tedy: proklikejte se k podadresáři data, a pokud jste tak ještě neučinili, tak si z něj stávající soubor user.udf, je-li tam jaký, přesuňte jinam (někam, kde si ho chcete zálohovat). Potom si rozpakované soubory stažené v balíčku z těchto stránek a doplněné o vaše vlastní jednotky (včetně mé verze souboru user.udf) prostě překopírujte z pracovního adresáře do podadresáře data. Znovu spusťte LL a zkuste, zda se v uživatelských slovnících hledá. Mělo by být hotovo. Pokud je s některým heslem problém a LL se kouše, otevřete soubor s příslušným slovníkem a heslo intuitivně upravte či vymažte. Informace o komplexním lexikografickém zpracovávání hesel najdete v několika podkapitolách oddílu věnovaného speciálně Lingea Lexiconu. Poznámka: pokud nechcete své a odsud stažené slovníky mísit, tak si je můžete vést v samostatných slovnících, jen musíte pochopit kapitolu věnovanou definičnímu souboru, přesněji tu její část, která se věnuje sekci Title, abyste v ní uměli nové, mnou nepředpokládané slovníky deklarovat. Postup je v oné kapitole vyložen.
Vysvětlení čísel slovníků: v některých databázích jsou jen slovníky určitého čísla, např. Řecko-český slovník (1), Řecko-český slovník 3 apod. Liší se v tom, že slovník s implicitním indexem 1 obsahuje jednotky ručně dodělané a přehlédnuté, index 3 jednotky převedené automaticky sofistikovaným makrem ze slovníku opačného směru a projité jen v rychlosti či vůbec (u slovníku 3 bývá lepší formátování, ale někdy věcné chyby, např. přiřetězení určité fráze k ekvivalentu, k němuž nepatří) a konečně slovník 4 jednotky automaticky převedené méně sofistikovaným způsobem, kde nejsou chyby zřetězení, ale kde je o dost horší formátování; také slovníky 4 jsou projité jen v rychlosti či vůbec. Někde existuje jen slovník 3 a slovník 1 ještě vůbec nevznikl atd. Slovníky s indexem 2 jsou určeny pro budoucí binární verze.
Databáze obsažené v balíčcích ve většině rozhodně nejsou vzorem, jak by měly vypadat databáze pro LL, protože jde prostě o automaticky převedené a místy ručně upravené databáze, které byly původně přizpůsobeny slovníku Millennium. Zvlášť část česko-cizojazyčná není dobrá a ledacos se v ní nenajde, protože není správně členěná na hesla. Doporučuji užívat souběžně s Millenniem či jiným slovníkem, rozšířeným o databáze z těchto stránek.
Pokud pomineme malé množství příkladů a frází a skutečnost, že se řečtina zatím nezobrazuje v příslušném fontu, lze za formálně dost propracovanou považovat zejména databázi řecko-českou.
Pokud najdete v databázích nějakou chybu, dejte mi prosím vědět.
Ke zobrazení slovníků v HTML vám stačí prohlížeč. Jsou k dispozici ve dvou podobách: (1) jako celé slovníkové tituly na jediné stránce a (2) jako malé soubory, které tvoří jednotlivá hesla a které si otvíráte ze správce souborů (Průzkumník apod.). Pro řečtinu vřele doporučuji, protože LL 2002 neumí zobrazovat řecké fonty, kdežto v těchto databázích je správně (pokud si font stáhnete). Samotné databáze, potřebné informace i údaje o výhodách a nevýhodách slovníků v HTML najdete na stránce Slovníky v podobě běžných stránek HTML.
- Významně rozšíří a zkvalitní váš elektronický slovník, popřípadě vám umožní si vytvořit zcela nový (latinsko-český apod.). Jednotky jsou poměrně kvalitní. Slovník se vám doplní o značné množství slov a frází, vyhledaných v různých elektronických i knižních slovnících či excerpovaných z cizojazyčných knih, článků apod.
- Postup importu je jednoduchý a na této stránce je podrobně popsán.
- Ve slovníku Millennium i Lingea Lexicon vždy podle ikony poznáte, co je součástí základní databáze a co patří do uživatelského slovníku, takže nemusíte mít strach, že těmito databázemi zanesete do slovníku zmatek.
- Celý uživatelský slovník i každou jednotlivou jednotku lze kdykoli opravit či vymazat.
Podrobněji viz pod anotacemi jednotlivých slovníků.
Následuje zkrácená a zjednodušená verze zaměřená na import těchto databází, ne na import vašich vlastních zdrojů.
Počkejte, až se vám stránka se slovíčky načte do konce. Pak pomocí Soubor / Uložit jako uložte na svůj disk či na disketu,[3] vstupte do uživatelského slovníku svého elektronického slovníku (Millennium: Soubor / Uživatelský slovník), zadejte import a zvolte tento soubor (který jste si předtím uložili). Pak stačí, pakliže jste tak ještě neučinili, vašemu elektronickému slovníku zadat, aby vyhledával i v uživatelském slovníku (tj. nejen v základní databázi), a slovník se vám tak dosti rozroste.
Správnost všech údajů zde nabízené databáze nelze samozřejmě zaručit, ale pokud na nějaký chybný narazíte, lze jej bez problémů z uživatelského slovníku odstranit nebo jej opravit a v Millenniu vždy poznáte podle ikonky vedle slova, zda je součástí základní databáze či uživatelského slovníku. Viz též níže mechanismus kontroly doplňujících databází.
- Databáze nejsou dělané na obyčejné hledání přes funkci „hledat“ v textových editorech. Pracovat s nimi takto by bylo zbytečným nevyužitím grafických a vyhledávacích možností slovníkových programů. Jestliže se na pohled zdají málo přehledné, je to proto, že nejsou určeny k tomu, aby se s nimi pracovalo v této podobě, nýbrž k importu do počítačových slovníků. Import je jednoduchý a na této stránce je podrobně popsán.
- Millennium: pro ten jsou základní databáze to speciálně dělané, tj. tam by neměl být žádný problém. Jak importovat: viz podrobný popis pracovního postupu níže.
- Lingea Lexicon: tyto databáze lze využít i v Lingea Lexikon, ale nelze je importovat přímo v programu; je nutné 1.) je upravit do vhodného formátu (to jsem udělal za vás, viz výše), 2.) je vložit do textového souboru, který představuje uživatelský slovník. Více o tomto tématu pod kapitolou Lingea Lexicon, podkapitolu o importu a uživatelském slovníku. Mé databáze se speciálně upraveným formátem vhodným pro Lingeu: výše ve speciální kapitole.
- Pokluda: viz pod kapitolou Pokluda.
Zpřístupněte si ty ze zde publikovaných databází, které vás zajímají, offline (v MS Internet Exploreru pod nabídkou Oblíbené) a čas od času zadejte v prohlížeči Nástroje / Synchronizovat.
Jiná možnost: poznamenat si počet jednotek dané databáze v době, kdy tu stahujete, a osobně čas od času zkontrolovat na této stránce počty jednotek.
Další možnost: sledovat kapitolu Přírůstky a revize.
Obecně tyto osobní kontroly doporučuji víc než zpřístupnění offline.
Pokud máte v uživatelském slovníku jen materiál z těchto stránek, tak jej po stažení aktualizované verze celý vymažte a pak znovu importujte tuto aktualizovanou databázi (nestačí prostě importovat ji navíc k tomu, co už v předchozí je, to by se začaly mnohé informace příliš duplikovat, vedle sebe by koexistovala stará chybná i nová opravená verze dané jednotky atd.). Důvod je ten, že tyto databáze se i průběžně opravují, zpřesňují a rozšiřují v rámci jednotlivých hesel, tj. nejen doplňují novými jednotkami. Importovat novou bez vymazání staré je sice možné, ale znamená to, že vám ve slovníku vedle opravené verze zůstane také chybná verze dané jednotky.
Pokud ve svém uživatelském slovníku máte i materiály nepocházející z těchto stránek, např. slovíčka, která jste si sami vypsali, tak je dobré postupovat jinak: je sice také dobré si pravidelně zálohovat celý svůj uživatelský slovník, ale kromě toho si také už od počátku zálohovat zvlášť tyto vaše materiály; po vymazání uživatelského slovníku a po importu aktualizované verze importujete i tyto své materiály a uživatelský slovník tak bude znova kompletní. Praktický příklad: vypisujete si slovíčka do tabulky ve wordovském souboru a importujete si je do svého uživatelského slovníku a kromě toho si čas od času stahujete aktualizace databáze z těchto stránek. Proto je vhodné mít tyto soubory: 1.) přehledné wordovské apod. soubory, kam si slovíčka vypisujeme (psané do tabulky, pro nás obtížné věci zdůrazníme tučně či kurzívou atd., což se nijak ve výsledné databázi, která je „pouze text“, neprojeví): tyto soubory si tiskneme pro studijní účely; 2.) soubor se souhrnem všech vlastních slovíček, které nepocházejí z těchto stránek; 3.) souhrnný soubor obsahující celý exportovaný uživatelský slovník (abyste měli zálohu). Ale najděte si sami systém, který vám vyhovuje. Jen dejte pozor na to, že aktualizace těchto databází neznamená pouze doplnění novými jednotkami, ale i opravení překlepů, chyb a nepřesností (často opravení dosti významné), a proto je při každém importu nové verze slovníků z těchto stránek třeba tu starou smazat.[4]
- Anglicko-česká databáze: 120 jednotek 25. 7. 2003, 60 jednotek 13. 10. 2003, 60 jednotek 4. 12. 2003, 70 jednotek 2. 2. 2004.
- Francouzsko-česká databáze: 800 jednotek 24. 2. 2003; 1130 jednotek 5. 5. 2003, revize asi 40 % 25. 7. 2003, 540 jednotek 25. 7. 2003, kompletní přehlédnutí, doplnění chybějících kategorií (u adjektiv tvar feminina apod.), výrazné přeskupení a vylepšení mnoha hesel, opravení asi 200 chyb, rozsáhlé napravení zvláštních znaků v databázi pro Lingea Lexicon a přidání 720 jednotek[5]27. 11. 2003, průběžné úpravy verze pro LL jaro 2004, nové přírůstky v databázi pro LL 21. 4. 2004, cca 40 jednotek LL 12. 5. 2004, 120 jednotek 19. 5. 2004, 50 jednotek 2. 8. 2004. Poté byl vývoj této nevyhovující databáze v podstatě ukončen a rozvíjí se jen databáze na bázi značkovacích jazyků.
- Francouzsko-česká databáze pro Lingea Lexicon: zahrnuje jednak celou starou databázi, jednak bohatě formátovaný slovník 1.
- Česko-francouzská databáze pro Lingea Lexicon: zahrnuje jednak celou starou databázi, jednak bohatě formátovaný slovník 1.
- Latinsko-česká databáze: 200 jednotek 7. 4. 2003; 200 jednotek 28. 4. 2003, 560 jednotek 19. 5. 2002, 200 jednotek 23. 5. 2003, 270 jednotek 13. 10. 2003, 263 jednotek 27. 10. 2003, 54 jednotek 4. 11. 2003, 170 jednotek 27. 11. 2003. Velmi důležitá aktualizace 19. 1. 2004. 520 jednotek 2. 2. 2004.
- Okcitánsko-česká databáze: 140 jednotek 13. 10. 2003, 75 jednotek 8. 1. 2004. Poté byl vývoj této zcela nevyhovující databáze ukončen a rozvíjí se jen databáze na bázi značkovacích jazyků.
- Okcitánsko-česká databáze pro Lingea Lexicon: 2. 8. 2004 důležitá aktualizace, publikován slovník 1 obsahující komplexněji zpracované jednotky, obvykle včetně citací z textů, etymologie atd.
- Řecko-česká databáze (klasická řečtina): 60 jednotek 26. 1. 2004, 90 jednotek 1. 2. 2004, 40 jednotek 26. 5. 2004. Poté byl vývoj zcela nevyhovující databáze v základním formátu ukončen a vyvíjí se dále jen databáze na bázi značkovacích jazyků.
- Řecko-česká databáze pro Lingea Lexicon (klasická řečtina): počty hesel nejpropracovanějšího, základního slovníku (neevidují se tu přírůstky, nýbrž skutečně počet hesel): 30 hesel 1. 2. 2004, 40 hesel 26. 5. 2004, 53 hesel 21. 6. 2004, 69 hesel 2. 8. 2004, 141 hesel 21. 3. 2005, 213 hesel 5. 4. 2005.
- Srbsko-česká databáze: 100 jednotek 25. 7. 2003.
- Starofrancouzsko-česká databáze: 200 jednotek srpen 2003, 40 jednotek 17. 12. 2003.
- Staroslověnsko-česká databáze: 1900 jednotek březen 2003.
- Španělsko-česká databáze: 50 jednotek 24. 2. 2003; 1850 jednotek 12. 5. 2003, 110 jednotek 25. 7. 2003. Oprava několika desítek chyb a nedostatků 26. 1. 2004.
Evidováno od února 2003. Na některé přírůstky jsem možná zapomněl. Údaje jsou přibližné. Informace o podílu revidovaných jednotek (40 % apod.) neznamená, že byly všechny znovu dohledávány, nýbrž že byly pročteny a prověření se dočkalo to, co bylo podezřelé.
Vzhledem k vyhledávacím chybám Millennia jsem někdy dal přednost neodstraňování přibližných duplicit. Je lepší, když to Millennium najde dvakrát, než vůbec. To může samozřejmě zkreslovat počet jednotek, ale jen mírně, ostatně podle počítání Millennia velká část zde publikovaných hesel obsahuje i o dost víc než jednu jednotku.
Kontrola: je samozřejmé, že v těchto doplňkových databázích se najdou mnohé chyby. Pokud s databázemi pracujete, tak si prosím střádejte do samostatného souboru všechny chyby, na které narazíte, a vždy když jich pár nastřádáte, tak mi soubor (nebo ještě lépe jen text z něj, zkopírovaný přes schránku do těla e-mailu) zašlete. Přispíváte tak zkvalitnění těchto databází, jejichž mechanismus kontroly je, zejména vzhledem k velmi omezeným časovým možnostem a absenci jakéhokoli finančního zabezpečení projektu, jen nedostatečný (konkrétněji: viz níže Mechanismus kontroly).
Obecné zásady lze najít níže v tomto dokumentu. Zde jsou vypsány zásady, kterých se snaží držet zde publikované databáze jednotlivých jazyků.
Francouzské znaky v databázi ke stažení na těchto stránkách jsou vizuálně špatné, byly totiž přizpůsobeny slovníku Millennium: ty, co se zdají špatné, by měly po importu vypadat naopak správně (kdežto kdyby zde vypadaly správně, tak se nesprávně konvertují). Importu do jiných slovníků, než je Millennium, to nemusí vyhovovat, ale lze to poměrně snadno v pokročilých textových editorech globálně zaměnit. Pokud pracujete s jinými slovníky a máte s mou databází nějaký problém, zkuste ho vyřešit právě zaměněním či překódováním.
- Znaky ae, oe píši rozděleně.
- Infinitiv, nebo první osoba? Zavedená zvyklost v hesle je psát na prvním místě první osobu, ne infinitiv; to doporučuji dodržovat. Ale jiná věc je uvádění sublemmat a ustálených spojení: Pražák tam dává infinitiv, např. paenitentiam agere (nikoli ago) a stejně tak LMALB (např. sv. 3, s. 141). Takže tam je třeba dávat infinitiv.
- Znaky byly přizpůsobeny fontu SPIonic a Grenet (dostupné na internetu, je potřeba si některý z nich, nejlépe Grenet, pro provozování databází stáhnout, pokud ho ještě nemáte).
- S řečtinou může nastat problém v tom, že existují různé klávesy pro prakticky tytéž znaky (např. pro na horizontální ose různě umístěný těžký přízvuk jednak znak zpětného lomítka, jednak znak podtržítka). Neshoda vyhledávacího řetězce s heslem vede k nenalezení hesla, takže to může být zásadní potíž. Proto je třeba tu vyložit pravidla zápisu. Jsou přizpůsobeny autoritativní elektronické verzi slovníku Liddell – Scott – Jones na serveru Perseus (http://www.perseus.tufts.edu/cgi-bin/lexindex?display=SPIonic&lang=greek). Doporučuji se těchto pravidel držet: je to zcela zásadní pro funkčnost slovníku. Pravidla: 1.) těžký přízvuk je užíván jen jeden, ten pod zpětným lomítkem (i tam, kde by třeba graficky lépe vypadal ten podtržítkový); 2.) ostrému přízvuku odpovídá obyčejné lomítko (znaky pro jinak umístěný ostrý přízvuk se nepoužívají); 3.) přídechům odpovídají kulaté závorky (opět i tam, kde by lépe vypadal ten jinak posunutý, který je v SPIonic pod klávesou devítky a nuly); 4.) kombinace přídechu a přízvuku se nedělá speciálními klávesami (1, 2, 3 atd.), nýbrž jako dva znaky (např. ostrý přídech a ostrý přízvuk se napíše „(/“), ve shodě s Liddell – Scott – Jones na Perseovi; 4.) průtažný přízvuk je pod rovnítkem; 5.) kombinace průtažného přízvuku s přídechy se dělá dvěma znaky (závorka a rovnítko); 6.) znak elize je rovná jednoduchá uvozovka nahoře ', tj. znak ChrW(39), nikoli apostrof ’ (v Poznámkovém bloku je potřeba na to dát pozor, rozlišuje tyto znaky); 7.) iota subscriptum je svislá čárka | za příslušným písmenem (AltGr + W, popř. speciální klávesa; dávám až za přízvuk, podle vzoru GEL);[6] 8.) přídech u dvojhlásek se píše až za druhou hlásku; 9.) koncové sigma se napíše pod j, nikoli pod s či v; 10.) v kombinaci ioty subscriptum s přízvukem se píše nejdřív přízvuk a pak iota subscriptum, 11.) v kombinaci přízvuku a rozlučníku (trématu) se píše nejdřív přízvuk, 12.) přízvuk a přídech u velkých písmen se píše vždy dopředu, po vzoru elektronické verze GEL, ačkoli to po zobrazení nevypadá příliš dobře (ovšem o nic hůř než psaní dozadu: to u většiny písem pak beztak splývá s písmenem). Všechny tyto zásady jsou ve shodě s GEL na serveru Perseus.
- Normativní materiály pro zápis řečtiny – systém Beta Code: http://www.tlg.uci.edu/~tlg/BetaCode.html (odkazuji spíš pro zajímavost; pro užívání databází ani tvoření vlastních to nepotřebujete, jde jen o jeden z mnoha systémů; spíše doporučuji níže uvedené zásady).
- Poznámka o převoditelnosti databází: při systematickém dodržování těchto zásad nic nebrání případnému pozdějšímu hromadnému přechodu na zásady jiné (zejména pomocí hromadného nahrazování v textových editorech). Například slovníky v HTML na těchto stránkách jsou vytvářeny před každou aktualizací z databází v mé verzi formátování pro Lingea Lexicon.
- Postavení přídechu u velkých písmen: před písmenem, tj. např. )Iwa/nnhj. Je pak sice moc vlevo, ale v případě uvedení až za písmenem zase s tímto písmenem splývá.
- Valence: uvádí se v Lepařovi i v Greek-English Lexicon ve formě neurčitých zájmen, nikoli zájmen tázacích. Tak je to dělané i v mých databázích.
- V sublemmatech a frázích dávám infinitiv, ne první osobu. Tak činí Greek-English Lexicon.
- Logické nebo: obvykle užíváno lomítko, ale v řeckých fontech bývá rezervováno pro ostrý přízvuk, takže se v řeckých databázích z těchto stránek užívá v řecké části hesel pro označení logického „nebo“, zejm. u valence, čárka.
- Udávám členy, nikoli rody (ve shodě s Greek-English Lexicon a Lepařem). Pro span.gr byl proto v definičním souboru slovníků v HTML určen řecký font.
- Zajímavá možnost je užívání speciálního fontu. Z internetu si lze font pro zápis cyrilice stáhnout, odkazy najdete v rozcestníku. Podpora speciálních fontů pro jednotlivé části hesel v běžně užívaných slovnících zatím není dobrá. Millennium umí nastavit určitý font jednomu jazyku a jiný druhému (v Nastavení, karta Vzhled okna, skupinový rámeček Písma), což už je pro jednoduchou staroslověnskou databázi dobré, nicméně pro komplexněji zpracovaná hesla to naprosto nestačí, jako ostatně celé Millennium. Řešením je mít slovníky v XML nebo HTML, ale to málokdo umí, či je mít v mé verzi lingeovského formátování a za použití jednoho z mých maker slovník vždy v určité fázi práce převést a užívat verzi v HTML (ale aktualizace a opravy dál zanášet do lingeovské databáze). V úplnosti to zvládne slovník PEKI, ale musíte mít předlohy v HTML a umět základy CSS. Nebo je možné si zvyknout na transkripci, byť nemusí být třeba zcela estetická a musí se přizpůsobit tomu, co slovníky zvládnou, tj. nelze užívat všechny znaky, které se obvykle k přepisu užívají. Zvažte to sami. Každopádně platí, že dostatečně distinktivní znaky (ty, které se v dokumentu nevyskytují jinde než tam, kde zastupují právě jeden jiný znak) lze v budoucnu kdykoli snadno nahradit z transkripce na font. Takže pokud se chcete vážně zabývat pokročilou lexikografickou prací s nějakým jazykem užívajícím nelatinskou abecedu, rozhodněte se sami nebo se na mě obraťte a můžeme to prodiskutovat e-mailem.
- Doporučení, který font zvolit: volte Cyrillic Old Face, který je ke stažení na těchto stránkách. Pokud z nějakého důvodu nechcete nebo vám nevyhovuje, užívejte Cyrillica Bulgarian. Je potřeba si vybrat na začátku; přepisování dá spoustu práce.
- Font Cyrillic Old Face: ten jsem dělal já a je ke stažení odtud, kde také najdete potřebné informace. Je zhotoven na základě Kirillica Wincyr, ale oproti němu přináší jisté výhody.
- Výhody:
- Fungují v něm mezery a je prohledatelný, není to totiž typ symbolový (jako Kirillica Wincyr), nýbrž MS UNICODE.
- Dobře přizpůsoben české klávesnici a znaky jsou níže kompletně vysvětleny.
- Má závorky (na řešení zkratek).
- Kde jsou které znaky: viz Cyrillica Old Face. Pokud je u některého znaku uvedeno více možnosti, první uvedená je vždy doporučená, další jsou zpracovány pro jiné klávesnice či aby měli uživatelé přecházející z jiných fontů větší komfort. Speciální e je pod =, ę pod ę (Ctrl+Alt+6, pak e) a 1, č pod č a ч, ć je pod a 6, rovné čárkové i je pod j, zahnuté čárkové i je pod #, ï je pod î (velké pod Î), jať pod ě, ý a 7, velký jať pod Ý, ja pod á a 8 (velké pod Á), je pod í a 9 (velké pod Í), ju pod é a 0 (velké pod É), ję pod ë a 3 (velké pod Ë), jô pod ö a 4 (velké pod Ö), ô pod ą (Ctrl+Alt+6, pak a) a 2, otъ pod { (velké pod }), psí pod ş, š pod š a ш, št pod q (velké pod Q), t superscriptum pod *, th je pod %, jednoznakové u pod $ (velké pod @), z různé typy jsou pod z a ç, dzéta různé typy pod ź (jako naše přeškrtnuté z) a ţ (jako naše s), xí pod ř a 5, malé ž pod ž a ж, velké Ž pod Ž a Ж, tvrdý jer pod ú a ъ, měkký jer pod ü a ь (velký pod Ü), řecké y pod ß, omega pod w.
- Speciální znaky: oblouček je cirkumflex (Ctrl+Alt+3, pak mezera), čára nad slovem (značící zkratku) je podtržítko.
- Font Cyrillica Bulgarian: dostupný zde. Zásadní výhoda oproti Kirillica Wyncyr je, že má správně mezery. Obsahuje všechny potřebné znaky. Nevýhodou je však, že znaky nejsou dobře dostupné z české klávesnice; doporučuji pod Panely nástrojů / Místní a jazykové nastavení nainstalovat klávesnici srbskou, v úplnosti ale znaky nejsou, pokud se nemýlím, ani pod srbskou, takže se neobejdete bez pomocných postupů jako Vložit / Symbol (ve Wordu), případně definování klávesových zkratek či kopírování z pomocného dokumentu; pokud víte o klávesnici, na které jsou všechny, ozvěte se.
- Další nevýhodou je, že nemá závorky (pro řešení zkratek do závorek).
- Kde jsou které znaky (výběr): malé ž je pod ж, velké Ž pod Ж, č pod ч (to je typ s dříkem uprostřed; typ s dříkem napravo je ]), jať pod ý, tvrdý jer je ъ, měkký jer je ь, ę je pod Chr(173), ô je pod (c), tj. Chr(169), ja pod ÿ (nebo y), je pod p, ju pod ţ, ję pod Ş (či a), jô pod Chr(171), omega pro otъ je pod §, y pod û, rovné čárkové i pod znakem Chr(182) a nikde jinde (soudě podle mapy znaků), čárkové i s dolním obloučkem pod µ, jednoznakové u pod ą (a také pod 1 a minimálně jedním dalším), št je pod ù/ů, th je pod ‹ (a možná i jinde).
- Font Kirillica Wincyr: je ke stažení zdarma, ale nedoporučuji ho, volte raději Cyrillic Old Face. Pokud vím, obsahuje všechny nezbytné znaky (narozdíl od některých jiných fontů). Některé znaky obsahuje dvakrát; je nutno užívat jen ten správný.
- Kde jsou které znaky (výběr): malé ž je pod ć, velké Ž pod Ć (napište čárku nad písmenem a C, napíše se Ć), jať pod ý, tvrdý jer pod ú, měkký jer pod ü, ja pod ź (nebo ÿ), ju pod ţ, rovné čárkové i pod j, čárkové i s dolním obloučkem pod # (a nikde jinde, soudě podle mapy znaků), th pod 9, đ pod 5, jednoznakové u pod %. Věnujte pozornost také číslicím, neboť právě ony zastupují důležité znaky (ę je pod 0, ô je pod 1, ję pod 2, jô pod 3, je pod 4); omega pro otъ je pod AltGr+B.
- Problémy: jako mezeru nepoužívá správný znak, takže např. zmáčknutím Shift+Ctrl+šipka vlevo se označí celý odstavec, ne jen jedno slovo, a také čárky jsou často ne na konci řádku, nýbrž na začátku řádku nového, a chybně se rozdělují slova mezi řádky (zalomení řádků se vkládá kamkoli, ne tam, kde jsou mezery). Text není ve Wordu správně prohledatelný, tj. ani nelze např. při přechodu na jiný font urychlit nahrazování (leda pokud nejdříve převedete na jiné písmo, např. Times New Roman).
- Old Cyrillic: též zdarma. Má velmi nevhodně uspořádané znaky a zřejmě je ani nemá všechny. Nelze doporučit.
- Vypisování do wordovského souboru kontra pro Millennium: můžeme vypisovat úhledněji, než jak je to Millennium schopno importovat, např. psát normálně jery, ale pak vždy před importem provést v kopii svého souboru se slovíčky hromadnou záměnu (prostřednictvím makra nebo ručně pod Úpravy/Nahradit).
- Jery: ь a ъ nelze uložit v běžném kódování. V Unicode ano, a ten lze při „ukládání jako“ z Poznámkového bloku zvolit. Ale Millennium z toho udělá stejně otazníky, vyzkoušeno. Nejlepší by to bylo řešit nestandardní transkripcí pomocí znaků, které se v daném jazyce nevyskytují, ale které Millennium, respektive kódování ANSI, rozpozná. Z bulharštiny se znak ъ standardně přepisuje jako a s obloučkem (ă, napíšete pomocí Shift+Ctrl+č, pak kombinaci pustíte a napíšete a). Millennium ă (resp. kódování ANSI) zvládá, proto doporučuji se ho rozhodně držet i např. v přepisu staroslověnštiny pro Millennium.
- Znak ь je v mé databázi psán jako î (i se stříškou, napíše se Ctrl+Alt+š, pak pustit a napsat i), které je v transkripci staroslověnštiny neobsazené. Je to nešikovné, to je mi jasné, ale co se dá dělat. Dá se na to zvyknout. Pokud máte lepší nápad, svěřte se s ním. Samozřejmě že si tento znak můžete ve Wordu v mé databázi hromadně zaměnit za nějaký, který vám vyhovuje víc.
- Znak ъ přepisuji ă. To je myslím nejlepší způsob, zavedený v transkripci bulharštiny.
- ę: lze bez problémů používat, ověřeno.[7] Tento zobáček pod písmenem se napíše Ctrl+Alt+ž a následně příslušné písmeno, ale ne u všech to jen tak kde; největší problém je o s obloučkem doprava. Pokud někdo víte, jak to napsat, ozvěte se na david.zbiral@post.cz.
- O s rovnou čárkou nahoře (pro délku): doporučuji neznačit – dávat normální o.
- Znak o s ocáskem směřujícím vpravo ANSI nezvládá, a pokud vím, tak ho nezvládají ani běžné fonty, dokonce ani ty založené na UNICODE. Dříve jsem užíval kombinaci „o,“ – to je však pro nedostatečnou distinktivitu v rámci zdrojového kódu nešikovné. Doporučuji spíš ô (Shift+Ctrl+š, pak pustit a napsat o).
- Nahrazování některého znaku otazníkem: nelze doporučit, protože otazník jednak není dostatečně distinktivní znak, jednak se nedá vepsat v Millenniu do vyhledávacího řetězce a i když se hledá pomocí vložení do schránky, tak všechny otazníky v řetězci vyřadí.
- Následují některé poznatky.
- Španělské ñ nelze importovat do Millennia a do některých dalších slovníků. Doporučuji je sice v souborech se slovíčky (.DOC, .RTF, .WPD apod.) užívat, ale v pracovních kopiích těchto souborů určených k přípravě jednotek pro import je hromadně nahradit českým ň. LL má speciální znak – viz kapitolu o LL. Proto je dobré ñ psát. V pokročilých editorech lze tomuto znaku přiřadit klávesovou kombinaci, takže není nutné ho vkládat přes Vložit / Symbol.
- Obrácený otazník: nelze importovat do Millennia, Pokludy ani Lingea Lexiconu. Doporučuji jej sice v souborech se slovíčky (.DOC, .RTF, .WPD apod.) užívat, ale v pracovních kopiích těchto souborů určených k přípravě jednotek pro import je hromadně vymazat (nahradit za prázdný řetězec); každý, kdo umí jen trochu španělsky, ví, že tam tento otazník má být.
Seznam zkratek je dostupný v samostatném souboru.
Všechny zde publikované databáze jsou výsledkem práce s texty, nikoli plodem systematické lexikografické práce jdoucí po jednotlivých písmenech. Některé (např. latinsko-česká) se v poměrně značné míře zakládají na vlastní četbě a excerpování, takže někdy uvádějí i ledacos, co v jiných slovnících (přinejmenším těch, které jsou mi ve chvíli zpracovávání dostupné) chybí.
Jestliže se v databázi uvádí, že byl zdrojem zpracování daného hesla ten či onen slovník, tak u těch kvalitnějších (např. latinsko-česká) ve většině případů nejde o pramen jediný; přinejmenším bylo doplněno tu a tam nějaké synonymum (aniž by se na toto doplnění upozorňovalo značkou DZ či jinak); u slovníků cizojazyčno-cizojazyčných (latinsko-anglických apod.) též samozřejmě musím provést za použití svých znalostí či jiného slovníku (např. anglicko-českého) interpretaci významu a následné zpracování daného hesla v češtině. Často bylo též provedeno více či méně výrazné přeskupení. Přesně vzato v některých případech ani nejde o uvedení pramene; např. pokud v daném slovníku heslo není, tak slovník také zapíši a označuji tím, že byl zpracován, ne nutně, že nahlédnutí do něj vedlo k nějakému výsledku; to k němu doplňuji obvykle slovo „nic“ (např. „MLLM nic).
Např. poznámku „Pražák, LMALB“ je tedy třeba chápat tak, že byly zapracovány, často vedle dalších zdrojů (vlastní excerpta, fulltextové zdroje na internetu, dodání synonym aj.), všechny či téměř všechny základní významy (s případnou výjimkou těch chybných a rovněž některých v dnešní češtině zcela nesrozumitelných či nekorektních) uváděné pod daným heslem ve slovnících, jež se pod uvedenými zkratkami skrývají (Pražák, J. M. – Novotný, F. – Sedláček, J., Latinsko-český slovník, a kol., Latinitatis medii aevi Lexicon Bohemorum), a nikoli tak, že by šlo o jejich citaci – a už vůbec ne tak, že již není třeba v nich dané heslo nalistovávat, zvlášť proto, že také tam uváděné citace z pramenů významně pomohou k pochopení významu slova.
Zdeněk Mareček
David Zbíral
Anna Žáková
Pavel Ponec
Vítězslav Sklář
Jan Vorba
Pokud jsem vás náhodou zapomněl uvést, tak rozhodně neváhejte se mi ozvat; rád bych, aby všichni přispěvatelé, kteří k tomu svolí, byli jmenovitě uvedeni, tak se ozvěte už kvůli přesnosti těchto stránek.
Licence, autorská práva
Zde publikované databáze je dovoleno používat k nekomerčním účelům v jakémkoli softwaru. Lze je pro vlastní potřebu upravovat a měnit jak co do formy, tak co do obsahu. Není dovoleno je jakýmkoli způsobem distribuovat. Jejich publikování na jiných internetových stránkách a na nosičích (CD přílohy časopisů věnovaných informačním technologiím apod.) a vůbec všechny druhy jejich distribuce, např. spolu s freewarovou nebo komerční platformou elektronického slovníku, jíž by sloužily jako databáze, popřípadě její část, jsou nezákonné bez předchozího výslovného písemného svolení autora (autorů). Kohokoli ale lze pochopitelně odkazovat na adresu této stránky, aby si databáze sám stáhl.
Také tyto stránky ani jejich části není dovoleno převzít a publikovat je jinde či je jakkoli šířit bez předchozího výslovného písemného svolení autora.
Rovněž publikování odvozených děl je bez předchozího výslovného písemného svolení autora nezákonné.
Za správnost databází se neručí. Autoři nepřebírají žádnou hmotnou, morální ani jakoukoli jinou myslitelnou zodpovědnost za případné přímé, nepřímé, následné či jiné škody vzniklé užíváním, nadužíváním, využíváním, zneužíváním nebo neužíváním těchto databází či jakýchkoli jiných informací uvedených na těchto stránkách.
Aby čtenář jasně věděl, zda se tu od poslední návštěvy něco podstatného změnilo, byly vytvořeny dvě kapitoly: evidence přírůstků a tato kapitola. Ty přírůstky, které tvoří samostatnou stránku, jsou uvedeny jako hypertextový odkaz na příslušný materiál.
Zpřehlednění a úpravy souhrnu informací a doplnění informací o Lingea Lexiconu 7. 4. 2003.
Publikování jednoduché verze databází AJ, NJ a FJ uzpůsobených pro Lingea Lexicon 7. 4. 2003.
Zpřehlednění rozcestníku 13. 10. 2003.
Doplnění maker pro úpravu databází do tvaru vhodného pro Lingea Lexicon a PC Translator: 27. 10. 2003.
Doplnění informací o komplexním lexikografickém zpracovávání hesel pro Lingea Lexicon: 4. 12. 2003.
Další informace o formátování hesla pro Lingea Lexicon, přeskupení, zpřehlednění, oprava některých starších částí dokumentu: 7. 1. 2004.
Další informace o formátování hesla pro Lingea Lexicon a publikování databází v pokročilejším formátu určeném pro Lingea Lexicon: 20. 1. 2004.
Důležitá revize části o Lingea Lexiconu, upřesnění, rozšíření o několik obecných lexikografických zásad: 26. 1. 2004.
Doplnění nových a lépe fungujících slovníků česko-cizojazyčných ve formátu pro Lingea Lexicon do příslušných balíčků: 25. 2. 2004.
Fonetické abecedy a počítačové slovníky, fonetika a HTML: dodání stránky zpracovávající toto téma (14. 6. 2004).
Slovníky převedené do HTML: převedení všech databází z těchto stránek do formátu HTML, takže k jejich zobrazení stačí prohlížeč, např. Internet Explorer, a jejich publikování (21. 6. 2004).
Zanáším sem jen významnější revize a doplnění. Na něco jsem možná zapomněl.
Pokud v následujícím textu hodnotím, tak toto hodnocení nemusí být prosto chyb a subjektivních soudů. Žádná z anotací však není psána na komerční objednávku, nýbrž podle mých zkušeností s daným slovníkem.
Jednoznačně nejvíc doporučuji Lingea Lexicon, který umožňuje tvořit bohatě formátovaná a barevná hesla (podívejte se třeba na moje heslo intellego). Nevýhody: 1.) databáze jsou sice velmi dobré, ale placené, nyní asi 2000 Kč za nejrozsáhlejší verzi každé z nich; 2.) na internetu je málo zdarma dostupných databází ve formátu pro LL (pokud vím, tak nyní jen ty, které najdete na těchto stránkách). Nicméně z jednoduchých databází můžete do formátu pro LL převádět pomocí mých maker pro Word (viz níže kapitolu věnovanou LL).
K provozování vlastních databází či např. databází z těchto stránek ovšem nepotřebujete nic kupovat, stačí bezplatná demoverze LL.
Pro jazyky užívající nelatinských abeced nyní doporučuji formát HTML či XML a převádění do zjednodušeného HTML pro slovník PEKI. Vývojářům ovšem i zde doporučuji, aby užívali formátování pro LL a do jiných formátů jen převáděli, např. mými makry LingeaHTML a SlovníkyHTMLdoXML, které jsou mezi makry. (XML je kvalitnější datová struktura než LL, nicméně u něj obvykle nelze využít mých četných wordovských maker, popř. skriptů ve VBS, a zejména jsem nenašel žádný dobrý slovníkový program, který by uměl pracovat s XML.)
Pokud chcete poměrně rozsáhlé slovníky AJ, NJ a FJ zdarma (byť se strukturou A=B), volte pro tyto jazyky Millennium. Dávají toho zadarmo dost. Millennium naopak rozhodně nedoporučuji používat jako platformu pro slovníky jiných jazyků, např. staroslověnsko-český z těchto stránek; k tomu používejte Lingea Lexicon nebo PEKI.
Výhodou PC Translatoru je velká databáze, nevýhodou je struktura A=B a poměrně vysoká cena.
Pokud jste si vytvořili databáze v jednoduchém formátu A=B či jste si je někde stáhli, můžete si je buď převést pomocí mých wordovských maker do formátu pro Lingea Lexicon (viz kapitolu o LL), nebo zvolit např. slovníky PEKI či Pokluda. Víc doporučuji PEKI. Pokud jsou to databáze AJ, NJ či FJ a vy chcete užívat Millennium, importujte je do Millennia.
Nejlepší je používat databází více, např. si koupit LL a vedle toho si ještě stáhnout Millennium – a stále ještě není možné zapomínat ani na tištěné slovníky. Je prastarou zásadou, že není dobré se spolehnout na jediný slovník.
Toto je jen orientační vodítko. Můžete si sami zkusit, co vám nejvíc vyhovuje.
- Placený. Ceny jednoho slovníku se pohybují t. č. pod 2000 Kč. Je zdarma dostupná plně funkční demoverze, která na provozování jakýchkoli vlastních databází či databází stažených z těchto stránek úplně stačí.
- Informace: http://www.lingea.cz.
- Bezplatná demoverze: http://www.lingea.cz/demo/d4encz1.exe. Ta stačí např. na provozování slovníků z těchto stránek uzpůsobených pro LL a na vytváření vlastních, i velmi pokročile formátovaných slovníků (viz ukázku). Základní stránka pro registraci (jméno, e-mail) je http://www.lingea.cz/cz/demo_prev.htm.
- Pokud se po instalaci demoverze v nabídce Soubor zobrazuje jen Anglický slovník: dejte Soubor / Nastavení, klepněte na tlačítko nové a vytvořte sadu Německo-český a jako jeho výchozí jazyk zvolte gr. Stejně vytvořte také francouzsko-český a jako výchozí jazyk zvolte fr. Totéž může být třeba zopakovat v každé instalaci demoverze (např. pokud používáte všechny databáze z těchto stránek, tak potřebujete několik instalací).
- Nová instalace demoverze, pro pokročilejší: pokud je potřeba demoverzi nainstalovat znovu (např. při přechodu na nový počítač), tak ji nelze přeinstalovávat přes stávající lingeovský adresář; musí se nainstalovat normálně, do prázdného adresáře, a až pak do vzniklého podadresáře data zkopírovat slovníky.
- Verze on-line: http://www.lingea.cz/ilex/. Velké slovníky LL jsou o dost rozsáhlejší; toto je „osekaná“ verze.
- Hodnocení: vůbec nejlepší český počítačový slovník, a to jak platformou, tak bohatě členěnou databází. Možnostmi formátování hesla v uživatelském slovníku výjimečný i na světové úrovni. Rozhodně stojí za koupi. Anglicko-český, německo-český a polsko-český jsou již pěkné, na francouzském je ještě potřeba dost pracovat, rozšiřovat ho a upravovat rozvržení jednotlivých hesel (srv. např. heslo abattage).
- Anglicko-český a česko-anglický: 2002 má 100 000 hesel; jde o skutečná hesla, ne o jednotky A=B. Kromě toho program obsahuje i slovník synonym a sémanticky příbuzných slov, pěkný, byť starší výkladový slovník, slovník zkratek aj.
- Německo-český a česko-německý: 120 000 hesel.
- Francouzsko-český a česko-francouzský: 30 000 hesel.
- Jde zároveň o slovníky slovenské. Při spouštění z CD si můžete kdykoli vybrat, zda má být jazykem číslo 2 čeština, nebo slovenština. V případě, že program instalujete, si to volíte při instalaci.
- Konstrukce hesla: velmi dobrá, nejde o slovník nevhodného typu A(AJ)=B(CZ). Byl propracován z obou stran, není pouze inverzní.
- Takto má vypadat pořádný elektronický slovník. Je tu vidět dobré promyšlení a to, že je slovník propracovaný z obou stran, cizojazyčné i české, tj. ne pouze inverzní (jako Millennium a vůbec většina počítačových slovníků). (To samozřejmě neznamená, že k LL nemám výhrady, např. k seskupením do „odvozených slov“ v LL 2002, které jsou plné divokých etymologických fantazií; u četných hesel je patrná nedůslednost; ledaskde ve fr-cz se bez jakéhokoli rozlišení seskupují základní významy tranzitivní a pronominální; atd.)
- Řazení významů: materiál od Lingey uvádí, že jsou hesla řazena podle frekvence užití. Tak tomu (naštěstí!) není. Ve francouzsko-českém slovníku se např. často postupuje spíš po vzoru Petit Roberta, který byl jedním z hlavních pramenů zpracování, od historicky původního významu k posunutému (viz např. heslo „vocation“). To je ale dobře. Čistě frekvenční řazení je totiž neúčelné a nesmyslné; mnohem lepší je sdružovat spřízněné skupiny významů a ukazovat tak uživateli provázanou strukturu významů.
- Slovní spojení a příklady: LL obsahuje četná slovní spojení, která materiály od Lingey dělí na příkladová spojení (ilustrující význam), ustálená spojení (nazývané v dokumentaci LL též kolokace) a idiomatická spojení (kratší spojení s přeneseným významem).
- Lze spustit z CD. Chvíli to trvá. Pokud úvodní video zuřivě escapujete, tak se slovník někdy kousne. Autostart se asi nedá vypnout, leda tak, že si celý LL vypálíte na jiné CD kromě souborů autostartu (pokud jste právoplatní vlastníci LL, můžete si pořídit jednu kopii pro záložní účely). Slovník lze běžným způsobem spustit z CD bez autostartu, je to program Lexicon.exe v kořenovém adresáři. To pak skočíte přímo do okna slovníku a můžete začít vyhledávat.
- Vyhledávání: viz níže zvláštní podkapitolu.
- Zachování nastavení a uživatelského slovníku: i při spouštění programu z CD se zachovává nastavení i uživatelský slovník typu 1 (neboť se ukládají na pevný disk: nastavení do registru a uživatelský slovník do adresáře uživatelských souborů).
- Uživatelský slovník: viz pod speciálními podkapitolami níže.
- Kvalita databáze:
- Velký rozsah.
- Výborná provázanost a organizace, která je často cennější než kvantita. Ostatně i kvantitou je LL v AJ a NJ na špičce.
- Srovnání s Millenniem: někdy lepší, někdy horší, vždy lépe urovnané. Příklad: scourge: LL našel 1. deptat, sužovat, ničit; 2. pohroma, rána, metla (lidstva), v synonymech (a pouze tam) i slova znamenající bičovat atd. Millennium: bič, bičovat, metla, mrskat, rána, trestat. Co z toho plyne? 1.) Uzpůsobení je jednoznačně mnohem lepší v LL, který udává též gramatické kategorie atd.; 2.) nejlepší je pracovat s oběma, protože se leckdy nekryjí, nýbrž významně doplňují. Platí zkrátka odvěká zásada: používat víc slovníků.
- Výslovnost: má (fonetický přepis i namluvená slova).
- Zkoušení výslovnosti: má.
- Kopírování do schránky: jen po jednom slově, nelze zkopírovat celé heslo (pokud nejde o heslo uživatelské).
- Kopírování hesla jako formátovaného textu: z formátování přenese se jen kurzíva a tučné. Barvy přenést t. č. nelze.
- Kopírování uživatelského hesla funguje jen bez diakritiky (ve verzi 2002).
- Pohodlný pohyb zpět a vpřed ve vyhledávací historii: pomocí Alt+šipka.
- Vřele doporučuji.
- Nejlepší ovšem je pracovat s více různými slovníkovými programy.
- Nastavení písma: velikost i font zobrazení lze nastavit.
- Komunikační jazyk: čeština, angličtina, slovenština, němčina, francouzština.
- Automaticky přebírat ze schránky: Úpravy / Možnosti, karta Systém.
- Vypnutí automatické maximalizace po dokončení hledání: zřejmě nelze; když už máte nastaveno přebírání ze schránky, tak se maximalizuje automaticky. Někomu víc vyhovuje prostě vyhledávací dotaz ručně vkládat přes schránku (Ctrl+V).
- Zobrazení výsledku hledání: v Úpravy / Možnosti, karta Odkazy lze (v plné verzi LL) zrušit užívání karet v podoknech. Někomu to může vyhovovat víc, porovnejte to sami.
- Nastavení výchozí velikosti okna (pro pokročilejší): lze patrně provést změnou hodnot položky Window v systémovém registru v klíči HKEY_CURRENT_USER\Software\Lingea.
- Ctrl+F: tato zkratka v LL funguje. Také lze prostě začít psát (text se vpisuje do zadávacího políčka).
- Lze nastavit, že některé slovníky chceme vyřadit (např. načas): Soubor / Nastavení.
- LL je více než Millennium zaměřen na přesné zadání slova a hledání podle hesel, ne podle řetězců. Prostě je podobnější klasickým slovníkům. Nicméně má i možnosti fulltextového vyhledávání, a to s logickými operátory. Chybí mi jen uvozovky pro přesný výraz; např. pokud hledáte en tout ve francouzsko-českém slovníku, tak vám na zadání "en N1 tout" najde i všechno, kde se vyskytuje "tout en", což je velmi nevyhovující.
- Kde hledat další slova: ne vše se zobrazí v horním podokně na kartě Hesla. Je třeba se podívat také do dolního podokna, karta Tvary, kde máte např. Vlastní spojení (tj. hesla nalezená v uživatelském slovníku, které obsahují vyhledávací řetězec, ale nekryjí se s ním přesně, např. když jste zadali „Lord of the“, tak to dá vaše soukromé heslo „Lord of the Rings“ právě tady sem. Zde máte také odvozená slova a slova, která obsahují hledané heslo jako kořen slova. Je třeba si prohlížet okno trochu pozorněji, neboť výsledky se zobrazují na různých místech podle míry přesnosti atd., neřadí to podle prostého porovnávání řetězců, ale dost sofistikovaně.
- Vyhledává i jiné tvary slova, a to i v uživatelském slovníku. Např. vyhledávací dotaz „nadsázka“ vede k nalezení uživatelské jednotky „s jistou nadsázkou“ (jde o důsledek zapojení jiného lingeovského produktu, tzv. lemmatizátoru).
- Logické operátory:
- LL je má dobře propracované a vyplatí se je ovládnout; velmi se tak zefektivní práce s LL.
- Výchozí logický operátor: OR, nikoli AND, pakliže nejde o výraz, který je přesně ve slovníku. Takže když dáte cut the ground a není ve slovníku přímo tento výraz, tak najde všechny členy vyhledávacího řetězce, ale najde je v podobě hesel, ze kterých si můžete vybrat, což je celkem dobré. Nicméně operátory můžete též sami určit, což se často velmi vyplatí. Soupis operátorů následuje.
- A: AND či „&“. Najde hesla, kde jsou přítomna všechna zadaná slova.
- „A“, ale slova musejí být i ve stejné části hesla (v jednom příkladu, jednom významu atd.): operátor „+“. Například dotaz „zavřít + zamknout“ najde hesla, která spolu sdílejí význam přeložitelný jak „zavřít“, tak „zamknout“. Většinou toho najde méně než AND, ale je to relevantnější.
- NEAR: podobné jako AND, ale musí být do určité vzdálenosti. Lze přesně nastavit tím, že užijeme místo NEAR jen Nx, kde x = maximální počet slov, který může obě slova dělit (příklad: „nemít N3 práci“ by mělo vyhledat „nemít práci“, „nemít co na práci“).
- NOT: pomocí znaménka minus (-). Všechna hesla, kde je první slovo, ale ne to druhé.
- Nebo: výchozí operátor. Nic ovšem uživateli nebrání ho napsat explicitně pomocí OR či svislou čárou |.
- Přesný výraz: speciální operátor (konvenčně uvozovky) na to v LL 2002 neexistuje, ale dá se užít náhradní, ve většině případů ke stejnému výsledku vedoucí operátor: u dvoučlenného výrazu tak, že se zadá slovo1 N1 slovo2. U trojčlenných výrazů to tak úplně nefunguje, ale tam už lze zase zadat slovo1 + slovo2 + slovo3, protože je většinou málo pravděpodobné, že by se vyskytovala všechna tři slova ve více heslech. Bylo by samozřejmě lepší, kdyby byl zahrnut i operátor pro nalezení přesného výrazu (klasicky uvozovky).
- Zobrazení výsledků vyhledávání: existuje několik zobrazení: krátké, úplné. Lze též volit, který slovník se má zobrazit jako první (např. si tu lze nastavit, že to má být uživatelský).
- Lze prostě skočit do okna LL a vložit slovo ze schránky a ono se začne hledat. Šikovné, možná šikovnější než zapnout automatické přebírání ze schránky.
- Nejšikovnější pohyb mezi vyhledanými hesly je pomocí Alt + šipka nahoru či dolů.
- Zpět na předchozí zobrazené heslo: Alt+šipka vlevo. Vpřed: Alt+šipka vpravo.
- Pohyb po heslech: na hlavním panelu jsou ikonky s šipkou a písmeny A a Z. Těmi se skočí na v abecedním seřazení předcházející nebo následující heslo. Klávesovou zkratku tato funkce nemá (nebo chybí v soupisu klávesových zkratek v nápovědě).
- Zvláštní diakritika v uživatelském slovníku: viz níže. Je třeba ji hledat tak, jak je napsaná, jinak hledání někdy selhává. Tj. do vyhledávacího pole musíme někdy zadat např. r\^eve.
- Co dělat, když je barevné schéma po zobrazení přeházené: někdy pokud se pohybujete po nalezených heslech pomocí Alt+šipky, tak se přehází barevné schéma a jednotlivé části hesla mají barvy, které by podle definičního souboru mít neměly. Pokud k tomu dojde a vadí vám to, zkuste přebliknout pomocí Alt+Tab do jiného okna a pak zpět. Pokud to nepomůže, tak spusťte vyhledávání znovu a na příslušné heslo klepněte myší (a to jako na vůbec první).
- Databáze cizojazyčno-česká a česko-cizojazyčná jsou v LL poměrně striktně oddělené. Například v případě hledání „hříšný“ v CJ-AJ nenašel „peccable“, ale pod „peccable“ našel hříšný. V takových případech nepomůže ani použít fulltextové hledání pod Ctrl+F; vyzkoušeno na „entre autre“ v LL 2002. Ale co naopak pomohlo byl operátor +: na vyhledávací dotaz entre + autre už našel LL všechno. Takže je dobré na tento drobný vyhledávací nedostatek myslet a zvyknout si na práci s operátory; je velmi účinná.
- Seskupování hesel do tematických skupin: uživatel má možnost seskupovat hesla do tematických skupin. Tyto skupiny se ukládají do souboru encz-rel.txt, frcz-rel.txt a grcz-rel.txt ve složce uživatelských souborů. Můžete tvořit skupiny také přímou editací tohoto souboru. Jednotlivé skupiny dělí tři prázdné řádky, název skupiny je označen znakem mřížky. K tématu se přidává pod Ctrl+E, nicméně ruční editace je rychlejší. Tímto způsobem lze hesla uvádět do vztahu podle různých kritérií a je na lexikografovi, jak bude s touto vlastností LL pracovat. Pozn.: Pokud k některému slovu existují ve slovníku „tvary“ a zároveň patří do některé skupiny, zobrazí se v nižší části podokna výsledků hledání dvě karty: jednak „Významy“, jednak „Tvary“. Skupina vypadá v souboru např. následovně:
#Ovoce
cherry
peach
strawberry
- Částečná automatizace práce: uvažoval jsem o možnosti překopírovat si slovíčka jednoho jazyka, která si chceme vyhledat, z vlastního souboru do souboru s historií a pak dávat jen šipky dolů, ale LL si vede i jinou evidenci o historii, a to v registrovém klíči HKEY_USERS\S-1-5-21-3924064129-1417818515-3399203189-500\Software\Lingea\Lexicon\4.0, a podle té postupuje, když se ve vyhledávacím okénku zmáčkne šipka dolů. Nepostupuje tedy bohužel podle textového souboru s historií. Registr je samozřejmě také možné měnit a vpisovat si sem jinou historii hledání, ale méně zkušeným uživatelům bych to rozhodně nedoporučoval.
- Jak na to (pro pokročilejší): exportovat si registrový klíč s danou historií z regedit.exe, pak z tohoto pracovního souboru vymazat všechny položky kromě Hist1 (AJ), popř. Hist2 (NJ) či Hist3 (FJ), v těchto položkách přepsat v pracovním souboru hodnoty (na to si lze vytvořit i skript, který hodnoty tohoto textového souboru podle wordovského souboru se slovíčky přepíše sám) a pak pracovní soubor odentrováním nechat zapsat do registru. Funkčnost takovéhoto přepsání ověřena. Provádíte na vlastní nebezpečí. Pokud píšete rychle, je to většinou celkem neúčelné.
- Kam se ukládá historie a uživatelský slovník: výchozí cesta je Dokumenty/Lexikon. Zde lze uživatelský slovník editovat a odsud jej lze zálohovat. Umístění uživatelských souborů lze nastavit. Ale pozor, doporučuji zcela rezignovat na uživatelské slovníky typu 1, protože oproti uživatelskému slovníku typu 2 (v podadresáři data) má jen mizivé možnosti. Viz níže.
- Import: sám od sebe, v grafickém rozhraní Lingea Lexiconu, je nedostatečný až nepoužitelný, neboť neumožňuje hromadný import, jen vkládání po jednom výrazu. Ale pozor, uživatelský slovník typu 1 i 2 je běžný textový soubor, který lze přímo editovat (vkládat sem hromadně jednotky atd.). Jmenuje se např. encz-mujslovnik.udr: tj. vždy začíná zkratkami jazyků (určujícími, v jakém slovníku a směru se má použít), a má příponu udr). Pokud ho otevřete v Poznámkovém bloku (popř. CodePadu aj.) a máte či si vyrobíte databázi ve správném formátu (viz níže „Samotná tvorba hesel“ a také výše takto uzpůsobené databáze ke stažení), tak ji můžete dodat hromadně a pak ji také jednoduše a pružně editovat a doplňovat.
- Konstrukce hesla v uživatelském slovníku: před heslem je mřížka #. Pak končí řádek (enter) a na dalším (jednom či více) jsou významy. Pak je jeden řádek vynechán a následuje další heslo. Takže do tohoto formátu je třeba databázi, kterou chcete importovat, dostat. Poté je možné ji prostě přes schránku přenést do souboru s uživatelským slovníkem. Není to snadné, ale leckdy to není nemožné. S mými databázemi to máte jednoduché: na těchto stránkách jsou publikovány u AJ, NJ a FJ také databáze v požadovaném tvaru a je tu též zveřejněno wordovské makro na úpravu jiných databází.
- Je možné též zpracovat heslo komplexně a velmi doporučuji k tomu dle svých časových možností aspoň u některých hesel přikročit. Takové heslo se pak zobrazí velmi pěkně členěné a barevné. Viz níže podrobné návody.
- Heslové slovo (resp. výraz v levém sloupci wordovského souboru): nemělo by přesáhnout délku 128 znaků (větší počet by mohl vést k pádu aplikace).
- Jak upravit formát získané databáze tak, aby se dala přenést do LL: je to složitá a individuální věc, záleží totiž na tom, jak je formátovaná databáze, kterou jste získali. Dělat to ručně je samozřejmě zdlouhavé. Lze to ale často provést přes nahrazování v pokročilém textovém editoru, které zná i takové věci jako je hledání znaků tabulátoru a konce řádku (v tomto ohledu Word jasně předčí všechny, které znám). Nejpodrobnější rozbor pokročilého nahrazování: v tipech pro práci s PC, kapitola Word, podkapitola Hledání a nahrazování.
- Příklad, jak na to – zpracování neupravených databází stažených z mých stránek: [jedná se o výukový příklad; není třeba to provádět, protože jsem to udělal za vás, viz kap. Databáze upravené pro Lingea Lexicon]: otevřít si daný soubor v editoru, který umí zobrazovat formátovací znaky jako enter a tabulátor. Podívat se na formátování. Vidíte např. konstrukci hesla paganus m. [tab] pohan [tab][tab]...[enter]. Co je třeba, je očividné: 1.) Vytvořit si záložní kopii souboru, kdybychom něco zkazili. 2.) Zaměnit několikrát všechny „[tab][tab]“ za „[tab]“. 3.) Zaměnit všechny „[tab][enter]“ za „[enter][enter]#“. 3.) Zaměnit všechny [tab] za [enter]. Tím získáme heslo:
#ami m.
přítel
– tj. přesně tu podobu, kterou chceme.
- Je to na vás moc složité? Nezoufejte. Za prvé jsem to udělal u většiny svých databází za vás a převodové makro je s návodem publikováno také na této stránce pod kapitolou věnovanou databázím upraveným pro LL. S pomocí tohoto makra si můžete upravovat databáze z těchto stránek i své vlastní.
- Uživatelské slovníky jsou oddělené, cizojazyčno-český a česko-cizojazyčný. Tj. i jednotky je nutné vkládat do obou a aktualizovat či opravovat také v obou. Fungují vždy jen v tom směru, v jakém jsou vloženy. Tj. musíte vkládání v mírně pozměněné podobě ještě jednou zopakovat i pro slovník opačného směru, resp. slovníky zpracovávat samostatně. (Nejlepší je se neomezovat na prosté duplikování, nýbrž zpracovávat slovník z obou stran komplexně; to je nejlepší, ale časově nejnáročnější.)
- Jak vytvořit slovník druhého směru: snadno, vytvoří se sám poprvé, když hledáte tímto směrem a pod Ctrl+D vložíte uživatelskou jednotku. Jakmile vznikne, lze ho normálně editovat, vkládat do něj v Poznámkovém bloku přes schránku hromadně jednotky atd. Též ho lze vytvořit jako běžný textový soubor; jediná podmínka je, aby splňoval názvová kritéria.
- Využitelnost pro např. latinsko-český slovník: ano, lze si vytvořit další uživatelský slovník pro libovolný jazyk. Na to je dobré použít bezplatnou demoverzi z http://www.lingea.cz/demo/d4encz1.exe. Ta vám stačí k provozování jakýchkoli uživatelských slovníků, např. těch, které si můžete stáhnout na této stránce. Pokud vlastníte třeba anglický LL, tak samozřejmě můžete provozovat latinský či jiný slovník i pod ním, ale bude se vám plést např. do slovníku anglicko-českého, takže je lepší si stáhnout demoverzi a nainstalovat ji do samostatného adresáře. Postup je v obou případech stejný: v podadresáři data toho adresáře, který obsahuje program lexicon.exe, musíte mít minimálně dva soubory: definiční soubor (určující, jak se má heslo zobrazovat) a soubor slovníku (viz za okamžik blíže). Dále se bude v textu předpokládat, že užíváte demoverzi, a nikoli základní slovníky, nicméně postupy jsou zcela analogické. Definiční soubor nemusíte sami vytvářet ani se jím zabývat, stačí si stáhnout některý z balíčků z těchto stránek.
- Lemmatizátor (tj. nástroj, díky kterému LL ví, že např. heavily je odvozeno od heavy, takže při zadání heavy najde i jednotku heavily armed) funguje i v uživatelském slovníku, pokud lemmatizátor dané slovo obsahuje.
- Více uživatelských slovníků: je možné mít uživatelských slovníků více, v podstatě libovolný počet. Toto téma vyžaduje obsáhlejší výklad. Je třeba rozlišovat dva typy slovníků: (1) běžný uživatelský slovník s názvem např. encz-usr.udr (který je umístěn ve složce uživatelských souborů, běžně Dokumenty/Lexicon,a který je pro jeden směr jednoho slovníku vždy jen jediný) a (2) v zásadě libovolný počet dalších slovníků uložených v podadresáři data lingeovského adresáře. Dále je budu nazývat uživatelskými slovníky typu 2. Právě ony pro nás budou zajímavější, a to z toho důvodu, že umožňují velmi snadno komplexní zpracování hesla, takže se zobrazí pěkně členitě a barevně; oproti uživatelským slovníkům typu 1 mají jen samé výhody.
- Jak musejí vypadat uživatelské slovníky typu 2: mají svá pravidla vnitřní (obsahová), totiž správné formátování hesel pomocí speciálních značek; je to jednoduché a píše se o tom píše níže ve speciální kapitole věnované formátování. A kromě vnitřních mají též pravidla vnější, týkající se názvu: 1.) předponu na začátku názvu před spojovníkem, která určuje, pro jaké hledání se mají použít: pro hledání anglicko-české „encz-“, pro česko-anglické „czen-“ atd.; 2.) příponu „udr“; (to, co je mezi předponou a příponou, je důležité pro definiční soubor, viz níže), 3.) název nesmí přesahovat určitý počet znaků (nezjišťoval jsem, kde přesně je hranice, ale 12 znaků vlastního názvu bez přípony ještě šlo a 17 už ne; pokud není podmínka 3 splněna, ve slovníku se, jak jsem si spolehlivě ověřil, vůbec nehledá, ani se na něj neaplikuje např. ikona určená v definičním souboru).
- Takže pro vytvoření uživatelského slovníku typu 2 je třeba zkrátka vytvořit v Poznámkovém bloku textový soubor splňující názvová kritéria (včetně přípony .udr, nikoli .txt) a poté jej naplnit nějakým obsahem, popř. si některý stáhnout z těchto stránek a ten pak doplňovat (uvítám zaslání vašeho slovníku k publikaci na těchto stránkách). Příklad: chceme si vést latinský slovník. Proto si vytvoříme pomocí Poznámkového bloku v podadresáři data nový soubor encz-latina.udr a do něj si budeme vpisovat hesla (o formátování hesla viz dále). V tomto slovníku se bude hledat vždy, když budeme v demoverzi LL „předstírat“, že hledáme ve směru anglicko-českém.
- Uživatelský slovník typu 2 nesmí být v adresáři uživatelských souborů, nýbrž v podadresáři data lingeovského adresáře.
- Ve slovníku se hledá i v případě, že v hlavičce definičního souboru user.udf nemáte tento slovník nadefinovaný; stačí ho prostě mít v adresáři data (ověřeno). Ale neaplikují se na něj stylové definice. Proto je potřeba, aby byl každý slovník v definičním souboru řádně deklarován (viz níže). K tomu, aby se aplikovaly definice z user.udf, a tedy k tomu, aby se heslo zobrazilo pěkně barevně a celé, je třeba také, aby se maska určená v user.udf shodovala se středovou částí názvu, tedy aby třeba v případě slovníku encz-latina.udr byla v user.udf slovníku přiřazena maska *-latina.
- Důležité je, aby měl soubor v názvu před spojovníkem udáno, ke kterému jazyku a směru patří: encz-textbook.udr, czen-textbook.udr apod. (také lze samozřejmě grcz, czgr, frcz, czfr). Tak Lingea Lexicon pozná, že má hledat např. ve slovníku anglicko-českém, a nikoli slovníku jiném (např. česko-anglickém).
- Jak mít slovníky více jazyků: chceme si například tvořit slovník latinsko-český, česko-latinský, rumunsko-český a česko-rumunský. Je to pohodlně možné: v jedné instalaci demoverze můžeme provozovat 6 slovníků (budou mít předpony encz-, czen-, grcz-, czgr-, frcz-, czfr-), výhodné ovšem je, aby např. czen byl opačný slovník než encz (třeba česko-latinský). Stačí, když všechny splňují příslušnou masku.[8] Příklad: encz-latina.udr bude obsahovat latinsko-český slovník, czen-latina.udr česko-latinský, grcz-latina.udr rumunsko-český a czgr-latina.udr česko-rumunský (popř. soubor můžeme – což je lepší – pojmenovat grcz-rum.udr; jediná práce, kterou to přidá, je nutnost deklarovat masku *-rum v definičním souboru). Ale demoverzi lze nainstalovat i víckrát (do různých adresářů). S tím je jediný problém: aktualizace definičního souboru musí být prováděna všude. Pokud vám stačí 3 jazyky (= 6 slovníků, protože jsou dva směry), tak je myslím účelné užívat jednu instalaci demoverze. Pokud potřebujete slovníků více, nainstalujte si lingeovskou demoverzi víckrát (do různých adresářů).
- Možnost provozovat v jedné instalaci víc slovníků než 6 (odstavec lze přeskočit): tato možnost je dostupná, a docela pohodlně. Pod Soubor / Nastavení klepnout na Nové, vytvořit si novou sadu (např. sadu „Španělsko-český“) a zvolit, v jakých slovnících se má v této sadě hledat (např. encz-sp.udr), klepnutím na tlačítko Slovníky (první tlačítko Slovníky patří k výchozímu směru, druhé tlačítko k opačnému směru hledání). Výhoda je, že máte všechny slovníky na jednom místě, že nemusíte aktualizovat user.udf na více místech a že mají pod nabídkou Soubor správný název, nevýhoda že pokud přeinstalováváte apod., tak musíte znovu vybírat, ve kterých slovnících se má hledat. Já pokládám za lepší mít víc instalací, ale udělejte to tak, jak vám to vyhovuje: zvažte sami, zda je výhodnější instalovat na víc míst, nebo vybírat slovníky. Ani jedno netrvá moc dlouho. Pro pokročilejší: definice nových slovníků se zapisují do systémového registru jako Dict4, Dict5 atd. a mají svou vlastní historii Hist4, Hist5 atd. Příslušné hodnoty lze exportovat a pak po nové instalaci nechat zapsat do registru; patrně to bude fungovat a ušetřilo by to práci s nastavováním. Nezkoušel jsem to s novou instalací, ale jinak funkčnost vyzkoušená je: zapsání exportovaného klíče do registru vytvořilo odstraněnou sadu znovu, včetně příslušného výběru slovníkových titulů, ve kterých se má hledat.
- Uživatelské slovníky typu 2, výhody: může jich být i víc v jednom směru jednoho slovníku, což je skvělé např. pokud máte řekněme latinsko-české soubory jednotek s různou důvěryhodností. Vytvoříte pro ně prostě samostatné textové soubory např. encz-latina.udr a encz-latina2.udr. Stačí je mít v podadresáři data lingeovského adresáře (a deklarovat je v definičním souboru) a je hotovo. Ve směru anglicko-českém se prostě použijí. Lze jim nastavit i různou ikonu (ikona je nepovinný prvek). Jediný problém – ovšem jednoduše řešitelný – vzniká s přiřazením definic ze souboru user.udf více slovníkům téhož směru hledání; postup bude vysvětlen vzápětí.
- Jak přiřadit definiční soubor více slovníkům: problém není u přiřazení definičního souboru slovníkům různých směrů: přiřadí se automaticky všem, které odpovídají příslušné masce určené v definičním souboru (viz níže kapitolu o definičním souboru). Například máme latinsko-český slovník encz-latina.udr a česko-latinský czen-latina.udr; definiční soubor se aplikuje oběma, protože oba splňují masku „*-latina“. Ale drobný problém nastává u přiřazení user.udf více slovníkům téhož směru (což je dobré, pokud máme dva různé slovníky, ve kterých chceme hledat souběžně bez přepínání, např. jeden spolehlivý latinsko-český slovník a jeden méně spolehlivý, nebo třeba jeden latinsko-český a jeden latinsko-polský). Problém je ale řešitelný.[9] Do user.udf je třeba dát sice jen jednu sadu stylových definic, ale dvojí či několikerou sekci Title, kde se může lišit samotný Title, maska, ikona i název, ale stejný musí být parametr přiřazený view (jeho hodnotu pak přebírá sekce view, takže se definice v ní přítomné přiřadí i souborům splňujícím masku v příslušné sekci Title).
Příklad:
Title: "latina"
mask = "*-latina"
icon = "lg-rel"
view = "lg_latina"
t_en = "Latinsko-český slovník"
t_cz = "Latinsko-český slovník"
Title: "latina2"
mask = "*-latina2"
icon = "lg-usr"
view = "lg_latina"
t_en = "Latinsko-český slovník 2"
t_cz = "Latinsko-český slovník 2"
View: "lg_latina"
(a následovat budou definice; viz níže).
Takto lze aplikovat definiční soubor i většímu počtu slovníků téhož jazyka a směru než jen dvěma, teoreticky libovolnému počtu, a také lze mít více sekcí view a jednotlivým slovníkovým titulům (přesně řečeno sekcím Title) přiřadit tu sekci view, kterou chceme (za určitých okolností se může hodit mít dvě sekce view).
- Jak dát slovníku hlavičku: jednoduchá hlavička se dá slovníku vložit přes definiční soubor. Stačí tam za oddělovač | vložit příslušný text, který se má po spuštění slovníku zobrazit v okně hesel:
t_cz = "Okcitánsko-český slovník|Okcitánsko-český slovník - David Zbíral"
. V této základní hlavičce nelze používat značkování LL a nedají se tam myslím vložit zalomení řádku (jejich vkládání do user.udf, včetně měkkých, každopádně nemá vliv).
- Problémy a otázky související s uživatelským slovníkem:
- LL nehledá v mém uživatelském slovníku: zkontrolujte pod Soubor / Nastavení, zda máte nastaveno, aby v něm hledal; pokud je v pravém okénku, tak jej tlačítkem s šipkou přesuňte do levého.
- Nelze nastavit, aby plná verze slovníku hledala v uživatelském slovníku typu 1, kdežto paralelně nainstalovaná demoverze nikoli. To je pravda, vyzkoušeno; když se změní cesta k uživatelským souborům v demoverzi, změní se i v placeném slovníku, a naopak. Vpisují totiž cestu do jediného registrového klíče (HKEY_CURRENT_USER\Software\Lingea). Takže když máte jak placený program, tak demoverzi, tak vám buď chybí běžný uživatelský slovník typu 1 v anglicko-českém placeném slovníku, nebo vám překáží v demoverzi určené např. pro slovník latinsko-český. Řešení 1: prostě přesunout uživatelské slovníky (obsahující řetězec usr) do podadresáře data lingeovského adresáře (to pokud na ně nechcete aplikovat definice z user.udf).[10] Řešení 1 nedoporučuji, protože definice v user.udf nám dávají do ruky skvělý nástroj k členitému formátování hesla, což je výhodné i tehdy, když nemáme čas zpracovávat pečlivě všechna hesla: i trocha se počítá. Takže přicházíme k řešení 2: zcela rezignovat na uživatelské slovníky typu 1 a jejich obsah přenést do uživatelských slovníků typu 2 v podadresáři data, které neobsahují v názvu řetězec -usr, nýbrž třeba -uziv. Pod Soubor / Nastavení pak uživatelský slovník (typu 1) případně vyřadit z provozu (ale LL si všimne automaticky, že už neexistuje, neboť byl smazán či přesunut; vyřadit ho je nutné jen kdyby došlo k nějakému zkratu). Rozdíl od uživatelských slovníků typu 1 je vlastně jen 1.) v umístění na disku, 2.) v uživatelsky ovladatelnějších a bohatších možnostech formátování hesla. Řešení 2 má jistá úskalí: nesmíte užít nic, co user.udf nezná. Např. vyzkoušeno, že když obsahovalo heslo značku „%“, která je v uživatelských slovnících typu 1 běžná, tak to vedlo k havárii LL. Takže je potřeba si zvyknout, že je potřeba vše mít definované, respektive používat můj definiční soubor a mé formátovací zásady (jsou vyloženy níže). Pokud jste začátečníci, spokojte se s mým definičním souborem uvedeným níže nebo stáhnutelným v každém z balíčků mých databází a s dodržováním těch zásad, které nastiňuji níže.
Je vždy lepší zpracovávat hesla komplexně. K provozování uživatelských slovníků vám stačí bezplatná demoverze, nemusíte tedy vlastnit Lingea Lexicon, stačí si stáhnout demoverzi z http://www.lingea.cz/demo/d4encz1.exe. Jak zacházet s balíčky z těchto stránek: viz výše pod kapitolou věnovanou databázím určeným pro Lingea Lexicon.
Pokud si tvoříte v nějakém jazyce vlastní slovník, popřípadě si doplňujete některý slovník stažený z těchto stránek, máte s Lingea Lexiconem i jeho demoverzí možnost pojmout tuto práci komplexněji než jen nerozlišeně vypsat významy: učiní to práci se slovníkem účinnější, kvalitnější a přesnější. Bohužel zatím (12/2003) LL nehledá v uživatelském slovníku tak sofistikovaně jako v hlavní databázi.[11] Je ale dost možné, že Lingea vyhledávání v uživatelském slovníku vylepší. Že důkladné zpracovávání stojí za to i přes tento nedostatek, to není ani třeba připomínat.
Pokud chcete vědět, jak třeba může vypadat heslo pro LL (a vůbec to není složité!), podívejte se na obrázek ll-intellego.png. Ukázka jiného hesla: ll-divisor.png. Pozn.: světle fialové poznámky jsou soukromé poznámky určené k vymazání během konečné redakce.
Komplexnější lexikografická práce s Lingea Lexiconem vyžaduje osvojení několika údajů a zásad. V zásadě se lexikografická práce s LL dělí na dvě velké oblasti. První je editace definičního souboru: tam můžete určit, jak se má heslo z uživatelských slovníků zobrazovat (barvy, odsazení atd.). To je spíš pro pokročilejší nebo ty, kdo jsou ochotni tomu věnovat jistý čas. Pak je tu vlastní editace uživatelských slovníků. Jen tu je potřeba ovládnout (protože definiční soubor nemusíte tvořit, pokud si jej zkopírujete na této stránce níže nebo stáhnete v některém z balíčků databází z těchto stránek). Pokud se tedy definičním souborem nechcete zabývat, přeskočte celou kapitolu, která je mu věnovaná.
Lingea Lexicon užívá k tomu, aby věděl, jak zobrazit uživatelské heslo, definiční soubor user.udf v podadresáři data lingeovského adresáře. Definiční soubor může být v jedné instalaci pouze jeden. Určuje mimo jiné, na jaký slovník se mají dané formátovací zásady aplikovat. (Takový soubor vám pravděpodobně vznikl i instalací LL, ten ale doporučuji zazálohovat a poté jej nahradit definičním souborem z těchto stránek; je to zcela nutné zvlášť pokud chcete užívat mé databáze pro LL nebo postupovat přesně podle mých návodů níže.) v tomto definičním souboru si může uživatel sám definovat, jak má co vypadat: číslování významů, velikost a barva písma různých typů poznámek atd. Je to pro úplného laika poměrně složité a pracné, takže je lepší se spokojit s definičním souborem, který udělá někdo za vás. Proto pokud nechcete vzhled měnit, tak můžete následující text o definičním souboru přeskočit; jen si prostě nainstalujte některý z balíčků z těchto stránek, popřípadě nahraďte text svého user.udf v podadresáři data.
Důležité upozornění: když nemáte stejný definiční soubor jako ten, kdo databázi dělal, tak se vám některé cenné údaje (omezení významu, pramen zpracování apod.) vůbec nemusejí zobrazit (ověřeno, že když definiční soubor značku nezná, tak to, co je jí zformátováno, vůbec nezobrazí) nebo může docházet k havarijnímu ukončení LL. Takže velmi doporučuji užívat můj definiční soubor a měnit v něm jen málo významné detaily (barvy, proložení písma atd.) nebo vůbec nic.
Některé důležité informace o definičním souboru byly již uvedeny výše (např. jak aplikovat definiční soubor více slovníkům v témže směru hledání).
Struktura definičního souboru:
- Sekce Title:
- Sekcí Title může být (a bývá) i víc. Nicméně nad kritickým bodem cca 50 sekcí Title začíná mít LL 2002 problémy, jednak s barevným schématem základních (placených) databází, jednak při ukončování. Kritická mez je patrně 53 titulů. Při programování se s tolika tituly nepočítalo; uvidíme, jak to bude v dalších verzích LL.
- Jednotlivým sekcím Title mohou být přiřazené různé sekce View.
- mask: určuje, na jaké soubory se mají definice aplikovat. Koncová část mask nemusí být shodná s řetězcem přiřazeným title.
mask = "*-latina"
určuje, že tento definiční soubor bude užit pro všechny soubory, které obsahují mezi předponou a příponou právě řetězec „-latina“: např. encz-latina.udr, czen-latina.udr atd. Jak přiřadit definiční soubor více slovníkům: je to velmi snadné: přiřadí se automaticky všem, které odpovídají příslušné masce definované v definičním souboru. Jak přiřadit definiční soubor více slovníkům téhož směru hledání: viz výše pod obecnou kapitolou věnovanou uživatelskému slovníku.
- icon: určuje ikonu, jakou má daný slovník mít; musí být v podadresáři icon. Nepovinné.
- view: základní definice pohledu (blíže viz nápovědu a níže, pod sekcí view). Určuje, jaká sekce view (pokud je jich víc – tuším, že jich může být víc) se má slovníku splňujícímu danou masku přiřadit.
- mini: definuje minimalizované zobrazení okna slovníku (v které části obrazovky má být atd.).
- user: definuje (zřejmě) běžné zobrazení okna slovníku. Ale nevím, jakým způsobem se tam hodnoty zadávají.
- t_en atd.: určuje název slovníku v dané lokalizaci: pokud si člověk přepne na anglické ovládání, zobrazí se mu ten název, který je u značky t_en, atd. t_cz je česká lokalizace.
- Sekce View: musí obsahovat název shodný s hodnotou konstanty view v sekci title. S parametry vpisovanými do vlastní sekce View neumím dobře zacházet. Je tam definována struktura hesla: hlavička, významy aj. Myslel jsem, že se znak procenta pak píše i do hesla a podle toho LL ví, kde začíná a končí heslové slovo, kde začínají a končí varianty, kde začíná a končí výslovnost atd., ale zkoušel jsem to a nejde to; % odpovídají prostě tomu, co je definováno v podsekci head pod značkou note2. Členění záhlaví hesla v uživatelském slovníku totiž podle vyjádření technické podpory ani není možné: pro uživatelské slovníky jsou dostupné jen položky "entr", "numb", "trans", "samp2" a "%rems". Je proto třeba postupovat v uživatelských slovnících za použití běžného formátování <n. ...>, <z. ...> atd. – viz níže.
- Sekcí View může být více. Musejí mít jedinečný název, např. View: "lg_uziv" a View: "lg_uziv2". Lze v nich mít odlišné definice (jiné barvy apod.). Což může být leckdy dost výhodné.
- head: popisuje záhlaví hesla: 1.) odsazení, 2.) sled polí. Příklad:
head = "|d0%entr%vari%pron%pict%morx%form%styl|n1"
. To říká něco jako: odsazení 0, pak následuje heslové slovo, pak varianty, pak výslovnost, pak několik nevím, pak stylová charakteristika a to na konci je zalomení řádku. (Pozn.: uváděné příklady jsou většinou převzaty z user.udf nainstalovaného při instalaci LL.)
- sens: popisuje formát významu. Zase odsazení, číslo, fráze, překlad atd. Příklad:
sens = "|d1%numb%phrs%trans%desc2%coll2%samp2%note2"
.
- grps: popisuje skupinové významy (určeno zejm. pro oddělení částí hesla, které pokrývají různé slovní druhy téhož heslového slova). Příklad:
grps = "|d1%posp|n1"
.
- deri: popisuje odvozené významy.
- corp: popisuje výsledek korpusového hledání (DZ: kontexty nalezené v korpusu?).
- tabs: určuje zarážky tabulátorů. Základní jednotkou je polovina šířky písmene x. Např.
tabs = "1,2,6,8"
určuje, že d1 bude mít dosti malé odsazení, d2 dvakrát větší než d1, d3 šestkrát větší než d1. Vyzkoušeno, že to funguje.
- rsamp: jeho funkci jsem nezjistil.
- View má kromě těchto základních parametrů několik důležitých podsekcí, jejichž zpracování následuje.
- Podsekce Item: zde se blíže určuje způsob zobrazení jednotlivých typů segmentů hesla. Nevím, jak se všemi pracovat, tj. do jaké značky uzavřít ten který textový segment, aby LL věděl, že jde např. o údaj o morfologii a zformátoval ho tedy příslušným stylem, ale podle vyjádření technické podpory to ani nejde a dostupné jsou pro uživatelské slovníky jen "entr", "numb", "trans", "samp2" a "%rems". Zkoušel jsem jak značky typu <morx>, tak %, ale % aplikuje prostě note2 (tj. pozor, note2 je třeba přidat k seznamu věcí, které v uživatelském slovníku fungují). V uživatelských slovnících podle vyjádření technické podpory nelze využívat definici záhlaví hesla, např. k určení, co je která část hlavičky. Technická podpora doporučuje používat klasické značkování pomocí <g.> apod. a uvádí, že v sekci item lze u uživatelských slovníků ovlivnit pouze položky entr, numb, trans, samp2 (formátování příkladů) a %rems.[12]
- entr: určuje formát heslového slova. Entr se aplikuje v textu uživatelského slovníku pomocí „#“.
- vari: formát variant heslového slova.
- posp: slovní druh.
- morf: údaje o morfologii.
- form: tvary.
- pron: výslovnost.
- numb: určuje formát čísel určených k číslování významů. V uživatelském slovníku se aplikuje pomocí rovnítka na začátku odstavce.
- styl: stylový příznak.
- rems: poznámky.
- labS: fráze.
- trans: určuje klasifikaci významu (?). [DZ: spíš formát ekvivalentů; tato formulace v nápovědě funkci myslím zamlžuje.]
- desc1: definice ve výchozím jazyce.
- samp1: příklady ve výchozím jazyce.
- note1: poznámky ve výchozím jazyce.
- link1: odkazy ve výchozím jazyce.
- desc2: definice v cílovém jazyce.
- samp2: formát příkladů s překlady do cílového jazyka. Aplikuje se do textu slovníku pomocí otazníku na začátku odstavce. Pokud následuje překlad příkladu, začíná rovnítkem, bez zalomení řádku.
- note2: poznámka v cílovém jazyce. Odpovídá značce %. Nevím, jak ji lze využívat např. na fráze, patrně totiž neumožňuje, narozdíl od samp2, zahrnout za rovnítkem i překlad. Rovnítko se zobrazuje jako běžný znak, i když se note2 přesně rovná obsahu samp2. Je lepší fráze značkovat pomocí značek typu <p.>.
- link2: odkaz v cílovém jazyce.
- Podsekce Emph: zde si lze definovat jednotlivé značky pro části hesla (kontextová poznámka, výslovnost atd.) a přiřadit jim formátování podle libosti (udává se, že mimo písmena c, d, g, x, která si Lexicon vyhrazuje, ale ve skutečnosti definovat a užívat bez problémů jdou a naopak jiné, jako l či t, mi definovat nešly). Např. si definujete z pro zdroj zpracování (ze kterého slovníku či textu jste čerpali) a přiřadíte mu fialovou barvu. Když pak napíšete do uživatelského slovníku <z.Velký francouzsko-český slovník>, tak se to, co je uzavřeno mezi značkami „<z.“ a „>“, zobrazí po nalezení fialově. Každý druh části hesla (kontextová poznámka, údaj o zdroji zpracování, opisný výklad, mluvnická poznámka atd.) by měl mít vlastní značku; podrobněji se o tom píše níže. Uvádí se, že je předdefinováno b pro tučné, i pro kurzívu a u pro podtržené (ale ty lze také definovat nově a v mém definičním souboru byly předefinovány na úplně jiné značky). Příklad: definice
p = "|cR|fI|b-|i-[%s]|b.|i.|f.|c."
určí, že co je uzavřeno ve značce <p.>, bude zformátováno fonetickou abecedou (dáno je to kombinací znaků |fI). Lze sem dát i věci jako je zalomení řádku za danou značkou: prostě na konec definice dejte |n1, |n2 nebo |n3 a po nalezení budou řádky zalomené. Často je potřeba si s definicí vyhrát a dlouho to zkoušet (nezapomeňte, že definiční soubor se načítá při spuštění LL, takže pro ověření aktuálního stavu je třeba LL znovu spustit). Pokud například definice jedné věci zformátuje všechno až na konec hesla, tak se podívejte, zda jste příslušný atribut vypnuli značkou atributu následovaného tečkou: např. zápis "|s3|cM|b-|i+%s|i.|c.|s.|b-" vypíná kurzívu, barvu, velikost a pak nastavuje netučné písmo (když jsem b-, tj. netučné písmo, pouze vypnul, tak to, co následovalo, bylo zformátované tučným písmem, což jsem nechtěl, tak jsem dal ještě na konec b- a to už formátování dalších odstavců hesla neovlivnilo). Je často potřeba experimentovat. Následují původní atributy, které ale pokud možno ignorujte, zvlášť pokud užíváte můj definiční soubor, který je dělán s vědomím, že klasické formátování LL nejde v uživatelských slovnících LL 2002 používat. Kompletní výklad mých značek najdete v kapitole o tvorbě hesel.
b: tučné.
i: kurzíva.
u: podtržené.
c: kontextová poznámka ve výchozím jazyce.
d: kontextová poznámka v cílovém jazyce.
g: gramatická poznámka.
x: křížový odkaz (odkaz na jiné heslo – tak nápověda).
Pokud některé písmeno nelze definovat, je pravděpodobně něčím obsazené. Mně například nešlo aplikovat definici l či t. V takovém případě zvolte písmeno jiné.
Nastavování formátu v definičním souboru.
Všechny značky jsou ve tvaru |aV, kde | je uvozovací znak, a je atribut a V je hodnota.
Atributy (komentáře v závorkách jsem doplnil já, převážně podle svých pokusů):
c color [barva písma dané položky]
d odsazení po zalomení řádku [d0 je bez odsazení, d1 je menší odsazení, d2 větší atd.; např. numb = "|d2" atd. definuje, že číslování má být odsazeno, a to odsazením velikosti 2. Velikost zarážek se dá nastavit v sekci view pod tabs (viz výše). Pokud do některé položky nejde odsazení vložit, zkuste ten postup, že na její začátek (ovšem jen pokud nebývá nikde jinde než na začátku řádku) dáte značku |n1 (zalomení před položkou) a až za tuto značku dejte odsazení.]
f font [|fI zapíná fonetickou abecedu. V LL 2002 dosud nelze měnit font v rámci jednoho hesla; LL 2002 ovládá vedle latinky též azbuku, řecké písmo a hebrejské písmo, ale zobrazuje je jako obrázky a pro uživatelské slovníky není tato funkce zpřístupněna; technická podpora byla tak laskavá, že navrhla pro příští verze toto vylepšení, takže v dalších verzích asi bude možné přiřadit kterékoli značce konkrétní font, což je vlastně nepostradatelné u jazyků užívajících nelatinských abeced.]
s size [velikost písma; např. |s7 zapne největší velikost, |s1 nejmenší, od |s8 včetně už jsou zase malá písma. s3 není třeba zadávat, protože je výchozí; někdy je výhodné velikost nezadávat; to se pak přebírá od okolí. Také barvu není nutné zadávat, pokud se vám hodí, aby ji ve vnořených značkách přebírala od nadřazené značky.]
l lang [|l1 je značka pro zdrojový jazyk, |l2 pro cílový jazyk. Značka, kterou je nutné užívat v případě provádění komplexnějšího popisu jazyka, je ale dobré jazyk nastavovat v každém případě, zejm. u značky odkazu (v mých databázích <x.>), fráze, sublemmatu, příkladu (samp2) a variant; když totiž jazyk není v definici příslušné značky nastaven a když uživatel klepne myší na něco, co je v této značce v těle hesla uzavřeno, tak se automaticky hledá heslo v opačném směru vyhledávání (např. u nastavení hledání na anglicko-české se hledá v takovém případě ve směru česko-anglickém), kdežto pokud nastavíme značkám správně jazyk (zejm. tam, kde značky obsahují segmenty ve výchozím; cílový je pro tělo hesla přednastavený a není třeba ho speciálně nastavovat každé značce), tak se uživateli po poklepání najde heslo ve správném směru.[13]]
b bold [tučné písmo; zapne se v definičním souboru pomocí |b+, netučné se zapne pomocí |b-.]
i italic [kurzíva; zachází se s ní stejně jako s bold]
u underln [podtržení; zachází se s ním stejně jako s bold]
h hspace [mezera; čím menší je číslo, tím větší je mezera; pevnou mezeru v uživatelských slovnících ani definičním souboru pro LL 2002 vkládat nelze]
n newln [zalomení řádku]
L list
Vypínání: provádí se značkou |x. , kde x = vypínaný atribut. Takže např. |b. vypne nastavení tučného písma, |s. vypne velikost atd. Kdyby se to do definice značky x nedalo, tak může být např. velikostí 1 celý zbytek hesla; totéž platí o barvách. Často je potřeba experimentovat a optimální řešení nějakou chvíli hledat (pokud chcete definiční soubor upravovat či doplňovat).
Definice barev:
V popisu položek v sekci #emph se na barvy odkazuje pomocí značky |cX, kde X je velké písmeno latinské abecedy.
Jaká konkrétní barva bude použita, je dáno implicitním nastavením těchto barev přímo v programu, avšak v podsekci #colo je možné si barvy měnit nebo si definovat barvy nové (za použití hexadecimálního kódu barvy se spojovníky dělícími jednotlivé barevné složky). Barva se definuje jako poměr složek RGB (R=red, G=green, B=blue). Hodnota každé složky se definuje jako hexadecimální číslo od 00 do FF.
Následující barvy jsou již předdefinovány (lze je ale předefinovat):
0 = "00-00-00" černá (Black)
R = "AF-00-00" červená (Red)
G = "00-AF-00" zelená (Green)
B = "00-00-AF" modrá (Blue)
X = "00-00-AF" rozšířená (eXtend)
A = "7F-7F-7F" šedá (grAy)
C = "00-AF-AF" modrozelená (Cyan)
Y = "AF-AF-00" žlutá (Yellow)
Je třeba poznamenat, že některé čachry s barvami kupodivu působí pád aplikace. Například když jsem do svého definičního souboru vložil barvu J = = "8E-54-AB", tak po zobrazení hesla obsahujícího značku, které byla tato barva přiřazena, aplikace spadla. Když jsem to dal jako X = "8E-54-AB", bylo vše v pořádku. Zkoušel jsem to v těsném sledu, aniž bych měnil cokoli jiného, takže jsem si jistý, že to je tím. Zdá se, jako by aplikace nepřipouštěla některá písmena v definicích barev. Zkoušel jsem opakovaně např. Q, P či J, a vedlo to k pádům.
Užívání kontra neužívání závorek ve zdrojovém textu:
Určité typy poznámek bývají v závorkách. Většina typů – ne-li všechny – se do závorek dává buď vždy, nebo nikdy, takže si lze ušetřit práci tím, že se do zdrojového souboru nebudou závorky psát a že se nastaví v definičním souboru, aby se daný výraz dával do závorek automaticky. #hida <s.střv.> <d.anglosas.> lán <n.pozemek o rozloze 60-120 akrů>: všechny tři poznámky se zobrazí v závorkách, pokud v definičním souboru je: d = "|s1|cM|b-|i-(%s)|b.|i.|c.|s." a totéž u definice značky s a n. %s znamená vlastní výraz uzavřený ve zdrojovém souboru do dané značky; je-li %s uzavřeno do závorek, znamená to, že se má automaticky napsat se závorkami. Já mám závorky u různých značek (např. b, d, f aj., viz níže, jak se značky používají). Dříve jsem závorky psal přímo do slovníku (a do definičního souboru jsem je tudíž nedával), nicméně ze systémového hlediska je to nadbytečné a ustoupil jsem od toho. Je daleko lepší to určit v definičním souboru, než to psát ručně.
Pozn.: obdobně se pracuje v definičním souboru s jakýmikoli dalšími znaky, např. s výslovností: ta se nechá uzavřít automaticky do hranatých závorek tak, že se ve střední části definice značky vyhrazené pro výslovnost napíše: [%s].
Definiční soubor – příklad. Následuje příklad definičního souboru. Je možné si jej pozměnit podle svých potřeb, ale doporučuji to provádět uvážlivě; např. barvy či velikost písma si klidně měňte tak, jak vám vyhovují, ale některými úpravami byste mohli způsobit, že se vám mé databáze nebudou zobrazovat správně a úplně.
Title: "uziv"
mask = "*-uziv"
icon = "lg-usr"
view = "lg_uziv"
t_en = "Uživatelský slovník"
t_cz = "Uživatelský slovník"
Title: "uziv2"
mask = "*-uziv2"
icon = "lg-rel"
view = "lg_uziv"
t_en = "Uživatelský slovník 2"
t_cz = "Uživatelský slovník 2"
Title: "uziv3"
mask = "*-uziv3"
icon = "lg-rel"
view = "lg_uziv"
t_en = "Uživatelský slovník 3"
t_cz = "Uživatelský slovník 3"
Title: "uziv4"
mask = "*-uziv4"
icon = "lg-rel"
view = "lg_uziv"
t_en = "Uživatelský slovník 4"
t_cz = "Uživatelský slovník 4"
Title: "latina"
mask = "*-latina"
icon = "lg-1"
view = "lg_uziv"
t_en = "Latinsko-český slovník"
t_cz = "Latinsko-český slovník"
Title: "latina1b"
mask = "*-latina1b"
icon = "lg-1"
view = "lg_uziv"
t_en = "Latinsko-český slovník 1b"
t_cz = "Latinsko-český slovník 1b"
Title: "latina2"
mask = "*-latina2"
icon = "lg-rel"
view = "lg_uziv"
t_en = "Latinsko-český slovník 2"
t_cz = "Latinsko-český slovník 2"
Title: "latina3"
mask = "*-latina3"
icon = "lg-usr"
view = "lg_uziv"
t_en = "Latinsko-český slovník 3"
t_cz = "Latinsko-český slovník 3"
Title: "latina4"
mask = "*-latina4"
icon = "lg-usr"
view = "lg_uziv"
t_en = "Latinsko-český slovník 4"
t_cz = "Latinsko-český slovník 4"
Title: "latina5"
mask = "*-latina5"
icon = "lg-usr"
view = "lg_uziv"
t_en = "Latinsko-český slovník 5"
t_cz = "Latinsko-český slovník 5"
Title: "latina6"
mask = "*-latina6"
icon = "lg-usr"
view = "lg_uziv"
t_en = "Latinsko-český slovník 6"
t_cz = "Latinsko-český slovník 6"
Title: "latinavar"
mask = "*-latinavar"
icon = "lg-rel"
view = "lg_uziv"
t_en = "Latinské varianty slov"
t_cz = "Latinské varianty slov"
Title: "latinaerr"
mask = "*-latinaerr"
icon = "lg-pink"
view = "lg_uziv"
t_en = "Chyby či nezmapované varianty"
t_cz = "Chyby či nezmapované varianty"
Title: "latinageo"
mask = "*-latinageo"
icon = "lg-green"
view = "lg_uziv"
t_en = "Latinská toponyma"
t_cz = "Latinská toponyma"
Title: "latinapr"
mask = "*-latinapr"
icon = "lg-blue"
view = "lg_uziv"
t_en = "Nezařazené latinské příklady"
t_cz = "Nezařazené latinské příklady"
Title: "latina0"
mask = "*-latina0"
icon = "lg-usr"
view = "lg_uziv"
t_en = "Latinsko-český slovníček"
t_cz = "Latinsko-český slovníček"
Title: "rectina"
mask = "*-rec"
icon = "lg-1"
view = "lg_uziv"
t_en = "Řecko-český slovník"
t_cz = "Řecko-český slovník"
Title: "rectina1b"
mask = "*-rec1b"
icon = "lg-1"
view = "lg_uziv"
t_en = "Řecko-český slovník 1b"
t_cz = "Řecko-český slovník 1b"
Title: "rectina2"
mask = "*-rec2"
icon = "lg-rel"
view = "lg_uziv"
t_en = "Řecko-český slovník 2"
t_cz = "Řecko-český slovník 2"
Title: "rectina3"
mask = "*-rec3"
icon = "lg-usr"
view = "lg_uziv"
t_en = "Řecko-český slovník 3"
t_cz = "Řecko-český slovník 3"
Title: "rectina4"
mask = "*-rec4"
icon = "lg-usr"
view = "lg_uziv"
t_en = "Řecko-český slovník 4"
t_cz = "Řecko-český slovník 4"
Title: "recerr"
mask = "*-recerr"
icon = "lg-pink"
view = "lg_uziv"
t_en = "Chyby či nezmapované varianty"
t_cz = "Chyby či nezmapované varianty"
Title: "okcit"
mask = "*-okcit"
icon = "lg-1"
view = "lg_uziv"
t_en = "Okcitánsko-český slovník"
t_cz = "Okcitánsko-český slovník"
Title: "okcit2"
mask = "*-okcit2"
icon = "lg-rel"
view = "lg_uziv"
t_en = "Okcitánsko-český slovník 2"
t_cz = "Okcitánsko-český slovník 2"
Title: "okcit3"
mask = "*-okcit3"
icon = "lg-usr"
view = "lg_uziv"
t_en = "Okcitánsko-český slovník 3"
t_cz = "Okcitánsko-český slovník 3"
Title: "okcit4"
mask = "*-okcit4"
icon = "lg-usr"
view = "lg_uziv"
t_en = "Okcitánsko-český slovník 4"
t_cz = "Okcitánsko-český slovník 4"
Title: "bulh"
mask = "*-bulh"
icon = "lg-1"
view = "lg_uziv"
t_en = "Bulharsko-český slovník"
t_cz = "Bulharsko-český slovník"
Title: "bulh2"
mask = "*-bulh2"
icon = "lg-rel"
view = "lg_uziv"
t_en = "Bulharsko-český slovník 2"
t_cz = "Bulharsko-český slovník 2"
Title: "bulh3"
mask = "*-bulh3"
icon = "lg-usr"
view = "lg_uziv"
t_en = "Bulharsko-český slovník 3"
t_cz = "Bulharsko-český slovník 3"
Title: "bulh4"
mask = "*-bulh4"
icon = "lg-usr"
view = "lg_uziv"
t_en = "Bulharsko-český slovník 4"
t_cz = "Bulharsko-český slovník 4"
Title: "stsl"
mask = "*-stsl"
icon = "lg-1"
view = "lg_uziv"
t_en = "Staroslověnsko-český slovník"
t_cz = "Staroslověnsko-český slovník"
Title: "stsl2"
mask = "*-stsl2"
icon = "lg-rel"
view = "lg_uziv"
t_en = "Staroslověnsko-český slovník 2"
t_cz = "Staroslověnsko-český slovník 2"
Title: "stsl3"
mask = "*-stsl3"
icon = "lg-usr"
view = "lg_uziv"
t_en = "Staroslověnsko-český slovník 3"
t_cz = "Staroslověnsko-český slovník 3"
Title: "stsl4"
mask = "*-stsl4"
icon = "lg-usr"
view = "lg_uziv"
t_en = "Staroslověnsko-český slovník 4"
t_cz = "Staroslověnsko-český slovník 4"
Title: "srb"
mask = "*-srb"
icon = "lg-1"
view = "lg_uziv"
t_en = "Srbochorvatsko-český slovník"
t_cz = "Srbochorvatsko-český slovník"
Title: "srb2"
mask = "*-srb2"
icon = "lg-rel"
view = "lg_uziv"
t_en = "Srbochorvatsko-český slovník 2"
t_cz = "Srbochorvatsko-český slovník 2"
Title: "srb3"
mask = "*-srb3"
icon = "lg-usr"
view = "lg_uziv"
t_en = "Srbochorvatsko-český slovník 3"
t_cz = "Srbochorvatsko-český slovník 3"
Title: "srb4"
mask = "*-srb4"
icon = "lg-usr"
view = "lg_uziv"
t_en = "Srbochorvatsko-český slovník 4"
t_cz = "Srbochorvatsko-český slovník 4"
Title: "stfr"
mask = "*-stfr"
icon = "lg-1"
view = "lg_uziv"
t_en = "Starofrancouzsko-český slovník"
t_cz = "Starofrancouzsko-český slovník"
Title: "stfr2"
mask = "*-stfr2"
icon = "lg-rel"
view = "lg_uziv"
t_en = "Starofrancouzsko-český slovník 2"
t_cz = "Starofrancouzsko-český slovník 2"
Title: "stfr3"
mask = "*-stfr3"
icon = "lg-usr"
view = "lg_uziv"
t_en = "Starofrancouzsko-český slovník 3"
t_cz = "Starofrancouzsko-český slovník 3"
Title: "stfr4"
mask = "*-stfr4"
icon = "lg-usr"
view = "lg_uziv"
t_en = "Starofrancouzsko-český slovník 4"
t_cz = "Starofrancouzsko-český slovník 4"
Title: "sp"
mask = "*-sp"
icon = "lg-1"
view = "lg_uziv"
t_en = "Španělsko-český slovník"
t_cz = "Španělsko-český slovník"
Title: "sp2"
mask = "*-sp2"
icon = "lg-rel"
view = "lg_uziv"
t_en = "Španělsko-český slovník 2"
t_cz = "Španělsko-český slovník 2"
Title: "sp3"
mask = "*-sp3"
icon = "lg-usr"
view = "lg_uziv"
t_en = "Španělsko-český slovník 3"
t_cz = "Španělsko-český slovník 3"
Title: "sp4"
mask = "*-sp4"
icon = "lg-usr"
view = "lg_uziv"
t_en = "Španělsko-český slovník 4"
t_cz = "Španělsko-český slovník 4"
View: "lg_uziv"
head = "|d0%entr%vari%morx%form%styl|n1"
tabs = "1,3,6,9"
#item:
entr = "|cB|s6|b+|l1%s|l.|b.|s.|c.|h1"
vari = "|h1|cB|s4%s|s.|c."
morx = "|h1|b+(%s)|b."
form = "|h1|cA(%s)|c."
styl = "|cG|i+%s|i.|c.|h1"
numb = "|n1|d1|cR|b+%s.|c.|b."
trans= "|d3|b+|l2%s|l.|b.|n1"
samp2= "|d3|l1|cK|i+%s|i.|c.|l.|h1|l2%t|l.|n1"
note2= "|d3|kM|l1|cM|i+%s|i.|c.|l.|h1|l2%t|l.|k.|n1"
#emph:
a = "|d1|s2|cB|l1|b-|i-%s|b.|i.|l.|c.|s.|n2"
b = "|s1|cV|b-|i-(%s)|b.|i.|c.|s."
c = "|n1|d1|s3|cM|b+|i-%s|b.|i.|c.|s.|d.|n1"
d = "|s1|cM|b-|i-(%s)|b.|i.|c.|s."
e = "|s3|cB|l1|b+%s|b.|l.|c.|s.|h1"
f = "|s1|cA|b-|i-(%s)|b.|i.|c.|s."
g = "|s2|cB|l1|b+%s|b.|l.|c.|s.|h1|n2"
h = "|cB|fI|b-|i-[%s]|b.|i.|f.|c."
i = "|cA|l1|i+|b-%s|i.|b.|l.|c."
j = "|h1|s2|cZ|l1|b-|i-~ %s|b.|i.|l.|c.|s."
k = "|h1|s2|cA|l1|b-|i-× %s|b.|i.|l.|c.|s."
m = "|s1|cB|l1|b-|i-(%s)|b.|i.|l.|c.|s."
n = "|s1|cA|b-|i-(%s)|b.|i.|c.|s."
o = "|cA%s|c."
p = "|s3|cM|l1|b-|i+%s|i.|l.|c.|s.|b-|c. "
q = "|s3|cK|l1|b-|i+%s|i.|l.|c.|s.|b-|c. "
r = "|n2"
s = "|s1|cB|b-|i-(%s)|b.|i.|c.|s."
u = "|s2|cA|b+(%s)|b.|s.|c.|n2"
v = "|s3|cB|i+|b-%s|i.|b.|c.|s."
w = "|s3|cA|l1|b-|i+%s|i.|l.|c.|s.|b-|c. "
x = "|s1|cA|l1|b-|i-%s|l.|b.|i.|c.|s."
y = "|n2|d3|s3|cR|l1|b-|i-{%s}|b.|i.|l.|c.|s."
z = "|s1|cF|b-|i-(%s)|b.|i.|c.|s."
1 = "|l1%s|l."
#colo:
D = "7B-7B-7B"
K = "44-44-44"
F = "B8-87-FA"
M = "80-80-FF"
N = "96-B1-CF"
s = "97-A2-B9"
v = "80-00-80"
z = "17-60-68"
Uživatelské slovníky (typu 2; na typ 1 doporučuji zcela rezignovat, protože nemá rozsáhlé možnosti, kterými disponuje typ 2) se nacházejí v podadresáři data. Jsou to prosté textové soubory s příponou .udr. Editují se v textových editorech, nejlépe asi v Poznámkovém bloku (NotePadu) nebo v CodePadu. Do těchto souborů se vpisují (či z jiného souboru přes schránku kopírují) hesla. Hesla lze průběžně upravovat, doplňovat či vymazávat.
K editaci hesla stačí si osvojit cca 20 formátovacích značek a několik zásad, které tu budou vypsány; další přijde se cvikem. Nejlepší ale bude pro představu uvést nejdříve příklady hesel a pak teprve připojit výklady a pravidla.
Příklady hesla.
#intellego
<g.ere, intellexi, intellectum> <a.intelligo>
=<v.alqd> poznat, seznat, uvědomit si, zvědět, zjistit, postřehnout, spatřit, vidět, vnímat <v.co>
=<v.absol.> usuzovat, <n.rozumově> poznávat
=<v.alqd> chápat <v.co>, rozumět <v.čemu>, pochopit <v.co>
<p.intellege> rozuměj, to jest
=<v.alqd> rozumět <v.čemu> <n.slyšet> <z.DZ>
?loqutus (sic!) fuit submisse, ita quod ... non intellexit verba eius <f.Fournier I, 371> <z.smysl submisse ověřen>
=<v.alqd> znát, vědět <v.co>
=<v.alqd> být známo <v.komu>, mít ponětí <v.o čem>
?intellego = je mi známo
=<v.alqd> rozumět <v.čemu>, mít porozumění <v.pro co> <z.chtěl jsem uvést Vg., Ž 5,2, ale tam není kontext vůbec jednoznačný, ač ČEP zde mít porozumění udává; jako příklad nepoužitelné, najít jiný>
=<v.alqd> uvědomovat si, pociťovat, vnímat <v.co>
=pochopit, dovtípit se, usoudit, domyslet se, snadno se domyslet
=<v.alqd pro alqa re> chápat, rozumět, představovat si <v.co pod čím> <z.DZ>
?Et pro aqua intelligunt pisces, et pro ligno oleum. = Vodou rozumějí ryby a stromem olej. <f.Forma qualiter heretici hereticant hereticos suos; 13. stol.> <z.zde podle Thouz. Rit. 284>
=<v.alqm/alqd> mít na mysli, mínit <v.koho/co> <z.DZ>
?Interrogatus quid ipse intellexit quando dixit... = Na dotaz, co měl na mysli, když řekl... <f.Fournier I, 202>
=<v.alqm/alqd per alqm/alqd> mínit <v.koho/co kým/čím> <z.DZ podle Fournier I, 222 dole>
?Quid intellegis per bonos christianos? = Co/koho míníš těmi dobrými křesťany? <f.Fournier I, 222> <z.o kterých jsi mluvila>
=<v.alqd de alqa re> spojovat co s čím <n.v myšlenkách>, chápat <v.co> jako týkající se <v.čeho> / jako řečené <v.o čem> <z.DZ; lze chápat jako výpustku, takže dál sledovat a zvažovat zapracování pod jiný hesl. oddíl>
?Intellexit [verbum illud] de divitibus qui malo modo et iniusto suas divicias ... acquirunt. = Spojoval to [rozuměj: ten výrok] s bohatými, kteří nabývají svého bohatství zle a nespravedlivě. <f.Fournier I, 208>
<m.lze chápat jako výpustku: intellexit verbum illud dictum...>
=<v.alqd> uznat <v.co> <n.uznej přece, že...>
=<v.alqd> myslet si <v.co>, představovat si <v.co>
=<v.alqd> myslet <v.na co>, mít na srdci <v.co>, starat se <v.o co>
=<v.alqd> vzít si k srdci <v.co>
=<v.alqd> dokázat si představit, zbádat <v.co> <z."zbádat" DZ; sem by také asi patřil význam mít porozumění z Vg., Ž 5,2; nicméně tam je kontext zcela nejistý; to mít porozumění ještě zvážit, hledat příklady>
=<v.alqm> vyznat se <v.v kom>, umět správně odhadnout/posoudit <v.koho> <z.LMALB "vyznat se, umět správně ocenit"; na "odhadnout/posoudit" upravil DZ>
=<v.alqd> rozvážit, zvážit, uvážit <v.co>
=<v.alqd> posoudit <v.co>
<z.snad, DZ; význam "posoudit" ve zdrojích neudán, ale naznačeno: intellegere je dle LMALB úsudek. Zřejmě to někdy konotaci posouzení, zhodnocení má. A "rozvážit" nalezeno; valence DZ>
<z.viz TDH 315:38>
=<e.dare intellegere> vysvětlit, vyložit <z.DZ ex Fournier I, 282>; oznámit, dát vědět <z.LMALB?>
?Pontius Ramfredi dederat intelligi quod non poterat salvari nisi per eos <f.Parnac 257r> <z.nevím, zda by někt. ještě jiný význam nebyl vhodnější>
=<e.intellegere <m.subst.>> <x.v. t.>
<c.různé příklady>
?quando ... loquebantur aliquando de Evangeliis et Epistolis dicto Bernardo, semper dicebat eis quod aliter intelligebantur <f.Fournier I, 353> <z.to je snad něco jako "mají být chápány jinak", ač je užito obyč. impf.>
<z.var. intellig-: intelligunt: Forma qualiter... viz výše, a několik dalších příkladů výše; dokonce i intellixit - Liber, ed. Thouz., 378>
<z.Pražák, MLLM, LMALB, Vg., DZ; Vg. projito vše kromě deuterokanon. knih>
Abyste věděli, jak takové heslo vypadá po zobrazení ve slovníku, můžete se podívat na obrázek hesla intellego či hesla divisor.
Jiný příklad:
#regalia
<c.subst. n. pl. <e.regalia <i.orum, n. pl.>>>
insignie <n.zejm. královské, ale i biskupské, opatské apod.> <z.DZ; Rubin, CC, 173 o biskupských insigniích, opatské doplnil DZ podle shodnosti insignií biskupa a opata; MLLM ani Pražák nic>
<c.subst. f. sg. <e.regalia <i.ae, f.>>>
obročí královského kostela <z.MLLM sub regalia nic víc a skutečně uvádí f., ae doplnil DZ; Pražák nic>
Následují formátovací zásady, doplněné někdy i o obecnější zamyšlení nad lexikografií.
- Heslové slovo je označeno znakem „#“ (mřížka, napíše se nejrychleji AltGr+X). Příklad: #hello. Heslové slovo je na řádku samo. Na dalších řádcích za heslovým slovem následuje zbytek heslové stati. Heslové slovo by mělo být skutečně jedním slovem, ne víceslovným výrazem; LL je dělán pokud jde o základní strukturu jako knižní slovník, tj. jako propracovávaný zvlášť z obou stran a založený na hledání hesel (nikoli na hledání textových segmentů, ač má i propracované možnosti fulltextového vyhledávání, byť zatím z větší části nepřístupné pro uživatelské slovníky). Víceslovné výrazy by se měly zařazovat jako sublemmata, fráze či příklady do heslové stati (viz níže).
- Duplicity: ve slovníku by se neměla vyskytovat duplicitní heslová slova, jinak se při hledání najde jen to poslední v pořadí. Duplicity je třeba zjistit a přehlédnout. Při zjišťování je možné použít moje makra LingeaDuplicityVypsat a při jejich vyřazování může být vhodné mít slovník seřazený abecedně, k čemuž napomůže makro LingeaSeřaditAbecedně.
- Homonymie kontra polysémie: je třeba odlišovat slova homonymní od slov polysémických. Homonyma spolu nejsou etymologicky ani sémanticky spřízněná a jejich shoda je nahodilá a pouze formální. Naopak slova polysémická spolu etymologicky a sémanticky spřízněna jsou. Platí zde nadále zásady vypracované knižní lexikografií. Bylo by matoucí a chybné spojovat homonyma do jednoho hesla. Proto děláme hesla dvě (či i více, pokud je potřeba) a značím je po vzoru LL indexy 1, 2 atd., které předchází znak stříšky ^ (ten se nejsnadněji napíše ve většině editorů pomocí Ctrl+Alt+š, pak pustit a stisknout mezerník). Před stříšku dávám ještě mezeru. Takže shrnuto: mezera, stříška, číslo. Příklad: #ius ^1 právo... #ius ^2 ovocná šťáva. Naopak u heslových slov polysémických by bylo dělení na dvě či více hesel nepřípustným trháním sémantické struktury slova. Proto jsou uváděny v jednom hesle, a to dokonce i tehdy, když se vyskytují v podobě dvou sublemmat, které představují různý slovní druh (tak i LL 2002 en-cz). Nemalá část slov všech jazyků je polysémická. To je ve slovníku vyjádřeno především dělením na číslované významy. Pokud se heslo rozpadá na dvě sublemmata, tak je děleno do širších skupin než těch vyjádřených číslovanými významy; v mých databázích k tomu slouží značka <c.> (viz níže). Příklad: #vicinus <c.subst. <e.vicinus <i.a, um>>> sousední <c.subst. <e.vicinus <i.i, m.>>> soused.
- Hnízdování: hnízdování je uvádění odvozených (tedy mj. etymologicky a sémanticky spřízněných, ale tvarově nestejných) slov v hesle základního slova (např. umisťování slova vicinum, i, n. jako sublemmatu pod heslo vicinus). Od hnízdování ale moderní dvojjazyčná lexikografie upouští a rozhodně je nedoporučuji. Lze nicméně pod vicinus na vicinum odkázat. Pozn.: rozdíl oproti příkladu s vicinus, a, um a vicinus, i, m. je zřejmý: tam je slovo v základním tvaru shodné, a proto se nedělají samostatná hesla: udržení sémantické struktury tu není na překážku pohodlnému nalezení slova. Naopak hnízdování tvarově nestejných slov do hesla základního tvaru a jejich zpracovávání jen jako sublemmat (nikoli jako samostatných hesel) by takové překážky kladlo. Spolu proto uvádím jen tvary adjektiv v dalších rodech (femininum, neutrum) a zvratná slovesa. Lze zopakovat, že pokud se jeví jako vhodné provázat významově spjatá hesla, tak se to dělá odkazy (např. pod bonus odkáže na heslo bona, orum, m.), nikoli hnízdováním.
- Jednotlivá hesla musí dělit prázdný řádek. Prázdný řádek musí následovat i za posledním heslem v souboru.
- Heslová slova nemusejí být v souboru slovníku řazena abecedně. Lingea Lexiconu je to jedno. Abecední řazení pomáhá lexikografovi při orientaci, ale z hlediska LL není nutné.
- Morfematický šev: jeho vyznačování je trochu problém. Ani LL na ně není připraven a zamezilo by správnému nalezení. Takže rozhodně neuvádějte #travaill|eur <g.-euse> (ač by to pochopitelně bylo správnější), protože by se pak heslo nenašlo (samozřejmě není problém naprogramovat, aby program znak | v nitru heslového slova ignoroval, ale zatím se vývoj tímto směrem neubírá). Spíš je nutné se buď spolehnout na uživatelovu intuici a jeho znalosti a napsat #travailleur <g.-euse>, nebo uvést tvar celý: #travailleur <g.travailleuse>. První způsob je lepší na automatický převod do formátu pro LL z formátu jednoduššího (což je irelevantní, pokud heslo ve složitém formátu přímo tvoříte), druhý způsob je jednoznačnější. Doporučuji u v podstatě jasných a často se opakujících dávat zkrácený tvar, u složitějších a méně obvyklých dávat celé slovo. Je tu také možnost zavést speciální značku na kopii heslového slova s morfematickým švem a napsat např.: #travailleur [enter] <l.travaill|eur> <g.-euse>. Lze připomenout, že ve značkovacích jazycích se dá často nastavit neviditelnost a nulovou či velmi malou velikost, takže lze heslové slovo nechat neviditelné a na jeho místě nechat zobrazit právě obsah této značky, která uvádí heslové slovo včetně morfematického švu.
- Nemetajazykové součásti heslové stati nekrátím. Takže krátit se může geogr. atd. (samozřejmě je dobré, když jsou zkratky tvořeny po vzoru zavedených seznamů zkratek v dobrých slovnících a u slovníku by neměl seznam zkratek chybět), ale samotné fráze atd. ne. Takže pod heslem #for nekrátím příklad „for him“ na „f. him“ či na „~ him“, neboť by to dělalo problémy při fulltextovém hledání a převodech formátu (případně i převrácení směru), nýbrž vypíši celé „for him“ (ve shodě s LL). Krácení heslového slova v těle hesla, tak důležité v knižních slovnících, v elektronických slovnících, v podstatě rozsahově neomezených, ztrácí smysl a je kontraproduktivní. Jako uživatele mě zdržuje. Není pro něj důvod.
- Zalomení řádku: obecně platí, že zalomení řádku v uživatelském slovníku se promítne jako zalomení řádku i po zobrazení hesla, ale nefunguje to tak úplně vždy. Lepší je se spolehnout na definiční soubor. V mém definičním souboru zalomení nastavená jsou; pokud s nimi máte nějaké problémy, ozvěte se. Následuje text jen pro pokročilejší: v definičním souboru určuje zalomení značka |n1 apod. na konci definic (n1 vloží jedno zalomení, n2 dvě, n3 tři). Zalomení řádku je možné vkládat i před položku, jak jsem experimentálně zjistil: např.: před každým číslovaným významem vlož dvě zalomení řádků. V takovém případě se dá „|n1“ na začátek definice položky numb.
- Číslování významů: provádí se pomocí znaku „=“ na začátku každého odstavce obsahujícího samostatný heslový oddíl (srv. kvalitní knižní slovníky). Pokud má slovo jen jeden okruh významů, číslování se (stejně jako v knižních slovnících) nevkládá, takže se tam „=“nepíše. V hlavních slovnících lze počítání významů v určitém místě hesla vynulovat a začít od jedničky; v uživatelských slovnících to podle vyjádření technické podpory možné není.
- Běžné ekvivalenty v cílovém jazyce: píší se normálně, aniž by se uzavíraly do jakékoli speciální značky.
- Příklad a jeho překlad: příklad uvozuje znak „?“ na začátku odstavce. Pokud následuje i překlad příkladu, dělí jej od příkladu znak „=“ (bez zalomení řádku). Příklady by neměly suplovat jiné, špatně zpracované části hesla (např. valenci). Funkce příkladu: příklady jsou určeny k lepšímu pochopení spojitelnosti heslového slova s jinými lexikálními jednotkami, k ilustraci způsobu užívání, ke konkretizaci ne zcela jasného ekvivalentu v cílovém jazyce (ekvivalent „být známo komu“ rozvineme příkladem „je mi známo“), k uvádění citací ze slavných autorů a z pramenů vůbec (zejm. u slovníků mrtvých jazyků, ale ne nutně jen u nich) apod. Zvlášť u synsémantických (neplnovýznamových) slov (spojky, předložky...) je dobré dbát na hojné uvádění příkladů. Na příklad je také možné zavést samostatnou značku. V mém definičním souboru byla tomuto účelu vyhrazena značka <q.>.
- Obecná poznámka o potřebnosti členitého značkování: pro případný budoucí převod formátu či osobní uživatelskou změnu (třeba někomu vyhovuje, když se bude gramatická poznámka zobrazovat větším písmem či fialovou barvou apod.) je třeba, aby byl pokud možno každý typ části hesla označen jinou formátovací značkou: jinak je třeba označit kontextovou a vysvětlující poznámku, jinak tvary heslového slova, jinak opisný výklad, jinak sublemma, jinak mluvnickou charakteristiku atd.
- Značkování: mnoho částí hesla se formátuje pomocí značek (pro pokročilejší: tyto značky jsou definovány v definičním souboru a uživatel si je zde může definovat a předefinovávat). Značka má vždy podobu „<x.“, kde x je některé písmeno (písmeno s háčkem nebo čárkou použít nelze, ani samohlásku s čárkou jako ź apod., a některá písmena nejdou obsadit; zjistí se to experimentálně a kdyžtak se zvolí písmeno jiné; nelze také použít zvláštní znaky jako §, ale je možné, jak jsem zjistil pokusem, použít číslice od nuly do devítky, vyšší čísla ne), pak následují výrazy, které do příslušné části hesla patří, a segment je uzavřen znakem „>“. Jednotlivé značky nejsou libovolné a neměly by být vybírány během lexikografické práce ad hoc, je totiž dobré dbát na soudržnost a jednotu formátování slovníku (i nad rámec jednoho slovníku: ve všech slovnících, které tvoříme). Níže vyložím směs toho, co je obecnými zásadami v Lingeji, a toho, co jsem si určil jako normu já. Příklad: frázi bylo vyhrazeno písmeno p. Proto všechny fráze budou vypadat takto: <p.make a virtue of a necessity>. Za frází následuje její ekvivalent bez jakékoli značky: udělat z nouze ctnost. Takže celý odstavec vypadá takto: <p.make a virtue of a necessity> udělat z nouze ctnost. Pro pokročilejší: značky lze definovat a předefinovávat v definičním souboru. Je ale nutné myslet na to, že všichni, kdo budou vaše slovníky používat, musejí mít stejný definiční soubor jako vy. Doporučuji vyjít z mého definičního souboru v kterémkoli z balíčků a přizpůsobit své formátování zásadám vyloženým na této stránce.
- Důvody, proč užívat pro příslušné části hesla právě ty značky, které navrhuji níže: 1.) nemusíte si pracně vytvářet či přetvářet definiční soubor, stačí si jej stáhnout z těchto stránek a nechat jej tak, jak je, případně provést jen kosmetické změny, např. v barvách; 2.) můžete plynule navázat na mé databáze a doplňovat je vlastními jednotkami; 3.) nemusíte mít dva definiční soubory, jeden na databáze z těchto stránek, druhý na databáze svoje; 4.) dosáhne se jistého stupně normalizování; 5.) máte tak možnost využít moje makra ke stažení odsud (zejm. makra na automatizované a rychlé převody databází, např. sofistikované vytvoření slovníku opačného směru nikoli prostou inverzí, nýbrž hloubkovým zpracováním hesel).
- Možnost převodů značek: nemusíte se obávat užívání mých značek. Pomocí hromadného nahrazování ve Wordu lze značky během chvíle libovolně přehodit a dokument tak přeznačkovat, kdyby to kdykoli v budoucnu bylo z jakéhokoli důvodu potřeba. Lze jak např. změnit písmena pro jednotlivé součásti hesla, tak případně převést databázi do formátu zcela jiného, neurčeného pro LL (např. do XML).
- Převod databází do jazyka XML (pro velmi pokročilé): převod do XML řeší dvě moje wordovská makra: makro LingeaHTML převede slovník do HTML a SlovníkyHTMLdoXML převede z HTML do XML (moje makra si můžete stáhnout zde).
- Umístění poznámek: je třeba určit, zda přijde před nebo za ekvivalent. Obecně platí, že je nejlepší si vzít příklad z dobrého knižního slovníku. Liší se to do značné míry podle toho, zda je např. náš anglicko-český slovník kódovací (určený pro Angličany), nebo dekódovací (určený pro Čechy). Krátké stylové, diachronní a jiné charakteristiky bývají v dekódovacím slovníku často před ekvivalentem, naopak delší vysvětlující poznámky bývají častěji za ekvivalentem (v kódovacím slovníku však často před ekvivalentem). Příklad z dekódovacího slovníku: #hida <s.střv.> <d.anglosas.> lán <n.pozemek o rozloze 60-120 akrů>. Příklad z kódovacího slovníku: #koncept <n.předběžný nárys> brouillon <i.m.>.
- Užívání kontra neužívání závorek ve zdrojovém textu: určité typy poznámek bývají v závorkách. Většina typů – a vhodné je, aby to platilo vůbec o všech – se do závorek dává buď vždy, nebo nikdy, takže je dobré si ušetřit práci (a pročistit zdrojový text) tím, že se do zdrojového souboru nebudou závorky psát a že se nastaví v definičním souboru, aby se daný výraz dával do závorek automaticky. #hida <s.střv.> <d.anglosas.> lán <n.pozemek o rozloze 60-120 akrů>: všechny tři poznámky se zobrazí v závorkách, pokud v definičním souboru je: d = "|s1|cM|b-|i-(%s)|b.|i.|c.|s." a totéž u definice značky s a n. %s znamená vlastní výraz uzavřený v souboru uživatelského slovníku do dané značky; je-li %s uzavřeno v definičním souboru do závorek, znamená to, že se má každý výraz v dané značce automaticky zobrazit se závorkami. Já mám závorky u různých značek (např. b, d, f aj.; viz níže, jak se značky používají). Stejně jako se závorkami se pracuje s dalšími znaky. Příklad: když si chceme vytvořit značku na výslovnost, tak do definice příslušné značky v definičním souboru napíšeme [%s], čímž zařídíme, že bude výraz uzavřený do této značky po zobrazení v hranatých závorkách.
- Každé heslo je potřeba po dokončení zkontrolovat (nechat si ho zobrazit v LL) a pak ho v souboru uživatelského slovníku doopravit, pokud je třeba.
- Jeden odstavec nesmí překročit 209 znaků. Od 210[14] se LL 2002 – přinejmenším za určité konstelace – kouše, jakmile heslo s takovým řetězcem nalezne.[15] Je nutné se do těch 209 znaků vejít. Delší odstavce je třeba rozdělit do více. Nemusíte znaky přepočítávat, chybu totiž zjistíte jednoduše: když si pro kontrolu necháte heslo po jeho dokončení zobrazit a některý odstavec přesahuje kritickou mez, tak se LL havarijně ukončí. Podle toho víte, že máte některý odstavec dané heslové stati příliš dlouhý. Jindy se kouše už u cca 140 (zajímavé je, že zejména – jak se zdá – pokud je odstavec psán velkými písmeny). Je potřeba to vždy vyhledáním zkusit. Jde o velmi nepříjemné omezení.
- Odstavec heslového slova nesmí překročit délku 127 znaků.
- Délka heslové stati: zatím bohužel nemůže být v uživatelských slovnících neomezeně dlouhá; kritický bod je myslím někde kolem 4000 znaků mimo znaků konce řádku, na počtu odstavců nezávisí (což bylo vyzkoušeno na hesle o 100 velmi krátkých odstavcích).[16] Pokud některé heslo kteréhokoli uživatelského slovníku přesahuje tuto hladinu, dochází již při načítání slovníku k pádu aplikace. To je velmi vážný defekt; technická podpora na něj byla upozorněna. Dočasné řešení, než bude chyba odstraněna: rozdělit heslo: dát jeho část hesla do jiného, speciálně pro tyto kritické přesahy vytvořeného slovníkového souboru (.udr).
- Jak hledat problémy: pokud se aplikace kouše hned při spuštění, je problém v definičním souboru nebo délce některého hesla. Pokud až po nalezení hesla, tak je problém jen v některém odstavci tohoto hesla. Zobrazení zprávy o chybách může pomoci – může se poznat, kde se načítání kouslo (ale neplatí to přesně: poslední zde čitelné heslo vůbec nebývá to, u kterého došlo k problémům, dokonce bylo ověřeno, že může být i v jiném slovníku). Ale hlavně: překopírovat soubory slovníků do adresáře speciální testovací instalace LL, vylučovací metodou zjistit, v kterém je problém, a hledat v něm příliš dlouhá hesla skriptem lingea-kontrola-delky-odstavcu.vbs (ke stažení zde).
- Slovní spojení: ta je třeba rozdělit do několika skupin (jež jsou v lexikografické literatuře nazývány různě) a podle toho je také značit. Lze rozeznávat i velmi mnoho podskupin, ale jako postačující se jeví rozlišování čtyř druhů slovních spojení:
- Příklady jsou volná slovní spojení, která jsou uváděna kvůli lepšímu pochopení spojitelnosti heslového slova s jinými lexikálními jednotkami, ilustraci způsobu užívání, konkretizaci ne zcela jasného ekvivalentu v cílovém jazyce (ekvivalent „být známo komu“ rozvineme příkladem „je mi známo“), konkretizaci významu polysémického ekvivalentu, uvádění citací ze slavných autorů a z pramenů vůbec (zejm. u slovníků mrtvých jazyků, ale ne nutně jen u nich) apod.; mnohdy také jde o argumentační nástroj, že dané slovo skutečně příslušný význam má, zejména u neologismů či významů, které v jiných běžně dostupných slovnících nefigurují. K uvádění příkladů se užívá v LL schéma „? [text ve výchozím jazyce]“ a pokud následuje překlad, uvádí se za rovnítkem (viz výše); např. ?Is everything all right? = Je všechno v pořádku?. Každý příklad je na samostatném řádku. Příklad je vhodné doplnit údajem o jeho zdroji, buď ve značce <z.>, nebo <f.> (viz níže).
- Frazémem (popř. frází) lze nazvat ustálená užití, obvykle slovní spojení, jejichž součástí je heslové slovo (ale někdy jde i o jednoslovné výrazy: „see“ = viz), které se zde vyskytuje v některém z významů zachycených ekvivalenty. Právě pod danou skupinu ekvivalentů frázi zařadíme. Např. pod ekvivalent „obchod“ heslového slova „traite“ zařadíme frazém <p.traite des blanches> obchod s bílým masem. Frazém značím p. Každý frazém se dává na samostatný řádek. Frazém není dobré nahrazovat příkladem; je třeba jej uvést, a to v základním tvaru (u sloves infinitiv apod.) a včetně případné valence. Lze k němu ale samozřejmě podle uvážení připojit i exemplifikaci, nejlépe na bezprostředně následující řádek (přesněji odstavec).
- Lexikalizované slovní spojení je výraz, který nepatří pod určitou skupinu ekvivalentů (nebo tam náleží jen velmi vágně), neboť v něm heslové slovo svůj původní význam v podstatě či vůbec nemá; jde spíše o samostatnou jednotku. Např. „heavy metal“ není vhodné řadit jako frázi pod význam „těžký...“, lepší je to uvést jako samostatné lexikalizované slovní spojení (nikoli však samostatné heslo, alespoň ve slovnících zaměřených primárně na heslové hledání, jakým LL je). Značím e – stejně jako sublemma (po vzoru LL). Příklad: =<e.heavy metal> heavy metal.
- Sousloví, které uvádíme v základním tvaru, ale které nelze považovat za ustálené: značím w. K takovému uvedení můžeme mít různé důvody, např. stručnost a přehlednost (větší než při uvádění veškerých spojení v podobě příkladů – citací z textů – v určitém tvaru a s širším kontextem). Je třeba dobře zvážit, kdy uvést příklad a kdy takovéto sousloví převedené do základního tvaru. Velmi pomáhá mít přístup k dostatečně rozsáhlému a vyváženému korpusu, kde je možné si ověřit ustálenost či neustálenost daného spojení. Je třeba určit jistou frekvenční hranici mezi <p.> a <w.> (s přihlédnutím k velikosti a vyváženosti korpusu);[17] tato hranice bude ovšem spíš orientačním vodítkem, které není nutné respektovat mechanicky. Pozn.: Zvlášť ve slovnících mrtvých jazyků, kde se jako příklady uvádějí takřka výhradně přesné citace z textů, je vhodné tento druh spojení od příkladů odlišovat. Ve slovnících živých jazyků značka w prakticky nemá použití.
- Uvedené typy částí hesla se pochopitelně mohou poněkud překrývat a jejich rozlišení může být v některých případech subjektivní a nejednoznačné, ale stojí za to je uvážlivě rozlišovat. Je zřejmé, že sousloví, které je v jednom hesle frází, může být v jiném příkladem: např. de iure (po právu, podle práva) je pod ius (právo) frází, kdežto pod de je spíše příkladem, ilustrací jednoho z významů latinské předložky de (konkrétně významu „podle čeho, ve shodě s čím“).
- Příklad u jazyků, jejichž fonty používají rovnítko pro některý znak: u těch užití klasického typu příkladu (? ... = ...) působí problémy. Proto byla zavedena v mém definičním souboru speciální značka klasického typu: značím q. Se značkou q se pracuje technicky přesně stejně jako se značkou p a význam má zase přesně stejný jako běžná syntaxe příkladu (? ... = ...). Těm, kteří chtějí docílit snadnější převoditelnosti do jiného formátu a vyhnout se některým zobrazovacím chybám, doporučuji v databázích vůbec neužívat běžnou syntaxi, nýbrž právě značku q. Příklad: <q.i(/statai o( pro/kritos tw=n a)sebw=n> <f.Euth. Akm. 77>.
- Výslovnost (fonetický parametr): značím h a tak je značka určená v definičním souboru z těchto stránek, takže pokud ho používáte, je vše jednoduché. Dávám ještě před případnou značku <g.>, hned za heslové slovo (ovšem na nový řádek). Aplikuje se obvyklým způsobem, za použití špičatých závorek. Výrazy nedávejte do hranatých závorek; budou do nich dány automaticky.[18] Fonetická abeceda LL: malá písmena se kryjí, velká písmena odpovídají speciálním znakům (viz níže), dvojtečka je dloužení, apostrof je hlavní přízvuk, čárka je vedlejší přízvuk (zkopírujte si pod některé testovací heslo v některém ze slovníků z těchto stránek následující text: <h.',: ACDEFHINOQRSTUVZ abcdefghijklmnopqrstuvwxyz \pag\pew\piv\pog\puv\pcv\pov\pex\pel\pRc\pnh\por\pou\poh\phi>, nechejte si toto heslo Lingea Lexiconem vyhledat a hned uvidíte, co co znamená). Příklad: #abat-jour <h.abaZur> <g.m.>, #brun <h.b\pRc\pov>. Kódy užívané fonetickou abecedou LL (potřebné např. pro přepis francouzštiny) jsou následující:
a s vlnkou[19] \pag
e s vlnkou \pew
i s vlnkou \piv
o s vlnkou \pog
u s vlnkou \puv
„obrácené c“ s vlnkou \pcv (pro nosové otevřené o)
oe s vlnkou \pov
epsilon \pel
epsilon s vlnkou \pex
velké R \pRc
n s ocáskem na pravé nožce N
n s ocáskem na levé nožce (pro „ň“) \pnh
překlopené h \phi (např. ve francouzském lui)
fí \por
přeškrtnuté o \poh
œ \pou[20]
- Fonty cizích abeced: LL 2002 neumí užívat v rámci heslové stati různé fonty, takže pro slovníky jazyků užívajících nelatinských abeced zatím není vhodný, ale pro další verzi bylo navrženo toto rozšíření. Doporučuji i v případě vytváření takových slovníků tvořit databázi v podobě pro Lingea Lexicon a do jiných formátů, např. HTML, je jen převádět.
- Vnořené značky: lze je bez problémů používat a je to velmi vhodné až nutné jednak z grafických důvodů – aby se to správně zobrazilo – jednak z důvodů systémových. Lze vnořovat i několikanásobně. Příklad: <c.subst. <e.vicinus <i.a, um>>>.
- Další tvary slova v záhlaví hesla a substantivní rod: značím g. Např.: #intellego <g.ere, lexi, lectum>, #abords <g.m. pl.>, #travailleur <g.-euse>, #almorzar <g.ue>. Dávám na samostatný řádek těsně za řádek heslového slova. Pro pokročilejší: viz některé problémy, zejm. se zalamováním řádku, v oddíle o definičním souboru pod zpracováním podsekce item (a zejm. tam uvedenou poznámku pod čarou). Pokud vám to vyhovuje, je možné užívat různou značku pro tvary a pro rod. Např. si můžete mou definici r v definičním souboru (určenou pro pomocné zalomení řádku) přiřadit některé volné číslici a do r definovat rod.
- Tvary a rody v nitru heslové stati: značím i. Do této kategorie – kterou je potřeba odlišovat od tvarů v záhlaví hesla, těsně přiléhajících k heslovému slovu – patří zejména rody ekvivalentů v cílovém jazyce a tvary a rody sublemmat. Příklad: #okolí [enter] abords <i.m. pl.> nebo <c.subst. <e.vicinus <i.i, m.>>>. Obecně platí tyto zásady: a) u sublemmat je dobré tvary uvádět tehdy, když nejsou shodné s tvary ve značce <g.> nebo když tvary ve značce <g.> nejsou vůbec u daného hesla uvedeny (např. z toho důvodu, že tvary přísluší jen některému sublemmatu nebo existují tvary dvojí: #behold <c.sloveso <e.behold <i.beheld, beheld>>> spatřit <c.částice> hle; jiný příklad: #vicinus <c.adj. <e.vicinus <i.a, um>>> sousední <c.subst. <e.vicinus <i.i, m.>>> soused); b) u frází se obvykle tvary neuvádějí, protože se od tvarů základního slova neliší (kdyby se lišily, měla by totiž být fráze zařazena pod sublemma a příslušné tvary by byly uvedeny u tohoto sublemmatu); c) u příkladů se tvary neuvádějí (příklad nesupluje jiné části hesla: pokud se tvary liší, nelze to sdělovat příkladem, nýbrž sublemmatem, a pokud se to sdělí sublemmatem, tak už není nutné to opakovat u příkladů); d) uvádění tvarů, zejm. rodů, u slov v cílovém jazyce je věc sporná a lexikograf si musí ujasnit, pro koho je daný slovník určen: pokud je jeho latinsko-český slovník určen Čechům, a nikoli latinsky mluvícímu obyvatelstvu (což lze s jistotou předpokládat), tak není třeba české tvary a rody uvádět, neboť s touto částí hesla bude pracovat rodilý mluvčí (jen je teoreticky možné uvést pro úplnost tvary u slov „nepravidelných“ či v češtině málo zdomácnělých, ale i to je v tomto případě spíš nadbytečné); naopak pokud jde o slovník dvou živých jazyků, je vždycky lepší uvádět tvary i v cílovém jazyce, protože např. s francouzsko-českým slovníkem mohou pracovat i Francouzi pro překlad do češtiny (údaj o rodu českého ekvivalentu je pro ně zásadní, protože nejsou čeští rodilí mluvčí a užívají francouzsko-český slovník zcela jinak, než jak ho užívá Čech: k zakódování do češtiny, nikoli k dekódování francouzštiny). Nicméně to pochopitelně zabírá čas. Čili je třeba zvážit jednak cílové publikum (Francouzů překládajících do češtiny bude přece jen poměrně málo, jiná bude ovšem situace u vypracovávání slovníku anglicko-německého), jednak své časové možnosti. Ale jak bylo řečeno, pokud je to možné, je vždy lepší uvádět i tvary a rody cílového jazyka.
- Jiné užívané podoby slova: značím a. Např.: #prehendo [enter] <g.ere, hendi, hensum> <a.prendo <i.ere, prendi, prensum>, prindo>.
- Skupiny dělící heslo na části: značím c a píši bez závorek. Jde o značku určenou k dělení významů slova do skupin; např. tak lze dělit heslo do různých slovních druhů nebo na část vztahující se k neosobnímu a osobnímu užití slovesa, k užití přechodovému a nepřechodovému atd. Příklad: #regalia <c.subst. n. pl. <e.regalia <i.orum, n.>>> ... <c.subst. f. sg. <e.regalia <i.ae, f.>>>. Zejména dlouhá hesla lze také dělit do skupin podle sémantických kritérií, nejlépe za použití <c.I>, <c.II> atd. či dokonce nějakého dobře formulovaného společného sémantického rysu dané skupiny heslových oddílů (to ovšem nebývá tak snadné, takže značení římskými číslicemi je asi nejdostupnějším řešením).
- Ekvivalenty v cílovém jazyce: uvádějí se bez zvláštní značky. Na řádek pochopitelně mohou (a měly by) být umístěny také další součásti jako stylová charakteristika, valence, případně kontextová a vysvětlující poznámka apod. Příklad: =<s.hovor.> být v balíku; jiný příklad: =řada, četa, šik, setnina, nebo: =<v.alqm> proti <v.komu>, na úkor <v.koho>. Rovnítko zapíná pro daný odstavec číslování významů. Pokud má heslo jen jeden heslový oddíl, rovnítko se nepoužívá.
- Kontextová a vysvětlující poznámka v cílovém jazyce: značím n. Poznámka určená na různá věcná a kontextová vysvětlení: „časově“, „účelově“ atd. Příklady dalších údajů uzavíraných do značky <n.>: zkr., spec., v šir. smyslu, žert., iron. (což jsou skutečně charakteristiky kontextové, nikoli stylové) apod. Příklady: =zásobování <n.i spec. pro povinné odvádění potravin, k němuž je území zavázáno>; nebo: svěcený chléb <n.rozdávaný na konci mše, odlišný od eucharistie>; nebo: =<n.příčinně> neboť, poněvadž. Ty poznámky, které obsahují spíše informace a termíny rázu gramatického než věcného, formátuji jako poznámky mluvnické <m.> (viz níže), byť se z jistého hlediska může jednat o poznámky kontextové; např. =<m.u subst., adj., zájm.> jako.
- Opisný výklad: značím o. Např.: #fraterna <g.ae, f.> <o.domácnost, v níž žijí společně sourozenci a jejich rodiny>. Jiný příklad: =<e.Maius> <o.starolatinský bůh, ochránce růstu>. Je třeba odlišovat od kontextové a vysvětlující poznámky; ta doprovází ekvivalent, kdežto opisný výklad se užívá tam, kde lexikograf ekvivalent neuvádí (obvykle proto, že vhodný ekvivalent nenalezl, někdy proto, že je totožný s heslovým slovem či sublemmatem, např. u osobních jmen), jako jeho náhrada. Rozdíl ekvivalentu a opisného výkladu je jasný: ekvivalent je to, co lze obvykle užít při překladu, kdežto opisný výklad dává tomu, kdo text interpretuje, pouze představu, o co se jedná. Opisný výklad se často užívá také u geografických a jiných jmen, kde se tvarově kryje heslové slovo s ekvivalentem: #Almo [enter] <o.potok vlévající se jižně od Říma do Tiberu >.
- Sublemma: značím e. Např. pod servitium se napíše sublemma Domini servitium; celý řádek pak vypadá takto: =<e.Domini/Dei/dominicum servitium> zbožný život, služba Boží. Pokud má sublemma více významů, uvádím je na témže řádku, ale dělené středníkem. Speciálním případem sublemmatu je to, které se vztahuje k celé podskupině hesla (kterou značím c): k tomu se nevztahuje pravidlo o uvádění na témže řádku.[21] Sublemmata většinou dávám na konec hesla, ale pokud je dané sublemma spjato více s některou skupinou významů, tak je přiřazuji k ní.
- Celková gramatická charakteristika slova: určení slovního druhu a případně celkové valence. Značím u. Příklad: <u.předl. s ak./abl.>.
- Mluvnická poznámka: značím m. Určeno pro údaje jako: trans., intr. apod. Např.: <m.jen s životným podmětem>. Nebo: =<m.subst. indecl.> úsudek [enter] =<m.sloveso> <x.viz intellego> (používám tedy i k rozluce významů podle slovních druhů tam, kde na to nepoužívám skupiny <c.>).
- Stylový příznak a diachronní charakteristika: značím s. Do této kategorie spadá mj. údaj o jazykové úrovni a časová charakteristika, např. skutečnost, že dané slovo pochází ze středověku či že je lidovělatinské (příklady údajů, které opatřuji touto značkou: arch., kniž., mod., neol., klas. lat., lid. lat., střv., data nejstaršího dosvědčeného výskytu slova aj., a také err.). Uvážil jsem, že stylový příznak a diachronní charakteristika v široké míře splývají (zvlášť vzhledem k tomu, že poznámky jako žert. apod. jsou poznámky kontextové a vysvětlující, nikoli stylové). Proto jsem diachronní a stylovou charakteristiku nevytvořil samostatné značky, ale jsem otevřen připomínkám a argumentaci proti této volbě. Příklad: =<s.zř.> přijít <v.ke komu/čemu>.
- Údaj o geografické omezenosti výskytu, o nářečnosti a o původu přejatého slova: značím d. Příklad: #hida [enter] <d.anglosas.> lán. Pokud se to sejde s jinými charakteristikami dávanými před ekvivalent, je důležité, aby byly obě uvedeny v samostatných značkách a samostatných závorkách: <s.střv.> <d.anglosas.> lán. U místních názvů se údaj o geografické omezenosti obvykle nevyznačuje, ač jsou třeba užívány jen na daném území, leda snad podle lexikografova uvážení jako nástroj pro rozluku dvou významů: #Novumcastrum =<b.geogr.> <d.anglosas.> Newcastle =<b.geogr.> <d.bohem.> Nové hrady, ale vždy je třeba zvážit, zda takováto rozluka nezkresluje realitu (resp. zda máme údaj o omezenosti dobře ověřen), zda je účelná a zda není vhodnější spíš užít vysvětlující poznámku uvádějící, kde leží daná lokalita, popřípadě se spolehnout pouze na jednoznačnost ekvivalentu.
- Údaj o odvětví či oboru, v němž se dané slovo či daný význam užívá: značím b a dávám údaj před ekvivalent, a to jak pokud uvádím jen jeden význam, tak pokud se údaj o odvětví či významové oblasti vztahuje jen k některému z uvedených významu (to jej pak píši těsně za rovnítko zapínající číslování významů). Např. #Glastonia <b.geogr.> Glastonbury. Příklady údajů patřících do této poznámky: geogr., círk., náb., ekon., inform., fil., jaz., lék., mat. aj.
- Údaj o zdroji zpracování: (DZ, ak. sl. apod.); značím z. (zdroj). Čím přesněji a soustavněji se zdroj uvádí, tím lépe. Příklad: <z.MLLM, DZ>. Pomocí <z.> značím také vyjádření míry nejistoty (která je pochopitelně s pramenem zpracování nedílně spjatá). Např. <z.a snad také, soudě podle MLLM> počastování. Touto značkou také formátuji nejrůznější soukromé či polosoukromé poznámky typu „ještě ověřit“, „není to náhodou chyba?“ apod. Pokud připravujete svůj slovník jako oficiálnější produkt a nechcete v něm nechávat soukromé poznámky, tak je můžete v konečné redakci vymazat, nejlépe automatizovaně za použití jednoho z mých maker VymazatŘetězecVymezenýZnačkamiZadanýmiUživatelem stáhnutelným odtud, ovšem pouze v kopii zdrojového dokumentu: v soukromé lexikografově verzi by tyto poznámky měly nadále zůstat, protože bude ve své práci pokračovat a tyto poznámky jsou pro něj nedocenitelné. Pokud neumíte pracovat s makry a nechcete se to učit, a přesto byste chtěli soukromé poznámky odstranit, obraťte se na mě (a uveďte, zda pro ně užíváte značku <z.>, nebo některou jinou).
- Údaj o prameni, ze kterého pochází citace: značím f. (fons) a pramen dávám do závorek. Často bývá u příkladů, někdy i u frází, zejména pokud jsou specifické a lexikograf míní, že jsou poměrně málo rozšířené a uvedení je tedy vhodné (popř. vůbec pokud je odkázání na pramen z nějakého důvodu užitečné či zajímavé). Příklad: ?Constituenda est ergo nobis dominici scola servitii. <f.Regula Benedicti, Prologus, 45>. Čím je odkaz úplnější, tím lépe. Ke slovníku by se měl přikládat v samostatném dokumentu seznam zkratek pramenů, kde by měly být uvedeny konkrétní edice, s nimiž lexikograf pracoval; viz např. seznam zkratek zde.
- Údaj o valenci: značím v. Jak valenci výchozího jazyka, tak jazyka cílového značím stejně. Do valence patří též údaj absol. (absolutní užití, bez předmětu). Pokud se valence ve zdrojovém jazyce pro jednotlivé významy liší, uvádí se vždy na začátku jednotlivých číslovaných významů. Např.: =<v.in alqa re> vězet, pevně tkvít <v.v čem>. Pokud udávám pád, se kterým se dané slovo pojí, píši ho do značky valence bez dalších poznámek (např. u předložek: #in <v.abl.> v <v.kom/čem>, čti: „in“ má ve spojení s ablativem význam „v (kom/čem)“). Lepší je nicméně uvádět pádové otázky či neurčitá zájmena (to podle lexikografických zvyklostí v daném jazyce), protože ty jednak rozliší, zda je slovo spojitelné s věcí i s osobou, jen věcí, jen osobou, jednak je to zavedenější. V češtině se obvykle ve slovnících uvádí tázací zájmena, nikoli neurčitá (proto dáme <v.koho/co>, nikoli <v.někoho/něco>). Valence u fráze:uzavírám ji ještě do značky fráze: <p.<v.alci> penitentiam iniungere> uložit pokání <v.komu>. Má to své grafické výhody a také v případě případného budoucího celkového přechodu na nesegmentovou značku fráze to takto bude i snáze převoditelné. Také u sublemmatu valenci výchozího jazyka píši ještě do segmentu sublemmatu: <e.iuxta illud <v.alcis rei>> podle slov <v.čeho> <n.evangelia apod.>. Jak valence ve zdrojovém jazyce, tak valence v jazyce cílovém je uváděna bez závorek a důsledně ve zvláštní značce <v.>. Valence ve zdrojovém jazyce stojí před ekvivalentem, valence v cílovém jazyce se přizpůsobuje běžnému uspořádání syntagmatu obsahujícího ekvivalent (toto vše mj. po vzoru LL, viz např. heslo stand v anglicko-českém slovníku). Ve slovnících, kde lze s jistotou očekávat rodilého mluvčího v jednom určitém směru, kdežto v druhém nikoli (např. u latinsko-českého slovníku určeného pro Čechy), není systematické uvádění valence v mateřském jazyce předpokládaných uživatelů (v našem případě valence českých ekvivalentů latinských heslových slov) zcela nutné; pokud je úplně jasná a nijak nekonkretizuje a nevyjasňuje význam, může se vynechávat, ač je samozřejmě vždycky lepší ji uvádět. Do značek valence uzavírám valenci jako celek, tj. včetně předložky (mj. po vzoru LL): dávat si pozor <v.na koho/co> (jinak je tomu ovšem u hesel předložek, kde je česká předložka ekvivalentem, nikoli součástí valence). Další možnou, ale ne nutnou valenci dávám do závorek: =<v.alqd (ab alqo)> slyšet, zaslechnout <v.co (od koho)>.
- Odkaz na jiné heslo: značím x. Např.: =<x.viz intellego>.
- Značka pro text v nelatinském fontu: značím 1. LL 2002 ještě neumožňuje formátovat jednotlivé části heslové stati různým fontem, ale já už si přesto vedu řeckou databázi pro LL a zavedl jsem si značku 1 (jedna) pro části hesla, které jsou sice obsažené ve značce formátované výchozím fontem, ale samy by měly být, až bude LL tuto možnost nabízet, zformátovány fontem cizího jazyka, např. řeckým fontem SPIonic (ten se pak nastaví do této značky, až to půjde). Příklad: <x.viz <1.w(/j>>. Účel je ten, aby se to nemuselo potom dodělávat, popř. aby se některé výskyty (ty, které k tomu jsou z formálních důvodů zvlášť náchylné) při ručním dodělávání nepřehlédly. Těm z vás, kdo už si vedou lingeovské databáze jazyků užívajících nelatinských abeced, doporučuji užívání zvláštní značky také. Např. u frází apod. ji není nutné užívat, neboť tam bude rovněž nastaven cizojazyčný font pro celou značku <p.>; je určena jen pro např. řecké části ve značce s jinak českým obsahem. Sama má jen atribut lang (aby se při poklepání hledalo ve správném směru) a bude mít časem atribut font; ostatní charakteristiky bude přebírat od nadřazené značky, do níž bude vnořena (v uvedeném příkladu od značky <x.>). Pokud nemáte nouzi o značky a chcete postupovat podobně u jiného nelatinského písma než řeckého, doporučuji obsazovat další číslice (nepoužívat jedničku). U valence by měla být jednička podřazenou značkou, ne nadřazenou, tj. <v.<1.ti>>, nikoli *<1.<v.ti>>. To vlastně platí u všech užití: jednička je podřazenou značkou.
- Možná je dobré vyhradit konkrétní čísla na konkrétní abecedy, kvůli slovníkům, které užívají i více fontů než dva (např. staroslověnský slovník uvádějící řecké etymologie, ale mající pochopitelně staroslověnské složky hesla cyrilicí a ekvivalenty latinkou), nebo také proto, aby bylo možné užívat stejný stylopis pro všechny slovníky (což je z praktických důvodů provádění aktualizací dost výhodné). Proto doporučuji 0 pro latinkový font, 1 pro starořecký font, 2 pro cyrilici, 3 pro azbuku.
- Zatím neřeším moderní řečtinu a azbuku; ty jsou dobře podporované kódováním a bylo by myslím jednoznačně vhodnější neužívat pro moderní řečtinu a azbuku speciální font, nýbrž správné znaky UNICODE. Chce to jen editor, který podporuje i kódování UTF-8, např. jEdit nebo Poznámkový blok (přinejmenším jeho novější verze), a platformu, která to zvládne, např. PEKI (Lingea Lexicon 2002 to nezvládne – ověřeno na souboru uloženém v UTF-8).
- Samozřejmě že pokud některý lexikograf shledá, že v tomto systému nemá už volnou značku např. na font korejský, a ví, že řečtinu nepotřebuje, tak si značku 1 předefinuje podle libosti.
- Text v latince v rámci textu v nelatinském fontu: značím 0 (např.: <g.do/cw<0./>doke/sw>). Tato značka v součinnosti s definičním souborem určí, že se má dané lomítko mezi dvěma alternativními tvary zformátovat latinkou (až to bude LL umožňovat, popřípadě v jiných formátech, např. HTML), a nikoli řeckým fontem jako běžný obsah značky <g.> (v řeckých fontech bývá lomítko vyhrazeno pro ostrý přízvuk, proto je tento postup nutný). Obecně platí, že kde to jde, dělám alternativu v řeckém textu (a obecně v jazycích, jejichž nejobvyklejší fonty si lomítko vyhrazují pro nějaký zvláštní znak) ne lomítkem, ale čárkou. Nicméně tam, kde by to působilo byť i sebemenší nejasnost, užívám <0./>. Dále se značka <0.> hodí například pro závorku značící alternativně doplnitelnou valenci: například <v.<1.ti <0.(>ti/, poi=on<0.)>>>. Tyto detaily nejsou tak zbytečné, jak vypadají. Vzniká tím jednoznačný zápis, který bude po dodání přiřazení fontů značkám v LL a který je při převodech do jiných formátů (HTML, XML atd.) nedocenitelný.
- Kurzíva: značím K (velké K).
- Synonyma a antonyma: pokud je uvádíte, tak by také měla mít své vlastní značky. Synonyma značím j, antonyma X, a v definičním v definičním souboru z těchto stránek pro ně byly tyto značkydefinovány. Pozn.: LL uvádí synonyma jinak: ne do těla hesla, nýbrž do skupin synonym podobných „tématům“. Provádí tedy vlastně prostou asociaci vícera heslových slov. To je dost nešťastný postup, poněvadž synonymie a antonymie se ve většině případů vztahuje pouze k některému (některým) z významů slova, a synonymum či antonymum by tedy mělo být jen u něj. Proto je výhodné psát synonyma do těla hesla, přímo tam, kam patří.
- Homonyma a slova či sousloví, u kterých chceme upozornit, že nemají stejný význam jako daná jednotka či s ní nejsou totožné: značím k (kontra).
- Etymologie slova: pokud ji uvádíte, měla by mít vlastní značku. V mém definičním souboru byla etymologii určena značka y. Příklad: <y.eu + logos> <d.řec.>, popř. ještě lépe i se značkou jedničky pro aplikaci řeckého fontu (viz níže): <y.<1.pelagos>> <d.řec.>. Etymologii dávám na konec hesla; jejímu umisťování na začátek klade trochu překážky – hlavně pokud jde o zalamování řádků – skutečnost, že v uživatelských slovnících t. č. nelze aplikovat definice vyšších celků seskupujících více značek či více částí hesla (v tomto případě celek head). Ostatně možná je umístění dole i šikovnější.
- Volné značky, do nichž si můžete bez problémů definovat, co potřebujete: následující značky nyní nejsou používány v mých databázích a v definičním souboru a můžete je bez škody na zobrazení mých databází vyhradit tomu, čemu chcete, a nadefinovat je, jak potřebujete: všechna velká písmena kromě B, K, X, a kromě toho jsou volné ještě: l, t, číslice 2-9 (ale l a t patrně definovat nejde); také I nejde definovat – je asi vyhrazeno pro spodní index. Doporučuje se přednostně obsazovat ty zcela neobsazené, protože to vám umožní používat můj definiční soubor user.udf i pro své slovníky a pouze ho rozšiřovat. Číslo 2 plánuji vyhradit pro font cyrilice. Písmena s háčky a čárkami obsadit nejdou a vyšší čísla než 9 také ne. Kombinace více písmen také nejdou používat (obsah se zformátuje tak, jako by značku tvořilo jen první písmeno, tj. např. <freq.17> se zobrazí podle definic značky <f.>, ne podle přiřazených definic, a navíc se všechny znaky včetně tečky zobrazí ve slovníku, jako by se jednalo o obsah značky). Lze tedy konstatovat, že formátování pro LL 2002 nemá dostatečné možnosti rozšiřitelnosti; jelikož rozlišuje velikost písmen, tak lze počet značek považovat za celkem dostačující, byť bohužel nerozšiřitelný, přinejmenším zatím).
- Přechod na jiné značky je s pokročilým nahrazováním, zejm. ve Wordu, dost snadný, kdyby jej bylo v kterékoli fázi práce třeba (samozřejmě pokud jde jen o proházení písmen přiřazených jednotlivým značkám; jinak je to složitější, ale ne nemožné). Ani přechod na jiné značkovací jazyky není neproveditelný, pokud je značkování a uspořádání hesla jednotné. Například už jsem vypracoval převod mé zde vyložené verze formátování pro LL do HTML a do XML.
- Logické nebo: značím po vzoru LL, ale i některých kvalitních knižních slovníků,[22] lomítkem (a nikoli zkratkou „n.“). Když se „nebo“ vztahuje k bezprostředně sousedícím slovům, tak nepíši vedle lomítka mezery, když k širšímu syntagmatu, tak dávám mezery po obou stranách lomítka (LL to uvádí nejednotně, ale já to pokud možno dodržuji takto, a to jak u ekvivalentů, tak u valence atd.). Příklad: vezmu si dobrá jablka/hrušky znamená „vezmu si dobrá jablka nebo vezmu si dobré hrušky“, kdežto vezmu si dobrá jablka / hrušky znamená „vezmu si dobrá jablka nebo vezmu si hrušky“ (z čistě formálního hlediska není tento druhý příklad úplně jednoznačný, protože neudává přesně šev alternativy, ale ve většině případů se lze spolehnout na inteligenci uživatele, který je obvykle schopen určit, kde šev alternativy hledat; v případě, že by měla vzniknout nejednoznačnost, zopakujeme raději celé syntagma).
- Užívání lomítka pro zápis významově vzdálených výrazů na jeden řádek: LL lomítka užívá, podle mého soudu dost nevhodně, ke zkrácenému zápisu různých ustálených spojení, které netvoří sémantickou jednotu a nejsou synonymní či přinejmenším spřízněné, na jeden řádek. To rozhodně nedoporučuji. Má to své docela přijatelné podoby – tam, kde významy souvisejí, např. pod heslo heavy lze dát heavy rain/snowfall = hustý déšť / silné sněžení. Ani to ovšem nedoporučuji. Každé ustálené spojení kromě synonymních by mělo mít vlastní řádek.
- Závorka: tu obecně užívám – samozřejmě vedle jejího užití jako grafického znaku poznámek různého druhu – ne na člen alternativy, nýbrž na člen, který je možné doplnit. Proto „své (drahé) Marii“ je třeba číst „své Marii nebo své drahé Marii“, kdežto „své/drahé Marii“ se přečte „své Marii nebo drahé Marii“.
- Další informace o doporučených konvenčních značkách a zkratkách uvádí Seznam zkratek.
- Pokud máte zájem o kvalitní počítačovou lexikografii, napište mi na adresu david.zbiral@post.cz. Uvítám také upozornění na projekty, na kterých pracujete či do kterých byste měli v úmyslu se pustit.
Tyto zásady zachycují ideální stav. Zdaleka nejsou všude v mých databázích dodrženy (zvlášť v těch částech, které pocházejí ze starší doby, je po nich nějaká stopa jen tu a tam).
Kontrola hesla. Pokud provedete nějakou úpravu v některém hesle uživatelského slovníku, je dobré ověřit, jak výsledek vypadá po zobrazení v LL, tj. si dané heslo nechat vyhledat. Za tím účelem je třeba uživatelský slovník znovu načíst. To uděláte buď opětovným spuštěním LL, nebo novým zvolením slovníku v LL pod nabídkou Soubor. Pokud chcete ověřovat změny v definičním souboru, nové zvolení nestačí; je nutné opětovné spuštění programu.
V jakém editoru heslo psát a upravovat? Bezproblémové je psát uživatelský slovník v Poznámkovém bloku a do něj heslo vpisovat či kopírovat odjinud (např. z Wordu). Spíše nedoporučuji uživatelský slovník ve Wordu či v 602Textu přímo otvírat, ale klidně hesla ve Wordu či 602Textu pište a do slovníku otevřeného v Poznámkovém bloku je kopírujte přes Ctrl+C a Ctrl+V (Kopírovat – Vložit), pokud vám to tak vyhovuje. Osobně nejvíc doporučuji používat pro editaci hesel pro LL místo Poznámkového bloku CodePad, výborný, malý a t. č. bezplatně distribuovaný editor pro psaní ve všemožných programovacích a formátovacích jazycích, který umí vykreslovat text barevně, což editaci usnadňuje a zpříjemňuje; ke stažení je na http://shicola.d2.cz/codepad/download.php. Nejdřív je ale potřeba ho to naučit; pokud byste chtěli soubor s definicí syntaxe vhodnou pro editaci hesla pro LL (který respektuje mé značky, jak jsou vyloženy výše), můžete si ho stáhnout zde; po instalaci CodePadu jej zkopírujte do podadresáře Syntax Definitions a pak pod Syntax / Configure přiřaďte souborům *.udr soubor ll.def. Pokud byste takto postupovali a dospěli do fáze, kdy byste si nevěděli rady, nebo pokud byste nebyli rozhodnutí, zda je CodePad vhodný, můžete si přečíst více v tipech pro práci s počítačem ve speciální kapitole CodePad (stránka je rozsáhlá, mějte prosím strpení). Pokud se nechcete učit další novou věc, klidně užívejte Poznámkový blok, je to ale méně příjemné na oči než CodePad, který kód vykresluje barevně, a navíc tam lze vzít zpět jen jednu akci atd. – CodePad je na toto daleko lepší.
Při sepisování podkapitoly o formátování hesla mi velmi pomohly informace, které mi poskytla technická podpora Lingey, jíž tímto velmi děkuji.
Níže najdete kombinace znaků, jejichž prostřednictvím lze vepsat do uživatelského slovníku speciální znaky. Údaje poskytla technická podpora LL. Převod do podoby vhodné pro LL je samozřejmě možné a žádoucí zautomatizovat hromadným nahrazováním ve Wordu či jiném textovém editoru, na které si lze – což je vůbec nejlepší – nahrát makro. Pokud si vypisujete slovíčka přímo do uživatelského slovníku Lingea Lexiconu, tak si to takto můžete (přesněji: měli byste, vzhledem k prostě textovému formátu slovníku), rovnou psát.
\`a obrácená čárka nad a e i o u
\'a normální čárka nad a c e g i l n o r s u y z
\^a stříška nad a c e g h i j o s u w y
\~a vlnka nad a i n o u
\:a dvě tečky nad a e i o u y
\-a proužek nad a e i o u
\.c tečka nad c e g i z
\"c háček nad c d e l n r s t z
\"a kroužek nad a u
\+a oblouček nad a e g i o u
\,c ocásek pod c g k l n r s t, směřující vlevo
\,a ocásek pod a e i u, směřující vpravo
\_d přeškrtnutí d h l o t
\@a speciální a d i k n o s y (a pro ligaturu ae, d pro znak ð, i pro ligaturu ij, o pro ligaturu oe, s pro ß; zkuste si do některého svého slovníku pod jakékoli heslo dát \@a \@d \@i \@k \@n \@o \@s \@y a hned uvidíte, který kód co zastupuje)
Příklad: slovo rêve bude ve zdrojovém souboru slovníku vypadat r\^eve. Pochopitelně není nutné psát všechny znaky s diakritikou těmito speciálními kódy. Např. výchozí kódování windows-1250 užívané Poznámkovým blokem obsaženým v české lokalizaci Windows zvládá (vedle českých písmen s diakritikou) i ç, ä, ë, ö, ü, â, î, ô, ę a některé další.
Bohužel tu nejde všechno, např. o s ocáskem doprava napsat nelze apod. Jde jen to, s čím programátoři počítali a co do programu zahrnuli. Tento seznam je asi pro LL 2002 úplný.
Je samozřejmě možné psát heslo přímo do textového souboru představujícího uživatelský slovník. Osobně se nyní přikláním k názoru, že je výhodnější heslo přímo psát v požadovaném formátování, a na přímou editaci jsem zcela přešel. Pro někoho ale může být výhodné psát hesla ve Wordu, např. do tabulky určené k vytištění a učení se slovíček, a nechat si je zčásti převést do potřebného formátu pomocí makra; makro spoustu značek doplní za vás a vy pak heslo jen ručně doopravíte.
Užívání maker je velice jednoduché (když je někdo naprogramuje a zpřístupní, což jsem udělal). Na jejich provozování potřebujete Microsoft Word.
- Otevřete si v Poznámkovém bloku soubor obsahující makra pro Lingea Lexicon.
- Označte celý jeho obsah a vložte jej do schránky (Ctrl+C nebo Kopírovat).
- Zazálohujte si šablonu Normal.dot (doporučeno, nepovinné).
- Spusťte Word.
- Otevřete editor jazyka Visual Basic (ve Wordu zmáčkněte Alt+F11, popřípadě jděte do Nástroje / Makra / Editor...).
- Tam do modulu NewMacros šablony Normal přes schránku (Ctrl+V nebo Vložit) kód vložte.
- Až budete chtít některé makro použít, vyvolejte si prostřednictvím kombinace Alt+F8 okno s makry a spusťte to, které zrovna potřebujete. V aktivním okně Wordu musí být příslušný text, který chcete zrovna pomocí makra upravovat.
- Používejte jen v kopiích souborů.
Provádíte – jako všechny postupy z těchto stránek – na vlastní nebezpečí.
Dávám v souboru obsahujícím wordovská makra pro Lingea Lexicon k dispozici tato makra:
- LingeaHeslo: předpřipraví aktuální řádek běžné tabulky, kam si ve Wordu vypisujeme slovíčka, pro přenesení do uživatelského slovníku Lingea Lexiconu. Je nutné si v kódu přepsat cestu k pracovnímu souboru a jeho název. Vytvořte si nový dokument .DOC, který se má stát pracovním souborem pro převody, uložte ho někam a přepište cestu C:\David\Jazyky\latina\ na jinou a název na název tohoto vámi vytvořeného souboru.
- LingeaFráze: Předpřipraví označenou část tabulky (pokud není označeno nic, tak aktuální řádek tabulky) pro zanesení do uživatelského slovníku Lingea Lexiconu jako frázi (<p.>). Cestu si změňte.
- LingeaValence: dodá valenci. Do kolekce si můžete dopsat analogicky i další vazby.
- LingeaUpřesněníTypuPoznámekPodleSeznamuZkratek: upřesní z nerozlišených poznámek <n.geogr.> na správnější typ, např. na <b.geogr.>, ve shodě se seznamem zkratek. Můžete si doplňovat vlastní zkratky i vyřazovat některé, které tam nechcete.
- LingeaÚpravaZnakůAFormátuProUživatelskýSlovník: převede databázi v základním formátu (tabulka či řádkové heslo, kde část výchozího a cílového jazyka dělí tabulátory) na poměrně pokročilou databázi ve tvaru vhodném pro Lingea Lexicon, ač samozřejmě heslo nikdy nebude stejně plnohodnotné, jako kdybyste jej přímo pro LL zpracovávali, ale ušetří práci a bude se to. Makro užíváte na vlastní nebezpečí. Spouštějte je vždy v kopii zdrojového souboru, ne v souboru samotném. Ostatní otevřené wordovské soubory raději zavřete, zvlášť pokud jste v práci s makry spíše začátečníky, a rozhodně je před spuštěním makra uložte. Pokud je soubor moc velký (např. přes 100 stran) a postup by moc dlouho trval, rozdělte jej na více souborů menších a v každém z nich makro postupně spusťte. Potom přes schránku (Ctrl+C) opět soubor spojte do jediného slovníku pro LL. Běh makra lze přerušit kombinací Ctrl+Pause. Vzniklý text vložte do uživatelského slovníku v podadresáři data lingeovského adresáře. Jak na to, vám napoví část zpracovávající uživatelský slovník pro Lingea Lexicon.
- LingeaHTML: různá převodová makra z mé verze lingeovského formátování (striktně dodržené) do běžných stránek HTML – do podoby, s jakou se můžete seznámit, pokud jste tak dosud neučinili, na stránce Slovníky v podobě běžných stránek HTML.
- To vše obsahuje soubor s makry pro Lingea Lexicon.
- Další makra najdete zde. V této rozsáhlé sadě maker (zpakované jako .ZIP) si najděte ta, která se vám hodí, a stejným způsobem si je zkopírujte do šablony Normal. Ta, která se týkají databází pro Lingea Lexicon, začínají na slovo Lingea. Jsou leckdy rovněž dost užitečná: umějí hromadně převádět databáze do dost pokročilé podoby určené pro LL z jednodušších (zejm. z wordovské tabulky), vyrábět soupis hesel a počítat je, vypisovat duplicity, abecedně řadit atd.
Makra vám ušetří čas: předpřipraví heslo do poměrně pokročilé podoby. Následují ukázky zpracování hesla makrem LingeaHeslo.
Původní podoba:
abattage m. bourání, demontáž ; kácení, mýcení, porážení ; odbourávání, lámání (skály), odtesání ; rubání ; porážení (dobytka), skolení, odstřel (zvěře) ; sklopení ; páčení ; stahovací roleta (krámu) ; vyložené karty ; verva, živost, zápal (fam.)
adhérer à qc. přidržovat se čeho, zastávat co, ztotožňovat se s čím
fortuna, ae, f.osud; úděl (daný osudem); příležitost; štěstí; neštěstí; rozhodnutí, výsledek; stav, postavení, poměry, okolnosti; (obvykle pl.) majetek, jmění, bohatství; Fortuna, ae, f. Štěstěna, bohyně štěstí; (střv.) právo na nalezené poklady; (střv.) nástrahy moře (MLLM jen jako fortuna maris, ale i vypouštěno: Bech, ed. Šanjek, Bosansko-humski..., 140:: dle MLLM od 13. stol.)
Výstup po zpracování makry:
#abattage
<g.m.>
=bourání, demontáž
=kácení, mýcení, porážení
=odbourávání, lámání <n.skály>, odtesání
=rubání
=porážení <n.dobytka>, skolení, odstřel <n.zvěře>
=sklopení
=páčení
=stahovací roleta <n.krámu>
=vyložené karty
=verva, živost, zápal <s.fam.>
#adhérer<v.\`a qc.>
přidržovat se <v.čeho>, zastávat <v.co>, ztotožňovat se <v.s čím>
#fortuna
<g.ae, f.>
=osud
=úděl <n.daný osudem>
=příležitost
=štěstí
=neštěstí
=rozhodnutí, výsledek
=stav, postavení, poměry, okolnosti
=<n.obvykle pl.> majetek, jmění, bohatství
=Fortuna, ae, f. Štěstěna, bohyně štěstí
=<s.střv.> právo na nalezené poklady
=<s.střv.> nástrahy moře <z.MLLM jen jako fortuna maris, ale i vypouštěno: Bech, ed. Šanjek, Bosansko-humski..., 140; dle MLLM od 13. stol.>
<z.Pražák, MLLM>
Dokonalý ten výstup nebude nikdy, je třeba to vždycky ručně dodělat, ale dost práce vám to ušetří. Doporučené je psát všechny poznámky ve výchozím wordovském dokumentu do speciálních závorek, např.:
absento, are, avi [a do druhého sloupce tabulky toto:] (trans.) vzdalovat; (intrans.) být vzdálen; (refl.) vzdalovat se, vzdálit se; nedostavit se k soudu; (absol. / ab alqa re) vzdálit se od církevního působiště.
hida, ae, f.(střv.) (anglosas.) lán
Zvažte sami, zda vám vyhovuje víc přímé psaní, nebo předpřipravení ve wordovské tabulce a poté převedení pomocí makra. Vzhledem k délce běhu makra LingeaHeslo je myslím výhodnější psát hesla přímo, než je po jednom přenášet. Ale ostatní makra mohou mít v mnoha případech použití (např. makro na hromadný převod celé wordovské tabulky).
Badatelům a studentům (zejm. postgraduálním) připomínám možnost podat si na lexikografickou práci grant a vysokoškolským studentům zase výbornou možnost vybrat si po konzultaci s předpokládaným vedoucím diplomové či jiné práce jako její téma důkladné počítačově-lexikografické zmapování např. určitého pramene či okruhu pramenů, popř. určité jazykové úrovně (současný francouzský studentský slang, staroanglické artušovské romance, německá terminologie týkající se vytváření stránek HTML, slovník skupiny Félibrige, okcitánské narativní básně 13. století, dalmatština v dokumentech dubrovnického archivu atd. atd.; vždy je ovšem třeba zvážit, pro koho slovník děláme, a případně tomu přizpůsobit cílový jazyk, například vyrobit slovník dalmatsko-anglický – byť za cenu větší časové investice a nějakých chyb navíc, zapříčiněných tím, že angličtina není lexikografův mateřský jazyk). Pokud by se slovník doplnil např. studií středního rozsahu a podrobné poznámky by se zařadily i pod jednotlivá hesla, tak by to jistě bylo jako téma přijato. Počítačová lexikografie je činnost, která má smysl a která je prospěšná poměrně rozsáhlému okruhu uživatelů, takže se výstupu vaší práce – pokud jej publikujete na internetu (tyto stránky jsou tomu otevřeny) – rozhodně nestane, že by zbůhdarma chytal prach v knihovním depozitáři.
Adresa: http://www.pc-slovniky.cz.
Velmi rozsáhlý slovník, t. č. v základní (ale již tak velmi rozsáhlé) zdarma. Nesestaven z hesel, nýbrž z významových dvojic. Kvalita jednotek je různá,[23] ale pokud se v případě neuspokojivého výsledku nahlédne např. do knižního slovníku, tak jde o velmi vyhovující slovník. Nelze než velmi doporučit; poměr ceny ke kvalitě je t. č. jednoznačně nejpříznivější ze všech českých programů. Velká část návodů na těchto stránkách platí právě pro Millennium, takže nejsou shromážděny do této kapitoly.
Instalace Millennia: spustit soubor Setup.exe (v podadresáři Program toho adresáře, který obsahuje instalační balíček).
Millennium nedoporučuji jako platformu k importu slovníků jiných jazyků, např. španělsko-českého. Nabízí málo výhod, je založen na struktuře A=B a databáze jsou zbytečně velké (neboť jde o rozežrané accessovské soubory). Síla Millennia je v tom, že dává zadarmo sice jednoduché a málo formátované, ale rozsáhlé databáze AJ, NJ a FJ. Ale jako platformu volte raději LL či PEKI.
- Jazyk: je třeba zvážit, jaký jazyk nastavit. Na kartě vzhled okna je tato možnost. Např. proto, aby při přenášení hesla přes schránku do nějakého dokumentu zůstaly české znaky českými, je dobré dát přepínač na „Česky“.
- Vždy nahoře: okno bude vždy nahoře, pokud nebude uživatelem minimalizováno.
- Problémy s českou klávesnicí, zvlášť u roubovaných slovníků: když nechce být česká, tak je třeba si pohrát s Nastavení, karta Vzhled okna. Všude (na všech třech místech) nastavit češtinu a snad to už bude bez problémů. Někdy se zdá, že to nejde; zkuste dát přepínač na „Ve formulářích“ a stisknout tlačítko OK.
- Při opuštění minimalizovat: stačí klepnout mimo okno Millennia a samo se minimalizuje.
- Rozvinout vše: ukáže hned všechny nalezené záznamy, ne jen první.
- Omezení nalezených jednotek: je zbytečné nechat tam 10 000; to je moc a když to hledá např. „de“, v podstatě omylem, tak to moc dlouho trvá. Je dobré to v nastavení omezit, možná tak na 500 nebo 600 nebo i 300.
- Zálohování nastavení (pro pokročilejší): nastavovat vše znovu na novém PC apod. je únavné. Spusťte regedit.exe a exportujte HKEY_CURRENT_USER\Software\Commercial Service. Pak celé slovníky jen překopírujte (zachovejte ale stejné cesty k adresářům se slovníky), spusťte tento exportovaný soubor .REG, a potvrďte dotaz. Mělo by být hotovo: velikost, umístění okna slovníku, nastavení klávesnic atd. atd., vše by se mělo provést.
Postup importu je následující:
1.) Uložte kopii dokumentu obsahujícího slovíčka, která chcete importovat, jako pouze text (Uložit jako...).[24] [Pro pokročilejší: nejvýhodnější je využít (pokud pracujete ve Wordu) makro, které uloží soubor jako pouze text do konkrétního adresáře a provede automaticky určité změny: předřadí středníkům mezery (středníky totiž bez mezer matou v Millenniu někdy vyhledávání), zkazí francouzské znaky tak, aby po importu byly dobré, atd. Jedno takové makro jménem ImportMillennium si lze stáhnout mezi mými makry. Ale pozor, bude nutné v kódu upravit cesty tak, aby na vašem disku existovaly, např. z C:\David změnit na C:\Dokumenty.]
2.) Spusťte Millennium, otevřete uživatelský slovník (Soubor/Uživatelský slovník) a zvolte Import, najděte procházením textový soubor, který jste si před chvílí uložili, a zvolte ho. Jeho obsah se vám importuje do uživatelského slovníku. Pokud to již nemáte tak nastaveno, zvolte v nastavení, aby slovník hledal nejen v základní databázi, nýbrž i právě v uživatelském slovníku.
3.) Fakultativní krok: ověřte, zda import v pořádku proběhl, buď přímo v uživatelském slovníku nebo pokusným vyhledáním některé jednotky, o které víte, že v základní databázi není a že patří mezi slovíčka, která jste si právě do uživatelského slovníku importovali.
4.) Zazálohujte si uživatelský slovník (na disketu, na CD...), aby nedošlo ke ztrátě dat. Lze uskutečnit pomocí nabídky Export pod uživatelským slovníkem. Vzniklý soubor následně uložte na disketu či CD.
Další tipy a poznámky
- Třetí sloupec (poznámky): pozor, Millennium podporuje ve třetím sloupci maximálně 48 znaků.
- Délka jedné strany hesla: max. 255 znaků. Je třeba myslet na to, že pokud užíváte hromadné nahrazování středníku za mezeru a středník (kvůli vyhledávací chybě Millennia), tak několik znaků přibude. Je tudíž dobré mít nějakou rezervu. Takže je lepší se vejít tak do těch 250 – kdyžtak lze jednotku rozdělit do více.
- Pozor na středníky; experimentálně jsem zjistil, že Millennium v současné podobě má problémy se středníky. Např. z jednotky uživatelského „mettre položit, umístit, postavit; dát“ při hledání najde toto heslo i v případě hledání slova „umístit“ (a zobrazí to v podokénku „fráze“), zatímco při hledání „postavit“ uvedené heslo vůbec nenajde (ověřeno několikerým testováním). Proto velice doporučuji před importem provést v kopii vašeho dokumentu se slovíčky pomocí textového editoru hromadnou záměnu všech středníků za „[mezera] středník“, tj. „;“ za „ ;“ – což nevypadá graficky dokonale, ale zato to zajistí správné fungování (ozkoušeno).
- Kousnutí se při importu: slovník se někdy při importu kousne; často dělá, že ještě importuje, ale ve skutečnosti už všechno importoval a pouze zatuhl. V takovém případě stačí zmáčknout několikrát na tlačítko zastavit a zkontrolovat v uživatelském slovníku, zda importoval ze zdrojového souboru určeného k importu všechny jednotky. Často tomu tak totiž je, ač Millennium ještě předstíralo, že importuje dál.
- Hranaté závorky pro poznámky: je třeba to s nimi nepřehnat. Ve třetím sloupci tabulky jsou zbytečné, protože tam si je Millennium dodá samo. Jinde mohou působit zbytečné komplikace; ověřil jsem si, že výraz či ta jeho část, která je v nich, byť je v druhém sloupci, nelze po nalezení v Millenniu vložit do schránky, což je překvapivé, ale je to tak. Raději hranaté závorky spíš nepoužívat, leda pro poznámky, které jsou dlouhé, takže se nemohou vejít do 3. sloupce (max. 50 znaků), a přitom se o nich nepředpokládá, že by si je uživatel chtěl kopírovat do svého souboru se slovíčky. Ověřeno, že i když jsou hranaté závorky uprostřed hesla, tak pak heslo nelze vykopírovat, a to nehledě na směr překladu; nic z toho, co je za první hranatou závorkou, se do schránky prostě nevloží (vyzkoušeno na hesle „amicale f. [ak. sl.], association f., groupement m.“: zkopírovalo se jen „amicale f.“ a nic víc).
- Volba aktivovat při spuštění hledání v Millenniu: obecně je to spíše nešikovné. Tím, že políčko necháte nezaškrtnuté, zajistíte, že zůstane slovník minimalizovaný, dokud vyhledávání nedokončí.
- Millennium – problémy po skončení importu: Millennium někdy dělá problémy po skončení importu: na nich nejde klepnout atd. Tip: pokud používáte Windows 95 a novější, respektive pokud se po stisknutí kláves Ctrl+Alt+Del počítač ještě nerestartuje, nýbrž se objeví dialogové okno, který program se má ukončit, tak stiskněte uvedenou kombinaci kláves, ale pak restartování stornujte pomocí příslušného tlačítka – v optimálním případě by se mělo objevit okénko, že byl import dokončen a kolik záznamů bylo (a nebylo) přidáno.
- Po importu: doporučuji Millennium po skončení každého většího importu ukončit, pak znovu spustit a teprve pak pokračovat v importu dalších dat nebo ve vyhledávání.
- Využití pro slovníky dalších jazyků (např. tibetsko-český): Millennium takto využít lze (obecné poznámky najdete v této kapitole). Ale již to nedoporučuji; Millennium k tomu není určeno a jsou vhodnější platformy, např. LL či PEKI. Přesto připojuji několik poznámek: import databáze dělá někdy problémy: když si např. takto vytvoříme vlastní srbsko-český a také bulharsko-český slovník a snažíme se importovat do jednoho vlastní databázi srbsko-českou a do druhého bulharsko-českou, stává se, že se nám zdánlivě kopíruje do obou těchto slovníků databáze stále stejná (tj. když si natáhneme do srbsko-českého slovníku databázi srbsko-českou, tak ji máme najednou i v bulharsko-českém a bulharsko-česká jako by nám zmizela). Ve skutečnosti je problém v tom, že se v nastavení slovníku proti naší vůli mění cesta ke zdrojové databázi. Proto je třeba při užívání většího počtu těchto slovníků dobře zvážit uspořádání souborů (viz níže). Do nějakého adresáře, např. výchozího adresáře Millennia, si zkopírujeme několikrát původní slovníkovou databázi z podadresáře Data, např. německo-českou (výhodné je zvolit tu, která zabírá nejméně místa na disku). Tyto jednotlivé soubory si přejmenujeme např. na latina.mdb, srbstina.mdb atd. Pak při každém spuštění slovníku v nabídce Nastavení, karta Aplikace procházením najdeme a zvolíme tu databázi, se kterou chceme momentálně pracovat, tj. např. latina.mdb. K ní a jedině k ní jsme na samém začátku používání elektronického slovníku pro širší účely připojili svou vlastní nebo z internetu staženou latinsko-českou databázi (viz výše postup) a k ní též průběžně připojujeme i další dílčí latinsko-české databáze, jež si budeme postupně vytvářet nebo jež nám někdo poskytne. Jakmile dokončíme práci s latinským textem a zachce se nám např. přeložit si nějaký text z bulharštiny, v Nastavení uvedeným způsobem zvolíme databázi bulharstina.mdb. Je třeba se především nezmýlit a nesmíchat slovníky mezi sebou, tj. např. omylem nepřimísit při některém importu do latinského slovníku bulharská slovíčka. Když k tomu dojde, je lze buď po jednom smazat a tak chybu napravit (v případě, že je jich malý počet), nebo uživatelský slovník vyexportovat (Uživatelský slovník / Export) do nějakého pracovního souboru .TXT, dobře si tento soubor zazálohovat (abychom měli jeho kopii v případě, že bychom při dalších úpravách omylem porušili formát apod.), smazat v něm ručně chybné údaje, uložit ho, vymazat celý uživatelský slovník a znovu do něj data natáhnout ze souboru, v němž jsme právě příslušné úpravy provedli (což je postup obvykle rychlejší než odstraňování po jednom, zvlášť u většího počtu chybných údajů). Popřípadě pokud máme nějakou zálohu uživatelského slovníku vyhotovenou ve fázi bezprostředně předcházející té, při níž jsme importovali chybná slovíčka, tak lze celý uživatelský slovník vymazat a importovat data z tohoto záložního souboru znovu. Opakuji ale, že k tomuto využití Millennium není vhodné. Jako platformu pro vlastní (či někde stažené) databáze volte přinejmenším u jazyků, které Millennium nezpracovává, raději Lingea Lexicon či PEKI.
- Jak si zorganizovat uspořádání souborů v adresáři Millennia a jak následně hledat v tom správném roubovaném slovníku: pokud užíváte Millennium jako platformu pro slovníky různých jazyků, jejichž databáze si importujete do uživatelských slovníků (což nedoporučuji; Millennium k tomu není určeno a lepší je použít Lingea Lexicon či PEKI), vyvstává otázka, jak si zorganizovat umístění souborů. Myslím, že nejschůdnější je mít 1.) ve speciálním adresáři Millennium určené k práci s AJ, NJ a FJ, a 2.) do jiného adresáře Millennium nainstalovat znovu, překopírovat některou z původních databází Millennia, třeba německo-českou, z podadresáře Data např. do výchozího adresáře, kam jste si toto druhé Millennium nainstalovali. Těchto kopií si vytvoříte tolik, pro kolik jazyků chcete Millennium používat, a nějak vhodně je přejmenujete: např. na bulharstina.mdb, srbstina.mdb, latina.mdb apod. Na každou z nich pak naroubujete jinou databázi staženou z těchto stránek, odjinud z internetu, vámi vytvořenou atd. (bulharsko-českou na bulharstina.mdb apod.). Jak před každým takovým importem, tak před každým začátkem práce zadáte Nastavení, na kartě Aplikace najdete příslušný soubor databáze, se kterou chcete nyní pracovat, např. bulharstina.mdb, a můžete se pustit do importu nebo vyhledávání.
Adresa: http://pponec.net/peki/index_cs.htm.
Celková charakteristika: platforma pro Windows, Linux, MacOS a další operační systémy, na nichž je nainstalováno Java Runtime Environment. V PEKI lze provozovat nejrůznější slovníkové databáze; instalační balíček už sám četné zdarma dostupné databáze obsahuje (anglicko-česká, finsko-česká, italsko-česká, latinsko-česká, nizozemsko-česká, rusko-česká, ukrajinsko-česká aj.). Jde o freeware. Program je kvalitní. Pracuje se s ním pěkně, nemusí se mačkat žádná klávesová zkratka pro hledání apod., stačí prostě začít psát. Ovládání je jednoduché. Ve 3. sloupci umožňuje některé značky HTML, takže je možné dosáhnout barevného a přehledného zobrazení podobného této ukázce. Stačí mít databázi v potřebném formátu; některé takové najdete na těchto stránkách.
Databáze, struktura databází: Převažující struktura databází je A=B, A=C, A=D atd. s možností převracení slovníku, ale slovník částečně podporuje i značkování pomocí HTML (viz níže) a uvedená struktura je dána samotnými databázemi, nikoli tím, že by se PEKI vázal jen na ni. Maximální velikost jednoho databázového souboru je 2048 MB (2147483647 bajtů), což je tolik, že lexikografovu rozletu nic nebrání.
Ovládání slovníku: klávesa F11 skrývá či zobrazuje navigační tlačítka. Enter či Alt+Enter vstupuje do Podrobností nebo (pokud v nich jste) naopak do stručného zobrazení. Šipky či Alt+šipky posouvají na předchozí či následující heslo v abecedním pořadí. Pod nabídkou Nastavení si lze vybrat, zda se má skákat na hesla již během psaní (Rychlé hledání), nebo teprve poté, co se stiskne Enter.
Import: slovník není určen k přímému vkládání jednotek. Je potřeba dát je do textového souboru, ten někam uložit a poté pod Start / (Všechny) Programy / PEKI Dictionary / DataImport spustit vytvoření příslušné databáze. Postup je následující: pokud jsou to databáze, jež tvoří součást distribučního balíčku PEKI, tak stačí zaškrtávat či rušit zaškrtnutí. Pokud jste si zdrojový soubor někde stáhli, např. na těchto stránkách, či je váš vlastní, tak zmáčkněte vpravo nahoře Vytvořit, pak změňte parametry nově vzniklého popisu zdrojové databáze (autor, zdrojový soubor, oddělovač atd.) a klepněte na tlačítko Vytvořit umístěné dole. Tabulátor se dá do políčka Oddělovač vložit tak, že se napíše v Poznámkovém bloku a přenese se přes systémovou schránku (Ctrl+C).
Import databází z těchto stránek: pokud chcete vidět databáze barevně a rozhodli jste se pro PEKI, najdete postup o něco níže; je trošku složitější, ale nijak výrazně. Pokud jde naopak o databáze v základním formátu, tak postupujte takto: databázi si z internetu uložte někam na disk, spusťte Start / (Všechny) Programy / PEKI Dictionary / DataImport, dejte nahoře Vytvořit, změňte parametry (autora apod., a také samozřejmě zdrojový soubor: procházením najděte na svém disku příslušný slovníkový soubor stažený z těchto stránek), do políčka Oddělovač zkopírujte z Poznámkového bloku znak tabulátoru a stiskněte Vytvořit dole.
Různé tipy:
- Jak si zálohovat nastavení parametrů v Data Import, např. při přechodu na nový počítač: ukládají se do souboru import.ini v podadresáři datasource. Do tohoto souboru lze také vkládat a případně sdílet s dalšími uživateli příslušné parametry databází. Jde o prostý textový soubor.
- Minimum, které je potřeba při vyrábění distribučního balíčku: peki.vbs, peki.jar, icon.ico a adresář database s hotovými databázemi. To by pak mělo stačit rozpakovat (zkoušel jsem to, ale ne na PC, kde není PEKI nainstalován).
Řešení problémů:
- Přečtěte si soubor readme.
- Pokud program správně neskáče na heslo, na které má, nýbrž na poslední heslo ve slovníku, tak jej ukončete a znovu spusťte. Stávalo se to zejména po využití zkratky Ctrl+číslo k přepnutí mezi slovníky.
- Pokud se program vůbec nespustí, zkontrolujte, zda máte nainstalováno Java Runtime Environment, a pokud ne, tak si je zdarma stáhněte.
- Pokud se databáze nevytvoří: 1.) ověřte, zda je v levém sloupci rozhraní Data Import zaškrtnuté, aby se vytvořila; 2.) ověřte, zda je korektně zadán oddělovač a zda je tento oddělovač opravdu užit ve zdrojovém souboru databáze; 3.) pokud i to selže, smažte databázi ze seznamu v Data Import, vytvořte novou položku, přepište data a vytvořte databázi znovu (jednou to prokazatelně pomohlo).
PEKI podporuje ve třetím sloupci (resp. čtvrtém, pokud započítáme sloupec pro výslovnost) značkování HTML a styly CSS, byť ne v úplnosti (Java Runtime Environment zatím nemá dobrou podporu kaskádových stylů). Hlavními nástroji, které se užijí pro značkování HTML určené pro PEKI, jsou v podstatě značky <font> a <br>, protože PEKI zatím nepodporuje <p> a <span>.
- Co PEKI v nynější verzi v CSS nepodporuje, ale nezmate ho to: margin; nedá se to obejít ani přes bílý border – border také není podporován; vertical-align; kontextové selektory (např. .parp .o pro všechny .o, které jsou podřazenými značkami .parp); blokové elementy (<p> apod.).
- Co PEKI nepodporuje a vede to patrně k ignorování celé definice: některé pojmenované barvy (řešení: užívejte místo jmen hexadecimální kódy); hodnota inherit; asi též font-variant. Doporučuji si však tyto údaje ověřit.
- Jak ovlivnit zobrazení obsahu sloupců v Podrobném zobrazení: pomocí selektorů .c1, .c2, .c3 a .c4 ve stylopise; c1 je první sloupec, c2 druhý (obsahující výslovnost), c3 třetí. Styly pod c4 jsou aplikovány na samotné zobrazení Podrobností. Lze tu nastavit např. barvu pozadí.
- Jak zajistit, aby byly speciální entity HTML zobrazené jako správný znak i ve stručném zobrazení: vybrat v betaverzi PEKI při importu dat pro první sloupec interní kódovou stránku UTF-8.
Jak do PEKI importovat barevné databáze z těchto stránek:
- Uložte si na disk list stylů určený pro provozování těchto databází v PEKI.
- Uložte si na disk z databází v jednom souboru HTML tu, kterou chcete používat; pokud má stažený soubor příponu EXE, rozpakujte jej prostým spuštěním.
- Většina balíčků z těchto stránek obsahuje více slovníkových titulů. Pokud je chcete mít v jedné jediné databázi, tak je spojte (vyjma hlavičky a spodku) do jediného textového souboru pomocí otevření v Poznámkovém bloku a přenesení obsahu přes systémovou schránku do jednoho souboru. (Ale zachovejte pochopitelně rozdělení na samostatný slovník pro každý směr!)
- Uložte si na disk skripty. Rozbalte je a spusťte skript peki-slovnik-prevod.vbs. Budete vyzváni k zadání diskové cesty k souboru obsahujícímu slovník, který chcete převést.
- Počkejte na zobrazení výstupu. Ten pak někam uložte v podobě textového souboru (TXT).
- Vlastní import: poté proveďte Data Import běžným způsobem (viz výše). Vepište v rozhraní Data Import příslušná data do jednotlivých políček (autor apod.). Do políčka „oddělovač“ vepište v tomto případě svislou čárku | (pokud ji nemáte na klávesnici, napíšete ji pomocí AltGr+W). U políčka CSS zvolte procházecí tlačítko a najděte soubor pekidz.css, který jste si předtím uložili z těchto stránek někam na disk. Nezapomeňte zaškrtnout vytvoření v levém sloupečku. Nakonec stiskněte Vytvořit dole.
- Spusťte PEKI a ověřte, zda vytvoření proběhlo správně.
- Složitější postup v případě problémů s převodem databáze přes skript: pokud nastaly problémy (výstup je nekorektní nebo se skript vůbec nespustil apod.) můžete užít jiný postup: stáhněte si převaděč databází v HTML z těchto stránek do PEKI (makro SlovníkyHTMLdoPeki mezi wordovskými makry; potřebujete i všechny volané funkce – jsou v tomtéž souboru), příslušný slovníkový soubor HTML z těchto stránek otevřete v Poznámkovém bloku, přes schránku přeneste text z Poznámkového bloku do nového wordovského dokumentu (do dokumentu můžete zároveň dát i materiál z více slovníkových titulů v HTML, které se nacházejí v příslušném balíčku z těchto stránek, ale zachovejte rozdělení na samostatný slovník pro každý směr slovníku), smažte hlavičku a dolní část textu (nechte tedy jen vlastní hesla) a spusťte makro SlovníkyHTMLdoPeki (o tom, jak používat wordovská makra, se dovíte zde). Vzniklý text pak přenesete opět přes schránku do textového souboru nově založeného v Poznámkovém bloku a tento soubor TXT uložte kamkoli na disk. Pak proveďte vytvoření databáze výše uvedeným standardním způsobem (přes rozhraní Data Import).
- U slovníků užívajících cizích abeced nezapomeňte také nainstalovat požadovaný font. Odkazy najdete na stránce věnované slovníkům v HTML. Tamtéž i návod, jak instalovat font.
Výhody a nevýhody provozování těchto databází v PEKI: výsledek není zatím tak úhledný a přehledný jako mé databáze ve formátu pro Lingea Lexicon, ale u rozsáhlých slovníků má PEKI tu výhodu, že databáze načítá rychle (narozdíl od LL a prohlížeče) a oproti rozsáhlým databázím v jednotlivých souborech HTML (zejména česko-francouzské, která nyní na disku zabírá 66 MB, a taky francouzsko-české) zase tu výhodu, že databáze pro PEKI zabírá na disku výrazně méně místa a nezpomaluje operace jako je hledání souborů či antivirová kontrola. Navíc PEKI podporuje i různé fonty v rámci jednoho hesla, což je nepostradatelné u jazyků užívajících nelatinských abeced (tento rys nemá ani LL 2002). Také zadávání speciálních (např. francouzských) znaků do zadávacího řádku je zvládnuto mnohem lépe než v LL 2002 – lze užívat standardní zkratky (Shift+Ctrl+ý a poté příslušné písmeno pro accent grave aj.). Je to rozhodně mnohem lepší, než se spokojit se stažením databází v základním formátu.
Adresa: http://www.pokluda.cz/.
Jde o zajímavý program, freeware. Platforma, do které lze importovat slovíčka různých jazyků. Teoreticky můžete mít slovníků kolik chcete, stačí ten požadovaný vždy před začátkem práce otevřít. Instalační balíček v době, kdy jsem ho stahoval, obsahoval z databází jen ukázku anglicko-českého slovníku.
Jde o primárně platformu pro listovací slovník, takže dostat se do pole, kam se dá zadat vyhledávací dotaz, trvá o chvíli déle než v Millenniu, ale možnost prohledávat všechna pole, navíc velmi pokročile, je tu zpracována dokonce lépe.
Databáze: struktura A=B, neumožňuje barevné zobrazení bohatě formátovaných datových dokumentů. Databáze jsou soubory pro MS Access, což je zbytečně rozežraný formát.
Možnost volit si různé fonty pro jednotlivá pole je dobrá pro jazyky užívající cizích abeced.
Jak importovat z TXT: zvolit v rozbalovacím menu procházecího dialogu pod Import zobrazení všechny soubory, najít soubor. Pravděpodobně vám ohlásí chybu, ale při dalším otevření bude v pořádku. Pozor, co je ve vaší databázi vpravo, bude vlevo. Pokud nelistujete, ale hledáte, tak hledá i to, co je jen součástí řetězce, tj. nemusíte mít jedno slovíčko na řádku. Ale pozor, aby heslo bylo vidět; nedá se to posunovat.
Problémy s importem: někdy hlásí problémy s importem. V takové chvíli přichází na řadu něco, co umí změnit formát: třeba to můžete importovat do Millennia, odtud exportovat a pak importovat do slovníku Pokluda.
Různé poznámky: součástí Pokludy jsou ukázky – anglické databáze o cca 1000 slovíčcích. Nastavení v nabídce Soubor umožňuje nastavení tisku.
Ovládání: primárně listovací slovník, takže zbytečně dlouho trvá, než se dostanete k zadávacímu políčku pro hledání.
Vyhledávání: operátor AND. Možnost použít dotaz WHERE pro jazyk SQL. Možnost hledat i v poli výslovnost, poznámka atd. Možnosti dosti široké. Doporučuji hledání ovládat z klávesnice, ne myší.
Nedostatky: 1.) Není k dispozici možnost měnit velikost vyhrazenou v okně pro jednotlivá pole (obvykle, třeba v Průzkumníkovi nebo Salamanderovi, tažením myši na horní liště). 2.) Nelze užívat příkaz Kopírovat atd., tj. vložit nalezený údaj do schránky při běžném listování, jen v podrobnějším výpisu slovíčka.
Export: dobré možnosti exportu: jako TXT: dělí pole čárkami. RTF: exportuje jako oddělené tabulátory. Lze též exportovat jako soubor pro Excel, do tabulky. Šikovné.
Hodnocení: doporučuji, zvlášť těm, kteří mají vlastní databáze a nechtějí nebo nemohou věnovat tolik místa na disku, kolik vyžaduje Millennium, nebo kterým se zdá, že je Millennium příliš pomalé, že je nestabilní, že nemá dobře zvládnuté logické operátory a že je nešikovné, jelikož se nedá zastavit probíhající formátování nalezených jednotek (to vše je pravda), popřípadě kdo se nechce smířit s jeho vyhledávacími chybami, a zároveň nechtějí používat demoverzi Lingea Lexiconu, například kvůli trochu složitější struktuře hesel pro uživatelský slovník. Pokluda je ucházející program. Výhoda je, že umí pohodlně pracovat s mnoha slovníky; prostě dáte Otevřít a otevřete si jinou databázi. V Millenniu to jde oklikou taky, ale je to o něco pomalejší a náročnější na místo na disku. Nevýhoda je, že Pokluda je slovníkem listovacím, ne vyhledávacím; vyhledávat umí, ale chvíli trvá, než se dostanete do okénka, kam svůj dotaz můžete vepsat. Klávesou F3 pak skočíte na další výskyt. Pokud budete Pokludu používat, tak doporučuji užívat spíš jako alternativu než jako jediný slovník.
Pokročilé možnosti hledání: operátory NOT atd.
Zde stažitelné databáze a Pokluda: to, co jsem pro Millennium upravil, aby to tam bylo správně, např. è za č, ê za ę, je v Pokludě špatně, přesněji: zobrazuje to přesně, takže ta řízená zkaženost francouzské databáze vadí. Je snadné to opravit u distinktivních, např. všechna ŕ zaměňte za à atd., horší je to ale u č: tam to zaměňte ve Wordu jen v pravém sloupci po převedení mé databáze na tabulku. Ale pozor: pokud si zvyknete na to, že je to špatně a co co znamená, tak možná uděláte lépe, protože např. ŕ do pole na vyhledávání (Ctrl+F) napsat lze, kdežto à nikoliv (částečně lze vyřešit v Nástroje/Možnosti pod kartou nastavení písma; např. prostý Arial, když jsem ho nastavil, mi ledacos najednou ukazoval dobře, ale naopak další věci rozházel). Doporučuji si na zkaženost některých znaků francouzské databáze zvyknout a dodržovat tuto zkaženost i ve svých databázích (pokud se orientujete na Pokludu) z toho důvodu, abyste to byli schopni napsat nebo vložit přes schránku např. z wordovského souboru do pole pro vyhledávání.
Jak dostat do Pokludy speciální znaky, např. obrácené E (ə)?
Myslím, že to není t. č. možné. Nenašel jsem řešení, ale vím o několika „volných“ znacích, které Pokluda bere a které by se daly použít jako alternativa pro ty, které neumí. Je to r s čárkou (ve Wordu normálně napíšete čárku a R – ŕ), e s ocáskem dole (ę, napíše se Ctrl+Alt+ž, pak pustit a napsat e), î se stříškou, ô se stříškou (stříška se píše Ctrl+Alt+š, pak pustit a napsat příslušné písmeno) a asi i několik dalších tohoto druhu.
Adresa: http://www.langsoft.cz.
Slovníky: četné placené slovníky a překladače: angličtina, němčina, francouzština, ruština, italština, španělština, latina aj.
Hodnocení: postaveno na dvojicích slov, ne na komplexním zpracování hesla. S databázemi pracuje http://www.slovnik.cz, takže si databáze můžete vyzkoušet tam (ve značně rozsáhlé, snad dokonce úplné verzi, nevím to jistě). Významových dvojic je sice dost (u angličtiny t. č. asi 2,9 miliónu), ale nejde podle mého mínění o vhodný způsob, jak dělat slovníky.
Nápověda uvádí následující tvar jednotky:
cizí slovo \\ české slovo \t typ slova \c člen podstatného jména
„t“ představuje jeden znak určující typ slova (např. e = slovo elektrotechnické), „c“ představuje jeden (nepovinný) znak pro člen podstatného jména (např. v němčině der=r, die=e, das=s)
Tudíž je zřejmě třeba zvolit tento postup: hromadně v textovém editoru (typicky ve Wordu) nahradit všechny znaky „tabulátor-enter“ (ve Wordu ^t^p) za pouhý enter (^p), a to opakovaně. Tím se smažou tabulátory na konci řádku. Zůstanou dva typy jednotek: ty, které neobsahovaly dodatkové údaje v třetím sloupci (v daném řádku je už jen jediný tabulátor) a ty, které je obsahovaly (ty mají dva tabulátory). Pak nahradit všechny tabulátory za \\. Zkusit, zda to jde a zda vyhledávání funguje (pokud někdo PC Translator máte a zkoušeli jste to, tak se mi ozvěte, zda to jde). Pokud to nefunguje, tak ve Wordu provést všechny kroky až po nahrazení za zpětná lomítka, uložit si záložní kopii, pak převést celou databázi na tabulku (Tabulka / Převést), vymazat celý třetí sloupec tabulky, převést tabulku znovu na text (tamtéž) a pak teprve přikročit k nahrazení všech tabulátorů za \\.
Postup jsem vypracoval za vás. Obsahuje ho následující makro. Jak makro použít: otevřete si editor jazyka Visual Basic (ve Wordu zmáčkněte Alt+F11, popřípadě jděte do Nástroje / Makra / Editor...) a tam do šablony Normal přes schránku (Ctrl+C nebo Kopírovat) zkopírujte následující text:
Sub PCTranslatorÚpravaDatabázeDZ()
'Upraví databáze ze stránek Davida Zbírala do podoby (snad) vhodné pro PC Translator.
'Některé dodatkové informace (ty v třetím sloupci) se tímto ztratí. Chcete-li je
'zachovat, kombinujte automatické úpravy pomocí tohoto makra
'a úpravy ruční.
Selection.Find.ClearFormatting
Selection.Find.Replacement.ClearFormatting
With Selection.Find
.text = "^t^p"
.Replacement.text = "^p"
.Forward = True
.Wrap = wdFindContinue
.Format = False
.MatchCase = False
.MatchWholeWord = False
.MatchWildcards = False
.MatchSoundsLike = False
.MatchAllWordForms = False
End With
Selection.Find.Execute Replace:=wdReplaceAll
Selection.Find.Execute Replace:=wdReplaceAll
Selection.Find.Execute Replace:=wdReplaceAll
Selection.Find.Execute Replace:=wdReplaceAll
Selection.Find.Execute Replace:=wdReplaceAll
Selection.Find.Execute Replace:=wdReplaceAll
Selection.Find.Execute Replace:=wdReplaceAll
Selection.ParagraphFormat.Reset
Selection.WholeStory
Selection.ConvertToTable Separator:=wdSeparateByTabs, NumColumns:=3, _
NumRows:=57, Format:=wdTableFormatNone, ApplyBorders:=True, ApplyShading _
:=True, ApplyFont:=True, ApplyColor:=True, ApplyHeadingRows:=True, _
ApplyLastRow:=False, ApplyFirstColumn:=True, ApplyLastColumn:=False, _
AutoFit:=True, AutoFitBehavior:=wdAutoFitFixed
Selection.HomeKey Unit:=wdStory
Selection.HomeKey Unit:=wdStory
Selection.MoveRight Unit:=wdCell
Selection.MoveRight Unit:=wdCell
Selection.SelectColumn
Selection.Delete Unit:=wdCharacter, Count:=1
Selection.Rows.ConvertToText Separator:=wdSeparateByTabs, NestedTables:= _
True
Selection.Find.ClearFormatting
Selection.Find.Replacement.ClearFormatting
With Selection.Find
.text = "^t^p"
.Replacement.text = "^p"
.Forward = True
.Wrap = wdFindAsk
End With
Selection.Find.Execute Replace:=wdReplaceAll
Selection.Find.Execute Replace:=wdReplaceAll
With Selection.Find
.text = "^t"
.Replacement.text = "\\"
.Forward = True
End With
Selection.Find.Execute Replace:=wdReplaceAll
ActiveDocument.Save
End Sub
Potom se ujistěte, že jste v souboru s databází a že máte pořízenu její kopii. Všechny ostatní dokumenty raději zavřete, zvlášť v případě, že jste v užívání maker začátečníky. Pak kombinací Alt+F8 vyvolejte dialogové okno s makry. Ze seznamu vyberte makro PCTranslatorÚpravaDatabázeDZ a spusťte je. V lepším případě je hotovo; nemám program k dispozici, ale myslím, že by to mělo snad fungovat. Pokud jste to zkoušeli, tak mi prosím dejte vědět, jak to dopadlo.
Snad bude dobře postup, jak pracovat s elektronickým slovníkem a vypisovat si slovíčka, v jednoduché formě poněkud konkretizovat pro ty, kdo s prací s elektronickým slovníkem dosud nemají mnoho zkušeností, a doplnit několik poznámek a tipů.
Začátky. Poté, co si z CD nebo z instalačního programu staženého z internetu elektronický slovník nainstalujete, podívejte se do nápovědy, v níž by mělo být popsáno, jak s ním efektivně pracovat. Pak jej spusťte, projděte si základní funkce a osvojte si jejich užívání. Prohlédněte si Nastavení, pokuste se zjistit nebo si domyslet, co které možnosti nastavení znamenají, a nastavte je tak, aby byly pro vás co nejvýhodnější. Na ledacos člověk přijde až během další práce.
Hledání a vypisování slovíček. Pokud váš slovník nabízí možnost automaticky vyhledávat slova vložená do schránky, je poměrně výhodné si tuto funkci zapnout (pokud vás bude obtěžovat, lze ji zase kdykoli vypnout). Konkrétní práce pak vypadá asi takto: při čtení textu v cizím jazyce či procházení učebnice apod. máte zapnutý počítač a v aktuálním okně máte otevřený soubor založený na bázi vzorníku, který najdete zde. Ten si vytvoříte velmi jednoduše: uložíte si tuto webovou stránku na disk či disketu (Soubor / Ulož jako); pak, až budete chtít s vypisováním slovíček začít, otevřete si tuto stránku, kterou jste si předtím uložili, vložíte si do schránky (Ctrl+C) část tabulky z vzorníku včetně znaků napravo od tabulky, v textovém editoru si vytvoříte nový soubor, zadáte Ctrl+V jednou nebo lépe opakovaně, např. dvacetkrát, a vytvoříte si tak např. šestistránkovou dvousloupcovou tabulku (nebo třísloupcovou, jak se vám to hodí). Pak si soubor uložíte (např. jako slovicka-aj-1.doc; můžete mít také jediný soubor na všechna anglická slovíčka, kupř. slaj.doc). Pak spustíte elektronický anglický slovník, minimalizujete ho a začnete normální práci s učebnicí, knihou atd. Když narazíte na neznámé slovíčko, napíšete si je do levého sloupce, pomocí šipky vlevo a tlačítka Shift, resp. označením myší (které je ovšem pomalejší) je vložíte do schránky a slovník je buď začne automaticky hledat (pokud podporuje funkci „Vkládat automaticky ze schránky“ a máte ji aktivovanou), nebo musíte jeho okno aktivovat a vložit do něj slovíčko prostřednictvím Ctrl+V a stisknout Enter. Když hledání dokončí, zobrazí vám jeho výsledek. Vy si vyhledaný výraz (výrazy) po svém zpracujete (vypíšete) nebo přes schránku zkopírujete do pravého sloupce. Pokud slovník požadovaný výraz nenašel nebo nejste s výsledkem hledání spokojeni, budete nuceni vyhledat výraz v knižním slovníku (pokud možno co nejrozsáhlejším a nejkvalitnějším). Výsledek tohoto hledání v knižním slovníku (nejlépe všechny nalezené významy, ne jen ten, který zrovna teď potřebujete) doplníte do téže buňky v pravém sloupci, přesunete se, např. pomocí šipek, do levého sloupce své tabulky o řádek níže a pokračujete v práci. Podobně postupujeme v případě překladu z češtiny do cizího jazyka, ovšem s tím, že cizí jazyk neovládáme tak dobře jako mateřský a na jazykový cit se v případě cizího jazyka můžeme spolehnout jen omezeně, a že je tedy nutno věnovat vyhledávání ještě větší pozornost. Při tomto směru překladu budeme nuceni hledat v knižních slovnících častěji, pokud nemáme opravdu velmi kvalitní elektronický slovník.
Zní to snad jako popis nějaké zdlouhavé operace (což je dáno snahou o maximální srozumitelnost), ale jakmile získáte v tomto postupu jistou zručnost a jakmile zjistíte, jaké možnosti Nastavení slovníku vám nejlépe vyhovují, jistě budete souhlasit, že je to celé otázka několika sekund (konkrétní čas závisí především na rychlosti vašeho psaní a na rychlosti vašeho počítače). Pozn.: Velmi doporučuji se naučit klávesové zkratky znaků užívaných v jazyce, s nímž pracujete.[25] (Pozn.: některé slovníky – včetně Millennia – umožňují uložení výsledku hledání do souboru; v Millenniu se toho docílí pomocí Ctrl+S či příslušným příkazem pod nabídkou, kterou vyvoláme pravým tlačítkem myši. V některých případech je příjemnější si výsledek hledání zaznamenávat takto, nikoli přes opisování či vkládání. Výše uvedený způsob je nicméně zřejmě lepší, zejména proto, že můžeme snadno vpisovat i své postřehy a poznámky, můžeme si členit heslo podle svého, dokument je graficky přehledný atd. Je třeba trochu experimentovat a hledat způsoby co nejúčinnější, nejrychlejší a našim potřebám nejlépe vyhovující. Word nabízí možnost jednoduchého převodu textu na tabulku pod Tabulka / Převést, kde si můžete ze souboru, kam jste si uvedeným způsobem slovíčka ukládali, převést tento text na tabulku; jako oddělovač vyberte tabulátor. Obdobně lze, pokud vám tento způsob vyhovuje více než oklika přes Poznámkový blok, převést tabulku na text oddělený tabulátory, to jest do formátu, který se dá importovat.[26]
Výsledky své práce (soubor se slovíčky) si neopomeňte zálohovat ještě minimálně na jedno médium (CD, disketa...).
Když ukončíte jistou etapu práce, výše popsaným způsobem si ze svého souboru importujte slovíčka do uživatelské databáze svého elektronického slovníku.[27] Postup importu se liší podle toho, jaký slovník používáte; viz výše pod anotacemi jednotlivých slovníků. Soubor si samozřejmě můžete vytisknout a s vytištěným dokumentem dále pracovat: zvýrazňovat, přeložit v půli a kontrolovat svou znalost daných slovíček a učit se je atd.
Poslední fází tohoto procesu by mohlo být zaslání vašich souborů se slovíčky níže popsaným, velmi jednoduchým způsobem na adresu správce těchto stránek (david.zbiral@post.cz; můžete také použít tento formulář), který pak vaši databázi připojí k té, která je zde již publikována, aby si ji kdokoli mohl stáhnout, popřípadě ji publikuje samostatně, pokud jde o databázi jazyka, který tu dosud chybí. Pokud se k tomuto poslednímu kroku rozhodnete, budu vám zavázán já i všichni uživatelé, kteří budou mít díky vám databázi zase o něco širší. Nemusíte se strachovat, že je vaše databáze příliš malá: každá troška je velkou pomocí. K e-mailu prosím připojte prohlášení o původnosti práce[28] a výslovné svolení k publikaci.
Práce se slovníky online: nepracuje se s nimi vždy nejlépe a nejefektivněji, ale tato práce se dá v mnohém ulehčit, např. už tím, že se naučíte rychle přeskakovat mezi okny pomocí Alt+Tab. Je dobré si též vložit často používané slovníky do „oblíbených položek“.[29]
Tipy pro práci s PC. Přehledně tematicky rozčleněné a poměrně obsáhlé tipy pro práci s PC (některé pro začátečníky, jiné i pro pokročilé) lze najít na adrese http://www.david-zbiral.cz/PC-tipy.htm. Najdete tu kapitoly o mnoha programech, o Wordu, o správě souborů, další poznámky o slovnících aj. Myslím, že by to mnoha lidem mohlo pomoci, pokud chtějí pracovat efektivněji s PC, aniž by se z nich museli stát profesionálové. U PC platí, že trocha časové investice do získání know-how alias savoir-faire vám uspoří v budoucnu mnoho času a úsilí. Je dobré trochu studovat materiály o práci s PC. Mnoho programů takové studium nevyžaduje, ale skutečně efektivní práce s PC (která výsledně práci velice šetří) takovouto investici vyžaduje vždy.
Kdo někdy trochu více pracoval s elektronickým a knižním slovníkem, bude pravděpodobně souhlasit s tvrzením, že elektronické slovníky nesmírně zrychlují a ulehčují práci. Avšak mnohé, zvláště zdarma distribuované elektronické slovníky dostatečně neuvádějí omezení významu a tzv. minimální kontext (a nenajdeme ho leckdy ani v rozšiřujících, placených databázích), tj. některá základní spojení, v nichž se příslušné slovo často používá (a tedy i návod, kde je lze takovým a takovým způsobem užít bez nebezpečí omylu), také tu často není valence a spojitelnost slova, gramatické zařazení atd. Mnohé elektronické slovníky najdou sice třeba značný počet ekvivalentů požadovaného výrazu v druhém jazyce, ale nespecifikují významové rozdíly mezi jednotlivými vyhledanými jednotkami a ne vždy uvádějí, v jakém kontextu lze ten který výraz či obrat použít a v jakém je naopak vhodné zvolit nějaký jiný. Krom toho žádný slovník, ani ten, který minimální kontext hojně uvádí, nemůže být dokonalý.
Varování před elektronickými slovníky, které lze často zaslechnout, je skutečně v mnoha případech do značné míry oprávněné. Ale problém (a to je nutno zdůraznit) nespočívá v samotných elektronických slovnících; ty svými možnostmi naopak daleko převyšují slovníky knižní. Problém tkví v kvalitě databáze. Níže nastíněný projekt si klade za cíl databázi elektronických slovníků doplňovat a zlepšovat (pokud jsou elektronické slovníky daného jazyka dostupné), popřípadě postupně vytvářet (pokud dostupné nejsou), a to s vynaložením jen toho úsilí, jež většinou potenciální účastníci projektu už nyní tak jako tak vynakládají.
Všem zájemcům, kteří pracují s cizími jazyky (studenti, amatérští i profesionální překladatelé, pedagogové atd.), navrhuji podílet se na projektu, jehož prvními skromnými plody jsou slovníky publikované na adrese http://www.david-zbiral.cz/jazyky.htm a také v tomto dokumentu.
Celý postup, jak přispět k úsilí o zkvalitnění elektronických slovníků, je velmi prostý. Vypisujte si vyhledaná slovíčka nikoli rukou do papírů, nýbrž do souboru v počítači. Zvlášť pokud pracujete s elektronickým slovníkem, jenž umožňuje hromadný import databáze (většina existujících produktů), rozhodně nebudete litovat vynaloženého úsilí, neboť z tohoto souboru lze potom snadno importovat slovíčka, která jste byli nuceni hledat v knižních slovnících apod., do svého slovníku elektronického, popřípadě do elektronického slovníku touto cestou doplnit vlastní poznámky o kontextu či významu, v jakém jste se s daným výrazem setkali v tisku či literatuře a který váš elektronický slovník neuvádí. Když pak budete znovu hledat tentýž výraz (mně se to alespoň stává dosti často) nebo si ho napoprvé zapamatujete pouze pasivně a při překladu do cizího jazyka budete uvažovat, jak převést svou myšlenku z mateřského jazyka do jazyka cizího, tak se vám tyto přírůstky k databázi budou velmi hodit. Samozřejmě že tyto textové soubory, do nichž jste si vypisovali slovíčka (mohly by být založeny na vzorníku, ušetříte si tak práci; záleží dost na tom, pro jaký slovník a pro jaké účely si slovíčka vypisujete), si lze vytisknout a dále s nimi pracovat (obtížná slovíčka si barevně zvýrazňovat atd.).
Jednoduchý praktický postup, jak si takovou soukromou databázi vytvářet, je tento: v textovém editoru si vytvořte soubor, do něj vložte tabulku (dvou nebo třísloupcovou). Do té pak vypisujte slovíčka; na straně levé by měly být vždy výrazy z cizího jazyka, na straně pravé jejich české ekvivalenty. Tabulku si nemusíte tvořit sami, udělal jsem to za vás: můj vzorníksi můžete uložit na vlastní disk třeba ihned. Z uloženého souboru obsahujícího vzorníky můžete přes schránku (Ctrl+C) rozkopírovat tabulku do vlastních souborů, do nichž si chcete vypisovat slovíčka. Když dospěje toto vaše vypisování slovíček (např. pro studijní účely, přípravu na zkoušky apod.) do určité fáze, kdy se rozhodnete tato slovíčka importovat do svého elektronického slovníku. Jak se to dělá, zjistíte v kapitolách věnovaných jednotlivým slovníkům: Millennium, Lingea Lexicon, Pokluda aj.
Doporučuji si v každém případě, a tím spíš pokud pracujete s jiným slovníkem než s těmi, které uvádím, celý postup importu zkusit hned když si do souboru vytvořeného na základě vzorníků vypíšete několik prvních slovíček. Tak zjistíte s předstihem, zda vám tento postup funguje, a pokud ne, tak můžete hledat jiné cesty, jak si vypisovat slovíčka tak, aby pak šla importovat do uživatelského slovníku.
Kdybyste měli s importem jakýchkoli jednotek problémy i přes pročtení návodů na těchto stránkách a nápovědy programu: v takovém případě se na mě zkuste obrátit a soubor mi zaslat s maximálním množstvím dostupných informací o tom, jaký formát mají jednotky mít (viz např. nápovědu daného slovníku či stránky dané společnosti), a údajem o zdroji jednotek. Já se pokusím jej zpracovat tak, aby šel do Millennia importovat bez problémů (neslibuji, že zrovna budu mít čas a samozřejmě taky nevím, zda to vůbec půjde). O něco bych za to chtěl požádat: o vaše svolení tyto jednotky publikovat na internetu (samozřejmě jen pokud jste jejich autory, a můžete tudíž takové svolení udělit). Připojte proto prosím i informace o své databázi, jak byla získána, jak jste byli pečliví při vypisování, jaký „vztah“ máte k danému jazyku (student angličtiny, čtenář-amatér perské poezie apod.) a případně další informace, abych mohl databázi nějakým způsobem zařadit. Svolení k publikování a prohlášení o původnosti práce prosím v mailu vyjádřete výslovně. Samozřejmě že své jednotky mi zašlete i pokud mou pomoc nepotřebujete, kvůli samotnému vytváření, rozrůstání, zkvalitňování a opravování databází elektronických slovníků.
Je škoda, že se tak málo lidí účastní projektu přispěvatelsky. Kdyby to bylo nějak enormně práce navíc, tak bych tuto neochotu se zapojit celkem chápal, ale záhadou mi je, proč se nezapojí víc lidí, když vypisovat si slovíčka do PC není práce navíc, ale naopak velké zefektivnění a zrychlení práce, jak brzy zjistí ti, kdo tento způsob vypisování začnou praktikovat. Chce to samozřejmě jistou časovou investici do začátku: osvojit si určité zásady, pročíst si některé části této stránky, zaučit se s užíváním počítačového slovníku. Ale pak to začne práci šetřit velmi výrazně.
- Pokud jste dosud podobný import neprováděli, uložte si tuto stránku na svůj disk či na disketu (Soubor / Uložit jako), abyste do ní mohli operativně nahlížet.
- Pokud importujete příliš velké soubory v řádu desetitisíců jednotek nebo pokud se vám zdá, že import probíhá příliš pomalu, tak databázi importujte po částech (vložte třeba pokaždé přes schránku do Poznámkového bloku jen její část, tu importujte, využijte čas importu na práci v jiném okně a po dokončení dílčího importu postup zopakujte s dalšími slovíčky).
- Uživatelský slovník si zálohujte (na disketu, na CD...).
- Pokud jste někde získali nějakou databázi, před importem si ověřte, zda mají její jednotky vhodný formát; např. pokud píší členy před slovo a vám se to nehodí, nejdříve je smažte (přes sofistikované Úpravy / Nahradit ve Wordu)[30] a pak teprve přistupte k importu.
- Když získáte nějakou databázi, která nemá pro import vhodný formát, zvažte, zda jí nelze přes Úpravy / Nahradit vhodný formát dodat. Příklad: stáhli jste si anglicko-českou databázi, která uvádí slovíčka ve tvaru „palm : dlaň“. To vám importovat nepůjde. Ale když nahlédnete do nápovědy svého slovníku, měli byste tam najít, jaký vhodný formát pro import do uživatelského slovníku požaduje; často požaduje, aby slova byla oddělená tabulátorem. Otevřete si soubor ve Wordu (nebo jiném textovém editoru, ale Word má možnosti složitého hledání a nahrazování daleko nejpokročilejší z běžně užívaných editorů) a přes Úpravy / Nahradit zadáte, aby všechny znaky „ : “ (mezera dvojtečka mezera) nahradil za tabulátory a import tím umožníte. Tipy pro složité nahrazování najdete v tipech pro práci s PC v kapitole Word / Hledání a nahrazování.
- Slovíčka lze též scannerem skenovat z tištěných či na stroji psaných prací a dokumentů a pomocí speciálního programu či schopného ovladače skeneru (nové ovladače už většinou tuto možnost mají, ale ne vždy je zpracována dobře) tyto naskenované stránky převádět na textový soubor, jejž je pak možné pomocí funkce Nahradit postupně upravit do vhodného formátu a nakonec data importovat. Dá to hodně práce.
- Velmi přínosné by bylo získat pro projekt někoho, kdo už má nějakou podobnou rozsáhlejší databázi v elektronické podobě (textovém souboru) vytvořenou, např. autora slovníku, učebnice, skript se slovníčkem apod., a byl by ochoten ji poskytnout. Pokud někým takovým jste, tak se prosím přihlaste na uvedeném e-mailu (lze též použít tento formulář). Jestliže někoho takového znáte, zvažte, zda by nebylo možné s ním projekt probrat a dotázat se ho, jestli by nebyl ochoten spolupracovat a soubor poskytnout k posouzení, zda by bylo možné jej převést do žádoucího formátu.
- Když někde objevíte nějakou volně dostupnou databázi, se kterou je možno dále pracovat bez nebezpečí zásahu do autorských práv, tak ji prosím rovněž zašlete nebo – pokud je k mání na Internetu – upozorněte na její umístění.
- U mnoha slovníků netřeba mít obavu, že vám cizí (např. moje) databáze znečistí slovník, uživatelskou databázi totiž ve výsledcích hledání obvykle poznáte podle distinktivní ikonky (v Millenniu třeba „tužka“) a vždy ji spolehlivě odlišíte od základní databáze. Zde publikované databáze jsou dost kvalitní. Ne že by byly bez chyb, ale v rámci možností nekomerčního projektu tohoto druhu, jehož výsledky jsou zdarma, je myslím udržován docela vysoký standard.
- Problémy při exportu: při exportu někdy nastanou problémy. Někdy pomůže exportovat soubor pod názvem ještě neexistujícího souboru a ten stávající nepřepisovat (a pak ho eventuálně vymazat a jeho název dát tomu, který jsme exportem právě vytvořili). Vyzkoušeno, že právě toto někdy vyřeší problémy s přístupem. Jak problému předejít: myslím, že pomůže vůbec nikdy soubor s exportovaným uživatelským slovníkem neotvírat ve Wordu či jiném složitém editoru, nýbrž jen např. v Poznámkovém bloku. Otevřením v Poznámkovém bloku a uložením původního souboru odtud lze také problém řešit a obnovit jeho přístupnost přepsání, přejmenování atd.
Aby uživatelský slovník sloužil tak, jak má, je dobré (a někdy přímo nutné) dodržovat zásady editace hesla. Ty obecné najdete zde, ty, které se slovník od slovníku liší, jsou v příslušných kapitolách.[31] Následující text je určen spíše pro jednoduché vypisování slovíček. O komplexní lexikografii se dovíte víc v kapitole Lingea Lexicon.
- Pozor na apostrofy: je třeba se držet jednoho druhu apostrofu; ve francouzštině a vůbec většině jazyků psaných latinkou či do latinky přepisovaných je to ten znak, který vypadá jako „malá devítka nahoře“ (kdybych ho napsal, tak se vám možná zobrazí špatně, tak ho raději jen popisuji). Nenahrazujte ho čárkou určenou pro české dlouhé samohlásky a následně mezerou, protože to vám pak např. vámi doplněné heslo „s´emparer de“ nenajde. Doporučuji se rozhodně co nejvíc držet grafické normy daného jazyka i v těchto zdánlivých maličkostech, respektive toho, čeho se drží nejlepší běžně dostupný elektronický slovník daného jazyka. V případě Millennia i Lingea Lexiconu je např. používán běžný apostrof v podobě „malé devítky nahoře“ a to je též francouzský zvyk (ač Millennium to bohužel nedodržuje zcela soustavně).
- Obecně ale doporučuji zpracovávat hesla komplexně a zvratná slovesa dávat jako speciální oddíl pod nezvratné heslové slovo (např. s’emparer de qc. pod heslo emparer).
- Uvádět rody u výrazů v cílovém jazyce? Ve slovnících to kolísá; někde se uvádí rod u obou, jinde (i v kvalitních slovnících, např. Neumann – Hořejší a kol., Velký francouzsko-český slovník) jen u hesla cizojazyčného. Tyto databáze jsou přece jen většinou dělané spíše pro Čechy; česky se učí dost málo cizinců. Proto se domnívám, že není nutné uvádět rody i u všech českých významů cizojazyčného výrazu. Neškodí to (jen se možná v hesle trochu hůře orientuje, ovšem jen pokud není použito barevné formátování napojením na stylopis; barva přehlednost řeší), ale není to myslím většinou nutné. Zvlášť u mrtvých jazyků, kde se překládá spíš z nich než do nich, by to bylo zcela nadbytečné.
- Dokonavé a nedokonavé podoby sloves: v knižních slovnících se často neudávají zároveň tvary dokonavé i nedokonavé (např. se v knižním slovníku pod englober uvádí pouze dokonavý tvar pojmout, nikoli tvar pojímat). Ale vzhledem k tomu, že elektronické slovníky hledají poněkud jinak, než hledáme v knižním slovníku, je dobré vypisovat pokud možno oba tvary, protože člověk většinou automaticky hledá ten tvar, na který v textu narazil, nikoli vždy např. tvar nedokonavý.
- Tvary feminina: u substantiv je dobré je vypisovat zvlášť, do samostatného hesla. U adjektiv může postačit (a) buď takový způsob, který je užíván v knižních slovnících (eminent, -e; enchanteur, -eresse), ač je trochu problém v tom, že nelze jen tak uvádět morfematický šef (neboť enchant|eur, -eresse většina elektronických slovníků na vyhledávací dotaz „enchanteur“ nenajde) a uživateli nemusí být vždy jasné, kde morfematický šev je, nebo (b) lze oba tvary vypsat v plném znění, což je zřejmě jistější. Obecná zásada zní: tam, kde je to dost jasné (např. petit, -e) to snad stačí takto, ale např. u enchanteur je lepší vypsat celé enchanteresse.
- Využívejte k vypisování slovíček takový formulář, který umožňuje data prostřednictvím Poznámkového bloku či jiného velmi jednoduchého textového editoru do uživatelského slovníku importovat; funkčnost pro Millennium je ověřena pro vzorník. Doporučuji si uložit celou stránku se vzorníkem (Soubor / Uložit jako) a pak si přes schránku (Kopírovat a Vložit) rozkopírovat tabulky do všech souborů, v jakých je chcete mít; opakovaným vkládáním ji prodlužujete (pokud ji označíte jen po první enter následující za tabulkou).
- V tabulce (viz vzorníky) se během práce pohybujte spíše pomocí tabulátoru a šipek[32]než pomocí myši; šetří to čas. Vůbec se snažte přijít na co nejvíc možností ulehčení a zrychlení, které vám počítač nabízí a které by bylo škoda nevyužít.[33]
- Různé tvary slov: ve slovníku, který je určen pokud možno pro oboustranné používání,[34] je třeba dodržovat trochu jiné zásady než v knižním slovníku. Např. pokud si zapíšeme do souboru (a následně importujeme) jednotku „faux m. padělek, falsum“, tak ten, kdo hledá „falzum“, tuto jednotku nenajde. Mysleme na to a pišme do svých materiálů určených pro následný import či zaslání toto: „faux m. padělek, falsum, falzum“. Odmítat to takto dělat a křečovitě lpět na zásadách knižní lexikografie (kde je oboustranné užití vzhledem k naprosto nepružným a chabým vyhledávacím možnostem vyloučené) by bylo nerozumné a zpomalovalo by proces zkvalitňování a doplňování databází elektronických slovníků.
- Dbejte na maximální možnou spolehlivost své databáze, a to jak co do správnosti (to především), tak pokud možno co do úplnosti (vypsání všech základních významů daného slova, které uvádí kvalitní slovníky). Pokud si nějakým významem nejste jisti, vložte za výraz otazník. Pokud chcete nějakou neobvyklou skutečnost zdůraznit, můžete použít např. vykřičník či latinský výraz „sic“. (Příklad: recrue f. [sic!] rekrut.)
- Do levého sloupce tabulky vypisujte slovíčka cizího jazyka, do pravého jejich české ekvivalenty.
- Slova jazyků užívajících cizích abeced přepisujte do latinky podle zásad obvyklých pro daný jazyk, ale nepoužívejte znaky, které elektronické slovníky nerozpoznají (např. jery). Hledejte možnosti alternativního zápisu, např. jer ъ [snad se vám to zobrazuje dobře] přepisujte podle systému transkripce bulharštiny jako a s obloučkem (ă, napíšete pomocí Shift+Ctrl+č, pak kombinaci pustíte a napíšete a).
- V jazycích, které mají člen, tento člen neuvádějte: místo něj dávejte za dané slovo standardizované zkratky rodu m. (masculinum, mužský rod), f. (femininum, ženský rod), n. (neutrum, střední rod), pochopitelně u jazyků, které s rody pracují. Tyto členy od vlastního slova neoddělujte čárkou. Stejně tak všechny potřebné poznámky klaďte (pokud nepracujete s Lingea Lexiconem či obecně vzato slovníkem, který se propracovává z obou stran) až za příslušné slovo. Doporučené zkratky najdete v seznamu zkratek.
- Elektronické slovníky a konstrukce hesla: elektronické slovníky fungují na jiném principu než knižní. V knižním je např. dobré napsat „požádat koho o pomoc“. Ale v elektronickém raději „požádat o pomoc koho“ – v tomto sledu. Zvýší se šance na vyhledání i u slovníků, které podporují uživatelskou volbu logických operátorů jen nedokonale či vůbec.
- Je třeba uvážit, zda bude lépe vkládat různé významy jednotlivě nebo všechny do jedné buňky tabulky. Např. pokud se rozhodnete zapsat si pět možných českých překladů určitého výrazu, tak toto slovo lze vypsat do pěti řádků levého sloupce (popřípadě je tam vložit pomocí schránky, aby nebylo nutné je pětkrát vypisovat) a každý z pěti českých významů napsat na jeden řádek pravého sloupce. Toto jednotlivé vypisování má své výhody i nevýhody. Mezi výhody patří, že pokud některý slovník nepodporuje hledání všech jednotek, v nichž je dané slovo obsaženo, nýbrž hledá pouze podle počátečních písmen prvního slova, tak vám při hledání opačným směrem (z češtiny do cizího jazyka) tento význam nenajde.[35] To by se vám v případě, že pracujete s databází uvádějící významy jednotlivě, a sami ji tak také tvoříte, stát nemohlo. Nicméně tento postup má i své nevýhody: 1.) je pracnější; 2.) když si ten, kdo později bude s vaší databází pracovat, najde významy vypsané jednotlivě, musí si je vypsat nebo zkopírovat do svých materiálů po jednom, kdežto pokud jsou všechny významy na jednom řádku, tak na něj prostě klepne myší, vloží ho do schránky a celé heslo si pak zkopíruje do svých materiálů. v zásadě si můžete z obou možností vybrat podle toho, jaký typ slovníku využíváte. Doporučuji následující normy: 1.) Významy, které se vztahují ke stejnému heslovému slovu, ale různým slovům z hlediska slovního druhu (roman románský sloh; románština; román), nespojujte do jednoho hesla (zde se např. mísí adj. a subst.). 2.) Ty významy, které jsou kvazisynonymní nebo úzce související, oddělujte čárkou, ostatní středníkem. 3.) Opište ze slovníku pokud možno všechny základní významy daného slova; to vám dovolí jednak širší rozhled v lexikálním systému daného jazyka, jednak vám to později ušetří práci, neboť pokud umíte nebo se naučíte psát na PC dosti rychle, tak čas potřebný pro zapsání všech významů je zanedbatelný ve srovnání s časem potřebným na vyhledání slovíčka v knižním slovníku. Pokud vypisujete ze slovníku i minimální kontext (vazby, v nichž se slovíčko používá, a příklady užití), popřípadě jeho část (tu vazbu, která vás zaujme či ve které jste na slovíčko narazili), tak je už raději nedávejte do stejného řádku tabulky, nýbrž je vypisujte jednotlivě do dalších řádků (výjimkou jsou opět slovníky umožňující komplexní lexikografické zpracování, např. Millennium).
- V dokumentu, kam si vypisujete slovíčka, si vypněte automatické dělení slov (Word: Nástroje / Jazyk / Dělení slov), jinak by se vám některá slovíčka importovala např. v podobě „ryb-ník“ a kdybyste později vy nebo ten, kdo s vaší databází bude pracovat, hledali slovo rybník, tak vám slovník toto heslo nevyhledá.
- Nic vám nebrání ve wordovských souborech vytvořených na základě vzorníku využívat tučné písmo a kurzívu pro zvýraznění těch skutečností, které jsou důležité pro vás osobně (např. zvýraznění rodu, který jste si dříve špatně zafixovali apod.); do uživatelského slovníku se při importu toto formátování písma nepřenese (v případě většiny slovníků). Totéž platí o vkládání poznámek pod čarou (Vložit / Poznámku pod čarou, resp. velmi rychle pomocí klávesové zkratky Alt+L, potom N); ani ony se nepřenesou, lze do nich tudíž psát soukromé poznámky, které by podle vás byly ve sdílené databázi nadbytečné, ale chcete je mít ve svých dokumentech (např. přípravách na zkoušky ze slovní zásoby).
- Do hesel v tabulce založené na níže publikovaném formuláři nevkládejte znaky tabulátoru ani konce řádku; při importu by dělaly problémy.
- Pokud je nějaká skutečnost netypická, hodná zdůraznění apod. a máte ji dobře ověřenu, je dobré i ostatním uživatelům naznačit, že o příslušném problému víte a že máte z důvěryhodného zdroje zjištěno, že tomu je skutečně tak, jak uvádíte. (Příklad: když napíšete „recrue f. rekrut“, tak to mnozí uživatelé budou považovat za chybu a stejně si budou muset ověřit ještě jinde, zda slovo rekrut je ve francouzštině skutečně ženského rodu. Ale když napíšete „recrue f.! rekrut“ nebo „recrue f. [sic!] rekrut“, tak budou vědět, že nejde o překlep, nýbrž o ověřenou informaci.)
- Lze označit myší sloupec tabulky s českými slovy (ve Wordu myší, jejíž ukazatel se sám změní v malou černou šipku, klepněte na jeho první čáru úplně nahoře) a provést v něm kontrolu pravopisu (F7), automatickou či ruční; tak najdete a opravíte případné překlepy. To dělejte zvláště tehdy, když si po sobě již slovíčka před importem, popř. zasláním nebudete znovu v celku číst.
- Párové spojky: např. not only - but also. Doporučuji je psát takto se spojovníkem, což je zavedená zvyklost v knižních slovnících (tj. ne se třemi tečkami). Ale jsou i případy, kdy je spojovník nevhodný (to nastává často tam, kde nejde o párovou spojku, nýbrž o výraz o dvou částech, mezi které se ještě vkládá nějaké slovo).
- V nastavení některých elektronických slovníků lze zvolit, aby automaticky vyhledával slova, která vložíte do schránky. Pokud si na to zvyknete, tak to může velmi zrychlit a ulehčit práci. Čtete si např. cizojazyčný text, narazíte na neznámé slovíčko, zapíšete si je do levého sloupce souboru vytvořeného na bázi „vzorníku“ (viz níže), označíte je (velmi rychle pomocí tlačítka Shift+Ctrl+levá šipka), vložíte je do schránky (Ctrl+C nebo Ctrl+Insert) a slovník, minimalizovaný na dolní liště, popřípadě v neaktivním okně[36] začne slovo automaticky hledat. Jakmile je najde, maximalizuje / aktivuje se a zobrazí vám výsledek hledání, vy si výsledek zapíšete nebo přes schránku zkopírujete do pravého sloupce svého souboru se slovíčky a pokračujete ve čtení.
- Pokud vám slovník proti vaší vůli automaticky přepíná klávesnici na cizojazyčnou, a to nejen v rámci samotného slovníku, nýbrž i v dokumentu, do nějž si slovíčka vypisujete, mělo by jít v nastavení slovníku zadat příkaz, aby komunikoval stále pomocí české klávesnice.
- Dalšího zrychlení lze docílit tím, že se naučíte klávesové zkratky speciálních znaků, které používá cizí jazyk, s nímž pracujete (např. francouzský accent grave se ve Wordu, přinejmenším v jeho novějších verzích, vkládá pomocí Ctrl+Alt+ý a následným napsáním příslušného písmene; lomený accent se vkládá stejně, jen místo písmene ý se užívá š). Tyto zkratky lze zjistit tak, že si příslušný znak najdete pod nabídkou Vložit / Symbol a označíte si ho; v otevřeném okně by se vám měla zobrazit jeho klávesová zkratka.
- Nenechte se těmito rozsáhlými zásadami odradit od práce na počítačových slovnících. Pokud není ve vašich silách je dodržovat nebo některé nemáte za účelné, nezdráhejte se databázi přesto zaslat: bude velkou pomocí i tak.
Zatím byla řeč o individuální části projektu, která podle mé zkušenosti každému jednotlivci velmi ulehčí práci s jazykem, překlady, porozumění textu atd. Ale vlastní projekt spočívá především ve spolupráci mezi uživateli elektronických slovníků. Navrhuji těm čtenářům, kteří si budou výše uvedeným způsobem doplňovat databázi svého elektronického slovníku, aby svou databázi dali k dispozici i dalším uživatelům, a to tím způsobem, že příslušný soubor (soubory) publikují na internetu.
Je zřejmé, že mechanismus kontroly je slabinou celého projektu. Kontrola souborů, které mi dojdou, by byla stejně pracná jako hesla sestavit sám (nebo i pracnější). Hloubková kontrola není možná bez člověka, který by byl ochoten ji provádět, a bez finančního zabezpečení projektu. Už na mě bylo směřováno několik mailů či ústních námitek, které pochybují o možnosti dobrat se takto něčeho pozitivního. Jistý korespondent se nechal slyšet: „Nesdílím [...] Váš optimismus v tom, že volnou spoluprací většího okruhu lidí na vytváření slovníků se lze dopracovat něčeho pozitivně významného. [...] NIKDY BYCH NEPOUŽÍVAL K SERIÓZNÍ ČINNOSTI SLOVNÍK, O KTERÉM BYCH VĚDĚL, ŽE SE NA NĚM PODÍLELO MNOŽSTVÍ LIDÍ, ZA JEJICHŽ KVALIFIKOVANOST NIKDO NERUČÍ.“ Tento postřeh míří do samotného jádra problému (ač si neodpustím poznámku, že umím docela dobře číst i malá písmena). Zároveň se ale nevyhne několika nepřesnostem či ukvapeným soudům. Protože podobné, v zásadě oprávněné námitky jistě vyvstanou v té či oné podobě na mysli většině čtenářů, snad nebude od věci uvést několik poznámek, které by se pokusily vidět problém v trochu jiném světle.
- Poznámka o „dobrých“ a „špatných“ slovnících. Neexistují slovníky dobré a špatné takříkajíc in essentia. Jinak řečeno: akademický slovník může být „nejlepší“, ale pokud jedeme na dovolenou za sluncem a mořem, dáme přednost něčemu s menší hmotností a menším objemem. A pokud bychom rádi věděli, jak se řekne „stáhnout (z internetu)“ či „kliknout“, rovněž sáhneme (alespoň toho času) raději po jiném slovníku (či obecněji řečeno jiném zdroji informací). To stejné platí i v případě, že jsme si jistí, že nám někdo sprostě nadával, ale chceme si upřesnit smysl některých výrazů. Akademický slovník nám v takovém případě příliš nepomůže. Co chci říci tímto úvodem: výhradně to, že kvalita slovníku není absolutní, nýbrž relativní vlastností. Závisí na potřebách konkrétního subjektu v konkrétní situaci. Proto je klíčové vědět, kdy který slovník použít (ze strany lexikografa to znamená vědět, k čemu je jeho slovník určen, kdo jsou jeho adresáti, v čem jsou přednosti jeho slovníku a v čem naopak omezení, atd.).[37] Např. databáze slovníku Millennium nám skvěle poslouží, když zapomeneme slovíčko, ale pasivně ho hned poznáme, nebo když excerpujeme cizojazyčnou literaturu, nebo když hledáme nějaké dostatečně určité výrazy (sedmikráska) nebo konečně když překládáme z cizího jazyka do mateřského (takže se můžeme spolehnout na jazykový cit). Naproti tomu když něco překládáme do jazyka cizího a potřebujeme použít neznámou vazbu, nahlédneme raději i do slovníku akademického či do Lingea Lexiconu, kde heslo není konstruováno pouhým seznamem významů, nýbrž sofistikovaněji. Podstatné je, že práce s akademickými, technickými a jinými knižními slovníky a slovníkem elektronickým se nevylučuje, nýbrž doplňuje. Pokud si i z knižních vypisujeme do počítače, tak lze tyto dva způsoby hledání velice organicky skloubit a dosáhnout velmi účinného a rychlého, a přitom kvalitního vyhledávání (a mít jednotky zaznamenané a importované do uživatelského slovníku i pro pozdější použití a sdílení s jinými uživateli). Musíme zkrátka vědět (či lépe řečeno: musíme se postupně učit), kdy se můžeme spokojit s tím, co nám vyhledal elektronický slovník, a kdy máme doplnit, upřesnit či opravit výsledky za použití informací z akademického či jiného slovníku (slovník neologismů, vulgarismů, odborné technické slovníky atd.). Neexistuje jedna seriózní činnost, pro kterou potřebujeme výborný slovník, a soubor neseriózních činností. Relevantnější jsou tu spíše otázky: 1.) nakolik je výstupový text definitivní a určený k uveřejnění (překlad určený pro nakladatelství Vyšehrad × soukromá excerpta); 2.) nakolik již daný jazyk známe (a tudíž nakolik dokážeme odfiltrovat chyby nebo překlepy v elektronickém slovníku); 3.) nakolik se výstup musí doslovně držet originálu (překlad × výpisky); 4.) zda vstupujeme do přípravy textu s jistou předchozí znalostí problematiky či samotného textu; 5.) zda překládáme do mateřského, nebo naopak do cizího jazyka, atd. atd. Tyto a další faktory je třeba zvážit. Myslím, že velmi dobrý je ten postup, že pracujeme se zapnutým počítačem a neznámá slova necháme vyhledat elektronickému slovníku a na základě výsledku a uvážení výše zmíněných okolností se teprve rozhodneme, zda je třeba nahlédnout do jiného slovníku, či nikoliv.
- Kvalifikovanost a nekvalifikovanost účastníků projektu. Myslím, že primárně vůbec nejde o kvalifikovanost (vynecháme-li nutnost dodržovat jisté – ovšem zcela mechanicky osvojitelné a velmi jednoduché, na této stránce zčásti navržené – formální náležitosti). Problémem je spíše pečlivost práce a jistá osobní zodpovědnost.
- Chyby ve slovnících. Chyby je třeba rozlišit na nebezpečné a „bezpečné“. Např. jestliže mi někdo pošle jednotku „dénonciation m. udání“, tak se sice mýlí (přisoudil tomuto slovu mužský rod), ale jde o chybu naprosto zanedbatelnou, protože naprosto každý, kdo přišel s francouzštinou do styku, bezpečně ví, že –ion je typická přípona substantiv ženského rodu.
- Nezapomínejme, že k označení spolehlivosti hesla slouží také znaky jako vykřičníky a otazníky, kterými sám účastník naznačuje míru své jistoty. (příklad: car-navette ?f.?). Také může krátce naznačit některé další poznámky (třeba jako mé „v ak. sl. nenal.“ – v akademickém slovníku nenalezeno). I to ušetří práci.
- V databázích pro Lingea Lexicon mám speciální značku pro označení zdroje zpracování a veškerých soukromých či polosoukromých poznámek: <z.>.
- Poznámka o strachu z mračna přispěvatelů: zatím se ukazuje jako neopodstatněný...
Nynější mechanismus kontroly je dosti skromný, ale musí to z časových a finančních důvodů stačit (ostatně je asi na místě tento problém řešit až ve chvíli, kdy by mi ve větší míře začaly docházet příspěvky). Obecně spočívá na těchto základech:
- Zvážení dostupných informací o přispěvateli a pramenech jeho souboru jednotek.
- Dílčí důvěra v princip, že spolehlivost je v zájmu samotného přispěvatele (který si slovíčka hledá pro sebe: ke zkoušce, za účelem překladu atd.). Já vytvářím databáze dost pečlivě, ač se v nich samozřejmě chyby najdou.
- Automatická kontrola pravopisu české a u některých jazyků i cizojazyčné části.
- Zběžné přehlédnutí, kontrola speciálních znaků.[38]
- Několik namátkových kontrolních sond; v případě špatného výsledku další ověřování a případně až nepublikování daného souboru jednotek na těchto stránkách či jeho publikování samostatně, s příslušnou poznámkou.
- Apel na všechny uživatele zde publikovaných databází, aby na e-mailu david.zbiral@post.cz upozornili alespoň na ty chyby, které jsou „nebezpečné“ (tj. ty, které nejsou očividné).
- Vlastní kontrola jednotlivými uživateli, kteří nejen mohou upozorňovat na chyby, ale také si v průběhu práce dělají jistý celkový obraz o databázi, kterou si z těchto stránek stáhli, o její spolehlivosti pro ten či onen typ práce atd. a vyřazují z uživatelského slovníku chybné jednotky.
- Jak říkám: skromné, ale musí to stačit.
Pakliže víte o nějakých adresách, z nichž si lze stáhnout slovníky a které se necitují v rozcestníku, popřípadě o volně přístupných databázích slovíček, tak pošlete odkaz, nejlépe i s co nejoficiálněji znějící anotací, na adresu david.zbiral@post.cz (můžete použít též tento formulář). Pokud znáte lidi, kteří si vypisují slovíčka do PC nebo je k tomu lze přemluvit, tak je neváhejte s tímto projektem seznámit.
Základní údaje a obecný popis pracovního postupu
Následují spíše obecné informace.
Nejsem si vědom žádného zákonného ani etického důvodu, který by bránil využití elektronického slovníku kromě jeho původního určení i k účelům dalším, pokud to ovšem nezapovídají příslušné licenční podmínky. Zejména si jej lze nainstalovat na disk několikrát (do různých adresářů) a jeden z exemplářů využívat pro účely práce s jinou databází, např. řekněme soukromým tibetsko-českým a česko-tibetským slovníkem, který si uživatel sám vytváří tak, že si popsaným způsobem postupně spisuje databázi tibetských slov (přepsaných do latinky), čas od času ji importuje do uživatelského slovníku a zvolí, aby program hledal pouze v uživatelském slovníku (zvlášť pokud si tyto tibetské výrazy tak jako tak vypisuje, tak není důvod, proč toho tímto způsobem nevyužít).[39] To stejné je samozřejmě možné s umělými jazyky a nejen s nimi; uživateli se otvírá celá škála využití. Pokud někdo pracuje s nějakým jazykem dlouhodobě a slovník daného jazyka není dostupný na Internetu, tak se tento postup, jenž na první pohled vypadá jako nerealizovatelný a přesahující lidské síly, ukáže sice jako pomalý, ale přinášející už záhy plody. Celý proces samozřejmě významně zrychlí spolupráce a sdílení výsledků individuálního úsilí s ostatními uživateli elektronických slovníků, zejména přes internet. (Tip: ani v tomto případě nezapomínejte na antivirovou kontrolu.)
Je samozřejmé, že do uživatelského slovníku můžeme připojovat nejen slovíčka, která si sami vypíšeme ze slovníků, popřípadě slovíčka v souborech na internetu, které jsou k tomu přímo určeny a mají požadovaný formát vhodný pro import, nýbrž v zásadě veškeré databáze tohoto typu (výraz v jednom jazyce – jeho ekvivalent v jiném jazyce), které někde získáme a se kterými si dokážeme pohrát tak, aby nabyly správného formátu (viz výše příklad se zaměňováním „ : “ za „tabulátor“, tipy pro složitější převody na http://www.david-zbiral.cz/PC-tipy.htm, oddíl věnovaný funkci Nahradit).
Zvažuji provozování slovníků na vlastní platformě, k jejímuž vytvoření by bylo použito jádra prohlížeče Mozilla (který je distribuován jako otevřený kód a jeho využití k vytvoření odvozeného díla je za splnění určitých podmínek zákonné). Slovníky by byly ve formátu XML či HTML a jejich stylopis v CSS, respektive by byly do XML či HTML dynamicky generovány z databáze, ale program by uměl navíc oproti prohlížeči prohledávat fulltext s použitím operátorů AND, NOT, OR, NEAR (s nastavením přesné vzdálenosti slov, již by bylo možné zadat i rozsahem, např. NEAR1-2; NEAR2 by mohlo znamenat právě ve vzdálenosti 2, někdy se to hodí) a "" (přesný výraz), přičemž mezera mezi dvěma hledanými výrazy by znamenala nalezení obou nezávisle (tj. ani operátor OR, ani AND, protože ty se týkají fulltextu, kdežto mezera by znamenala nalezení nezávislých heslových slov), přizpůsobil by se specifickému užití na zobrazování slovníků, takže by nabídl veškerý komfort slovníkové platformy, jejž prohlížeč využívaný pro práci se slovníky nemá, slovníky by naindexoval, aby se prohledávání zrychlilo, zobrazoval by výsledky nalezené v jednotlivých slovníkových titulech podobně přehledně jako Lingea Lexicona umožnil by prohledávání pomocí vícera kritérií (třeba: najít všechna slova, která mají germánskou etymologii, jejichž etymon začíná na b a která jsou poprvé dosvědčena v 11. století; pokud jsou hesla korektně formátovaná, jako ve fiktivním příkladu <firstocc>1038</firstocc> <etym><geogr>germ.</geogr>baro</etym>, tak to vůbec není nemožné – stačí, tak si to aspoň představuji, naindexovat zvlášť jednotlivá pole a při hledání za použití vícera kritérií to použít. Hledalo by se buď základním heslovým hledáním (bez formuláře, jednoduchým políčkem), nebo pokročilým hledáním přes formulář, který by právě měl kolonky zahrnující všechny značky (políčka Etymologie atd.). Tam by uživatel zadal kritéria (včetně možnosti zástupných znaků) a program by mu hesla těmto kritériím odpovídající vyhledal.
Výhodou navázání na zdrojový kód Mozilly je, že by takřka nebylo potřeba programovat nic, co se týká zobrazování – CSS ani speciální znakové entity pro zápis fonetické abecedy, francouzských znaků apod. – tato část práce je hotova. Asi jen jedna věc by byla potřeba pokud jde o vlastní zobrazení, a to doprogramování nadstandardní vlastnosti CSS add-afterbegin add-beforeend: např. kulaté a hranaté závorky uzavírající některé poznámky a různé oddělovače (čárka a mezera oddělující ekvivalenty apod.) by pak nebyly ve zdrojovém kódu slovníku, kde jsou nadbytečné a kód „špiní“, nýbrž v definici stylu dané značky ve stylopise, která by pak vypadala např. takto:
n {font-size: 11pt; color: gray; add-afterbegin: "("; add-beforeend: ")";}
vyslovnost {font-size: 12pt; color: orange; add-afterbegin: "["; add-beforeend: "]";}
ekv {font-size: 13pt; color: black; add-beforeend: ", "}
ekv:last-child {add-beforeend: "";}
atd.
[elsl-s]
Pokud byste uměli takovou platformu naprogramovat, ať už na základě Mozilly či ne, ozvěte se na david.zbiral@post.cz. Ukázku, jak po zobrazení může heslo vypadat, najdete zde, větší vzorek zde.
Samozřejmě dejte vědět také pokud víte o něčem, co podobné možnosti má. Hledal jsem takový program na internetu, ale bez úspěchu. Nikde jsem nenalezl ani náznak takových možností.
Rozcestník s odkazy na četné slovníky dostupné na internetu najdete na stránce Slovníky a jazyky na internetu – rozcestník. Pokud víte o něčem, co stojí za zmínku a v rozcestníku chybí, tak mi prosím pošlete e-mailem zprávu obsahující: 1.) adresu příslušných stránek, 2.) co nejobjektivněji a nejneosobněji formulovanou anotaci, co lze na dané adrese nalézt.
- Zásadní otázku, jak zapisovat speciální znaky a cizí abecedy, je třeba velmi dobře zvážit, než se pustíte do práce. Obecně platí, že pokud používáte náhradní, zástupné znaky, tak by měly být v rámci celého slovníku dokonale distinktivní, aby se daly případně kdykoli v budoucnu hromadně nahradit za správné znaky (např. pro slovníkový program, který to umožňuje) nebo odlišné zástupné znaky.
- Lingea Lexicon: pokud děláte databáze ve formátu pro Lingea Lexicon, tak používejte speciální zástupné znaky (viz v příslušné kapitole).
- Pro jazyky, které mají všechny znaky zastoupeny v té části UNICODE, kterou programy běžně zvládají (PEKI, Mozilla) a která je zpracována v běžných fontech, dělejte slovník v kódování UTF-8 apod. a pište tam přímo správné znaky (patrně moderní řečtina, jazyky používající azbuku, a také přepis výslovnosti – fonetická abeceda IPA).
- U jazyků, kde všechny znaky dostupné nejsou (klasická řečtina, staroslověnština) volte užívání speciálního fontu; dobře si projděte na internetu, jaké fonty jsou zdarma dostupné, vyzkoušejte je a uvážlivě vyberte, který je nejvhodnější a nejpoužívanější, než začnete pracovat. Např. pro řečtinu doporučuji Grenet nebo SPIonic a pro staroslověnštinu svůj font Cyrillic Old Face. Základním předpokladem je, aby byl daný font přístupný zadarmo.
- HTML a XML: používejte číselné znakové entity, nikoli speciální entity typu è apod.
Viz zvláštní kapitolu na stránce Slovníky a jazyky na internetu – rozcestník.
Vypisuji sem některé poznatky z práce s Wordem. Mnohé z nich mají obecnější dosah.
- Pokud předem označíte nějakou oblast jako napsanou francouzsky, tak bude automaticky provádět některé opravy: uvozovky budou zobáčkové, ne české, před dvojtečku, vykřičník a otazník se bude vkládat tvrdá mezera atd.
- Cizojazyčná klávesnice: lze si ji nainstalovat, je součástí instalačního CD Windows. Jak je nainstalovat: vložit instalační CD (mimo Windows XP, kde to není třeba), otevřít ovládací panel „místní a jazykové nastavení“, karta Jazyky, tlačítko Podrobnosti, přidat.
- Cizojazyčná kontrola pravopisu a gramatiky, synonymický slovník, dělení slov: to už je větší problém. Na instalačním CD českého Office 2000 je např. jen kontrola pravopisu, eventuálně gramatiky, těchto jazyků: AJ, NJ a ČJ. Příslušné knihovny dalších jazyků je nutné získat jinak: je třeba mít instalaci Office v daném jazyce. Jaké soubory to jsou? Zjistíte to tím, že spustíte v souboru, kde je za „jazyk“ zvolen jazyk, který vás zajímá, kontrolu pravopisu; informační okénko vás upozorní, které potřebné soubory chybějí. Pro francouzskou kontrolu pravopisu a gramatiky například potřebujete tyto knihovny: msgr2FR.dll, msgrFR32.dll, mssp32.dll, mssp232.dll a Mssp3fr.dll. Kam s nimi? Klasicky do C:\Program Files\Common Files\Microsoft Shared\Proof. Bohužel je ale nestačí prostě zkopírovat (např. po jejich stažení z internetu, kdyby se vám je podařilo někde najít); je třeba je nainstalovat. A k tomu potřebujete instalaci Office či Wordu v daném jazyce. Z instalačního CD by pak stačilo nainstalovat Microsoft Office Sdílené nástroje nebo tak něco. Instalovali byste do pracovního adresáře a ten byste pak celý ručně smazali; pak v Ovládací panely / Přidat či odebrat programy byste klepli na danou instalaci a pravděpodobně by vám řekla, že program již byl odstraněn; přinejmenším v novějších verzích Windows by se asi systém dotázal (jak to u ručně odebraných programů standardně dělá), zda má odstranit položku z Přidat či odebrat programy. Pokud by vám dané CD nepatřilo, tak by taková instalace byla nelegální. Je velmi nemilé, že Microsoft nedává na instalační CD kontrolu většího počtu jazyků (například nemyslí na ty, kdo píší ve francouzštině, španělštině, ruštině atd.: člověk by to ocenil mnohem víc než kupy přebytečných klipartů). Upozornění: postup by možná poškodil stávající, českou instalaci Office (jistě ne nevratně, ale provést automatickou opravu instalace či doinstalovat nějakou součást by možná bylo nutné). Celý postup provádíte na vlastní nebezpečí i vlastní právní zodpovědnost.
- Možná to přece jen jde bez instalačního CD. Mohlo by to jít, pokud by člověk měl příslušný klíč, který by nechal zapsat do systémového registru. Kontrola gramatiky je v klíči HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\Shared Tools\Proofing Tools\Grammar, dělení slov v HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\Shared Tools\Proofing Tools\Hyphenation, pravopis v HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\Shared Tools\Proofing Tools\Spelling, synonymické slovníky v HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\Shared Tools\Proofing Tools\Thesaurus. To by pak bylo asi legální a stačilo by mít k dispozici příslušný registrový klíč. Je možné, že na stránkách http://www.microsoft.com/ jsou dané knihovny na stažení, ač osobně jsem tam našel r. 2003 jen kontrolu pravopisu pro irštinu. Další jazyky byly jen v komerčním, dost drahém produktu, který obsahuje všechny nástroje, jež jsou dostupné.
- Speciální znaky: pokud nechcete používat cizojazyčné klávesnice na to, co můžete napsat na české, tak to leckdy jde. Vložit / Symbol je nešikovné, ale je i jiné řešení. 1.) předefinovat si klávesnici (nedoporučeno) – ve Vložit / Symbol si definovat svou klávesovou zkratku pro jednotlivé znaky; spíše nedoporučuji. 2.) Naučit se stávající zkratky (doporučeno). Např. accent grave se napíše pomocí kombinace Shift+Alt+ý a příslušného písmena, třeba a, takže vznikne à [snad se vám to zobrazuje na internetu dobře]. Accent circonflexe je Shift+Alt+š a příslušné písmeno. Oblouček nad a: ă: to je pomocí Shift+Alt+č a písmene a. Atd. Příslušné zkratky si najdete v dialogu Vložit / Symbol (postup pro Word). Pokud není pro potřebný znak žádná zkratka definována, definujte si ji sami podle svého.
- Konverze francouzských znaků z Wordu do 602Textu: původní experiment dopadl tak, že probíhá bez problémů, pokud je dané místo ve Wordu označené jako napsané česky, ale s problémy, pokud je označené jako napsané francouzsky. Ale posléze už to chodilo bez problémů. Takže kdyby je to konvertovalo špatně, zkuste změnit jazyk příslušného textového segmentu ve zdrojovém souboru .DOC a pokuste se o konverzi znovu.
- Běžná řecká klávesnice Windows: nezvládá mnoho potřebných akcentů, není určena např. pro vydávání antických textů.
- Znaky UNICODE a wordovské znakové konstanty ChrW: nefigurují tu všechny potřebné znaky s přízvuky a přídechy. Je potřeba užívat speciální font.
- Font Symbol: není celkem k ničemu, neobsahuje přízvuky a snad ani všechny znaky. Zcela nepoužitelný.
- Rozcestník s odkazy na fonty: http://www.ntgateway.com/greek/fonts.htm, další fonty na http://www.jeff.cs.mcgill.ca/~lue/greek.html. Placené fonty na www.adobe.com. Další odkazy najdete v rozcestníku pod kapitolou Fonty.
- Jak nainstalovat font: uložit si jej na disk, pak jít do Ovládací panely / Písma a tam zvolit Soubor / Nainstalovat nové písmo.
- Problémy s tiskem: lze očekávat, že se na některých tiskárnách vyskytnou.
- Font SPIonic: dost používaný font.
- Nedostatky: není dobře vyvážena tloušťka čar v písmenech; některé působí příliš silně vzhledem k ostatním. Viz níže Grenet – je úhlednější a má stejné rozložení všech potřebných znaků.
- Samozřejmě že každý, komu se má text správně zobrazit, musí mít tento font na svém počítači nainstalován (ledaže je dokument ve formátu PDF, kde to potřeba není).
- Následuje několik vybraných znaků s údajem, pod kterou klávesou české klávesnice je hledat.
- Iota subscriptum: svislá čárka | (AltGr+W).
- Přízvuk ostrý: / (lomítko).
- Přízvuk ostrý jinak postavený na vodorovné ose: AltGr+C. Pozor, doporučuji ve všech databázích, v nichž by mohl někdo hledat, užívat jen jeden znak, a to lomítko (byť graficky to vypadá hůř), jinak se zamezí nalezení. Viz zásady vyložené v kapitole o zásadách přepisu; jsou ve shodě s elektronickou edicí slovníku Liddell – Scott – Jones na serveru Perseus.
- Přízvuk těžký: zpětné lomítko (pokud je nemáte přímo na klávesnici, napíšete je pomocí AltGr + Q). Jinak umístěný: podtržítko. Doporučuji užívat jen zpětné lomítko.
- Přízvuk průtažný: pod klávesou =.
- Přídech jemný: závorka „)“ (jiný pod 0 nula – tj. za použití Shift, ale ten doporučuji nepoužívat).
- Přídech ostrý: závorka „(„ (jiný pod 9, ale doporučuji nepoužívat).
- Přídech jemný a přízvuk ostrý: 1. Doporučuji nepoužívat a dát přednost kombinaci „)/“.
- Přídech jemný a přízvuk těžký: 2. Doporučuji nepoužívat a dát přednost kombinaci „)\“.
- Přídech ostrý a přízvuk ostrý: 3. Doporučuji nepoužívat a dát přednost kombinaci „(/“.
- Přídech ostrý a přízvuk těžký: 4. Doporučuji nepoužívat a dát přednost kombinaci „(\“.
- Přídech ostrý a přízvuk průtažný:: AltGr+B. Doporučuji nepoužívat a dát přednost kombinaci „(=“.
- Přídech jemný a přízvuk průtažný: AltGr+N. Doporučuji nepoužívat a dát přednost kombinaci „)=“.
- Délka písmene (vodorovná čárka): obvykle se v textech neznačí, ale v učebnicích ano. AltGr+. , AltGr+, (čárka), 8. Jsou různě postavené – aby to sedlo přesně nad různá písmena. Ve slovníkových databázích ani v textech potenciálně určených pro strojové prohledávání (což jsou všechny elektronické texty) doporučuji tento znak vůbec nepoužívat.
- Rozlučník (tréma, dvě tečky nad písmenem): + (plus, tj. klávesa, na které je i číslice 1). Pokud na danou samohlásku připadá přízvuk, píše se nejdřív přízvuk, pak rozlučník (tak GEL s.v. politei/a).
- Tréma a přízvuk ostrý: 5.
- Tréma a přízvuk těžký: 6.
- Kráze: klávesa přehlásky spolu s Shift. Upozornění: Word může být nastaven tak, že tento znak automaticky zaměňuje za jiný; ve fontu SPIonic je to nežádoucí.
- Font Grenet: http://my.tele2.ee/docs/grenet/ Má stejné rozložení znaků jako SPIonic (kromě těch běžně používaných, jako vodorovné čárky nad slovy apod.; ověřeno u všech znaků, které jsou používány v mých databázích: i tréma a znak elize), ale je o dost úhlednější. Freeware pro nekomerční použití. Vřele doporučuji. Nedostatkem je, že s ním nepočítá Greek English Lexicon na serveru Perseus, takže pokud chcete Greek English Lexicon používat, musíte si nainstalovat i SPIonic. Ale je to otázka chvíle. Takže doporučuji Grenet.
- Font Theophilos Greek: rozložením i vzezřením docela podobný SPIonic, rozložením takřka totožný, včetně postavení přízvuků (i v kombinacích AltGr; rozdíl je např. AltGr+-). Lze stáhnout na http://www.theophilos.sk/sk/download.htm (nevím, zda je tu ke stažení i samostatně, nebo zda se pouze nainstaluje automaticky s instalací programu Theophilos), případně dohledat přes vyhledavač, kdyby se přesunul. Dokonalý není, ale obsahuje všemožné druhy přízvuků a přídechů (na Shift+číslo a další klávesy); disponuje též znakem pro koppa.
- Délka písmene (vodorovná čárka): obvykle se v textech neznačí, ale v učebnicích ano. AltGr+M, AltGr+, (čárka), AltGr+tečka.
- Greek: další font, vzhled má velmi klasický, podobný písmenům, které se píší při zvolení fontu Times New Roman a řecké klávesnice. Akcenty nejsou samostatné klávesy, nýbrž každé písmeno v příslušných kombinacích má zvláštní klávesu; snad obsahuje všechny potřebné znaky, nevím. Dělá trochu neplechu (enter například zobrazuje jako speciální znak, ač v náhledu nikoliv) atd. Nedoporučuji.
- Obouretné W: AltGr + X.
- Zvláštní „G“: AltGr + C.
Viz zvláštní stránku zpracovávající témata fonetické abecedy, International Phonetic Alphabet a HTML aj.
Dosavadní počet návštěv dává tušit, že tato práce nebyla zbytečná. Vypisování do PC práci v konečném důsledku spíš šetří a umožňuje to práci zúročit importem do elektronického slovníku a rozšířením jeho databáze, a stačí trochu úsilí věnovat do kvality vypisování, ovládnutí jistých formálních zásad uvedených na této stránce a do následného zaslání.
Rozšiřování a zkvalitňování databází počítačových slovníků je naléhavě třeba. Máme tyto základní úkoly:
- U jazyků, kde víceméně slušné databáze existují a jsou zdarma (AJ, NJ, FJ), tyto databáze vlastními silami doplňovat, opravovat a zavádět do nich lexikografické zásady osvědčené v knižních slovnících (v té míře, v jaké je to účelné) a tím je zkvalitňovat.[40]
- U jazyků, jejichž databáze dostupné nejsou, popř. nejsou zdarma či jsou naprosto nedostačující, tyto databáze postupně vytvářet a ty zlomkovité, které již existují, zbavovat formálních i věcných chyb a nedostatků.
- Seznamovat s těmito stránkami co nejvíce lidí, které by mohly zajímat.
- Shánět kvalifikované přispěvatele, kteří mají o počítačovou lexikografii zájem, a to zejména u „nekomerčních“ jazyků, jejichž slovníkům se žádná firma nevěnuje. Jedněmi z možných ideálních přispěvatelů jsou studenti filologických oborů, kteří si lexikografické zpracování určitého pramene či určité oblasti jazyka vyberou jako téma diplomové či jiné závěrečné práce.
Publikování této verze: 18. 11. 2006 23:43
Počet normostran (v přepočtu): 154
Počet slov: 38532
Umístění: http://www.david-zbiral.cz/El-slovniky-plnaverze.htm
[1] Pokud máte plnou verzi LL a chcete používat jen balíček AJ NJ FJ, tak nemusíte stahovat demoverzi; prostě rozbalte balíček lingea.exe do podadresáře data plné verze. Pokud máte plnou verzi LL, ale chcete používat i jiné balíčky než jen AJ NJ FJ, stáhněte si demoverzi, balíček lingea.exe si nainstalujte do podadresáře data plné verze a ostatní balíčky každý do podadresáře data jedné instalace demoverze. Pokud plnou verzi nevlastníte, stáhněte si demoverzi v každém případě a nainstalujte si ji do několika různých adresářů podle toho, kolik balíčků (těchto nebo svých vlastních) chcete používat. Pozn.: pro ty, kteří jsou jen trochu pokročilejší, je tato poznámka spíš zamlžující než vysvětlující.
[2] Uživatelský slovník typu 1 je běžný uživatelský slovník s názvem např. encz-usr.udr (který je umístěn ve složce uživatelských souborů, běžně Dokumenty/Lexicon, a který je pro jeden směr jednoho slovníku vždy jen jediný). Uživatelské slovníky typu 2 jsou uloženy v podadresáři data a mají daleko větší možnosti.
[3] Popřípadě klikněte na titulek pravým tlačítkem myši, zvolte Uložit cíl jako a během stahování můžete pracovat v jiném okně či pokračovat v četbě této stránky.
[4] Není třeba se bát, že nějaké jednotky zmizely, a to ani když výsledný počet jednotek v uživatelském slovníku je nižší: znamená to maximálně, že byly odstraněny ty chybné a sloučeny ty, které se duplikují.
[5] V absolutních číslech jen asi 420, ale celkový počet klesl asi o 300 odstraněním těch duplicit, které byly zhodnoceny jako naprosté či ve všech druzích slovníkového softwaru zbytečné. Takže přibylo asi 720 jednotek, nikoli jen 420.
[6] Např. příklad „su\ me\n komi/zoij a)\n seauto\n h(=| qe/leij“ s. v. „a)/n“.
[7] Zdá se mi, že vše, co vezme Poznámkový blok ve formátu ANSI, vezme i Millennium a Lingea Lexicon: ověřeno zatím na tomto ę, na o s týmž obloučkem a na jerech (kde je výsledek negativní, stejně jako je nelze uložit v ANSI).
[8] Následuje text, který věc zbytečně komplikuje; je určen pro pokročilejší a těm, kdo mají rádi přesnost: teoreticky je možné jich provozovat v jedné instalaci i více než šest a dát např. rumunsko-českému i bulharsko-českému shodně předponu encz. Ale je tu tato zásadní nevýhody: v (domněle) anglicko-českém směru hledání by se hledalo jak v rumunsko-českém, tak v bulharsko-českém slovníku, takže by se nám tam zbytečně pletla slovíčka, která nehledáme. To je řešitelné vytvořením nové sady, viz níže.
[9] Za návod vděčím technické podpoře Lingey.
[10] Ono to totiž nejde, tak alespoň dopadl můj pokus. Ani když zadáte masku usr, tak to nepřetrumfne výchozí nastavení pro zobrazení běžného uživatelského slovníku.
[11] Příklad: Když zadám dotaz "jáchym + fiore", tak LL nezobrazí toliko mé uživatelské heslo "Jáchym z Fiore", nýbrž ukáže více výsledků (a také nezdůrazní v uživatelské jednotce "Jáchym z Fiore" ty nalezené součásti vyhledávacího dotazu oranžově, lze ovšem zvažovat, zda je zrovna absence zvýraznění opravdu na škodu). Užívání operátorů tu jednoznačně není plnohodnotné: Jáchym + Fiore by mělo najít jen hesla, která obsahují obě tato slova (což splňuje jen má uživatelská jednotka). Že se v uživatelském slovníku nehledá stejně sofistikovaně jako v hlavním, mi Lingea potvrdila s odůvodněním, že uživatelské slovníky jsou v textovém formátu, kdežto základní v binárním. Každopádně i prostý textový formát sofistikovaně zpracovat lze, ale načítání by trvalo déle. Nejlepším řešením by asi bylo zpřístupnit uživatelům program, který by převedl soubory z textového formátu do binárního. Převedení do binárního formátu, pokud to správně chápu, slovník zároveň zašifruje. V binárním formátu tedy určitě nebude možné jej editovat. Takže by bylo třeba postupovat tak, že budete mít vždy vedle slovníku v binárním formátu i soubor textový, na jehož základě byl binární slovník vytvořen, a právě do textového budete opravovat chyby a doplňovat nové jednotky; po určitém čase byste si zase z tohoto zdrojového textového slovníku vytvořili kopii v binárním formátu. V další verzi LL by takový nástroj měl být, jen mám ze své komunikace s Lingeou obavy, aby se daly zpracovat hromadně celé tituly, a nikoli jen vkládat přes formulář v uživatelském rozhraní programu jednotlivá hesla; to by byla pro uživatelskou lexikografii katastrofa. Možnost editace celého slovníku bohužel bude, jak se zdá, opravdu vyřazena a možnost načítání textových slovníků také, což lexikografy přinutí zůstat u demoverze LL 2002. Tyto informace o další verzi jsou však nepotvrzené. Apeloval jsem na Lingeu, aby uvedené rysy, velmi přínosné pro uživatelskou i profesionální lexikografii, ponechala; uvidíme, k jaké koncepci se nakonec rozhodne.
[12] Poznámka pro ty, které zajímají podrobnosti: Samotné běžné značkování by ani tak nevadilo, problém je v takovém případě se zalamováním řádků. Kdyby se dalo v uživatelském slovníku aplikovat členění head, tak prostě stačí do head dát, že se za ní mají řádky zalomit (a nedávat to do značky entr). Pokud to nejde (a mně se to nepodařilo), tak nelze zalomení řádků ovlivnit jednotně a vidím v zásadě 3 možnosti: 1.) vložit zalomení v definičním souboru do entr a tvary <g.> pak psát na samostatný řádek (to se pak řádek zalomí před tvary a vzdálí je tak od heslového slova, což je pochopitelně nevhodné); 2.) vložit zalomení v definičním souboru do entr, ale psát tvary, uzavřené do speciální značky, na stejný řádek jako heslové slovo (to ale bude mít dva negativní důsledky: nalezení hesla pouze v „okolí“, ne jeho okamžité zobrazení, a vypsání tvarů včetně formátovacích značek do levého podokna s výsledky hledání, místo aby v tomto podokně byla jen nalezená heslová slova), 3.) vložit zalomení v definičním souboru nikoli za entr, nýbrž za samotné tvary (takže značka pro tvary bude vypadat třeba takto: g = "|s2|cB|b+%s|b.|c.|s.|h1|n2") a tvary v uživatelském slovníku psát na samostatný řádek, což je patrně nejlepší z těchto možností, ale má to přece jen negativní důsledek: nejednotu zalomení. U slov, kde jiné tvary, přesněji řečeno značku g, neuvedeme (např. proto, že jiné tvary nemají), nedojde vůbec k zalomení a první význam bude hned za heslovým slovem, bez zalomení řádku. Lze to zčásti řešit tak, že se ještě vloží zalomení před číslování významů: numb = "|n1|d1|cR|b+%s.|c.|b.". Tím dospějeme k tomuto stavu: kde jsou gramatické tvary, tam budou za nimi dvě zalomení řádku (n2 za g); kde nejsou gramatické tvary, ale je číslování významů, dojde k jednomu zalomení (kvůli n1 před numb; je to nekonzistentní, ale přehlednější než nemít tam zalomení vůbec); kde nejsou tvary ani číslování, tam k zalomení nedojde. Řešením může být místní formátování: simulovat tvary i tam, kde nejsou: vložit tam <g. > a nic do nitra této značky nepsat. Možná je pro snadnější pozdější zpracování a automatizované změny neužívat v takovém případě simulaci <g.>, nýbrž si nadefinovat speciální značku, která bude obsahovat jen zalomení 2 řádků: např. r = "|n2" a pak ji aplikovat na novém řádku za heslovým slovem prostě takto: <r.>. Řešením 3, byť takto graficky vylepšeným, samozřejmě vzniká jistá vnitřní nekonzistentnost slovníku. Nicméně je to asi řešení nejlepší (pakliže se sekcí head – která všechny tyto problémy velmi šikovně řeší – opravdu v uživatelských slovnících nelze zacházet). Jakmile by v budoucnu šlo pracovat s head v uživatelských slovnících, tak se všechna <r. > prostě vymažou, definice se předefinují a je hotovo.
[13] Pro přesnost: pokud existuje v tom či onom směru (a právě jen v jednom ze dvou směrů) lemma přesně toho znění, tak se najde i bez nastavení jazyka, protože se prohledávají, pokud uživatel neurčil jinak, automaticky oba směry na přesné výskyty. Ale pokud se kryje jen částečně nebo pokud jej obsahují oba směry (např. „a“ jako latinská předložka a „a“ jako česká spojka), tak pokud nenastavíme pro některé značky, že jejich jazyk je jazyk výchozí (tj. pokud do definice příslušné značky nedáme |l1), tak místo aby LL našel „okolí“ v požadovaném směru, najde „okolí“ ve směru nežádoucím. Závěr: rozhodně jazykový atribut |l používat, zvlášť u značky odkazu, sublemmatu a fráze. Nezapomeňte na konci definice atribut vypnout pomocí „l.“. U příkladu (samp2), kde se to v jednom odstavci láme, se dá např.: "|d3|l1|i+%s|i.|l.|h1|l2%t|l.|n1".
[14] Někdy ale snese o něco víc: např. u hesla obsahujícího následující příklad o 212 znacích se nekouše: ?Intellexit [verbum illud] de divitibus qui malo modo et iniusto suas divicias ... acquirunt. = Spojoval to (rozuměj: ten výrok) s bohatými, kteří nabývají svého bohatství zle a nespravedlivě. <f.Fournier I, 208>.
[15] Technická podpora potvrdila, že o tom ví. Úprava se ale patrně v nejbližší době nechystá.
[16] Můj pokus dopadl tak, že se u 3997 znaků podle wordovského počítání se ještě nekouše, výše ano (pro představu: jde o .
[17] Samozřejmě že je třeba posuzovat jinak dva výskyty v díle téhož autora a dva výskyty v dílech různých autorů atd.
[18] Pro pokročilejší: definice vypadá třeba takto: h = "|cR|fI|b-|i-[%s]|b.|i.|f.|c."
. Fonetickou abecedu zapíná značka |fI. Segment „[%s]“ už sám o sobě říká, že má být výraz uzavřen do hranatých závorek (takže je nepište do textu slovníku). Pozn.: pokud se nastaví do hlavičky note2= "|cR|fI[%s]|f.|c.|n1"
, tak bude fonetickou abecedu zapínat také znak % na začátku řádku (který aplikuje to, co je definováno pod note2). Ale lepší je používat značku <h.>.
[19] Tato vlnovka se v LL u některých velikostí písma jeví jako rovná čárka.
[20] Za poskytnutí většiny těchto kódů vděčím technické podpoře LL.
[21] Příklad:
#paenito
<g.ere, ui, -> <a.penito>
<c.impers. <e.paenitet me>>
=lituji, je mi líto, želím, mrzí mě, nelíbí se mi, nejsem spokojen
=stydím se
<c.pers.>
=kát se
[22] Např. Václav Vlasák – Stanislav Lyer, Česko-francouzský slovník / Dictionnaire tchèque-français, I-II, Státní pedagogické nakladatelství, Praha 1993.
[23] Příklad nepříliš dobře zpracované jednotky: pro wise woman nalézá „kouzelnice, porodní babička [sic!], věštkyně“, zatímco zásadní významy „vědma, porodní bába“ nikoli.
[24] Alternativní postup, pokud např. chcete importovat jen část nebo je soubor příliš rozsáhlý a je tedy třeba postupovat po etapách: označte (např. myší) tabulku se slovíčky od prvního slova až po poslední, a to včetně formátovacích znaků napravo od tabulky. Vložte označený segment do schránky (Ctrl+C nebo příkaz Kopírovat). Otevřete si velmi jednoduchý textový editor, nejlépe Poznámkový blok (obvyklá cesta k Poznámkovému bloku: Start / Programy / Příslušenství) a obsah schránky do něj vložte (Ctrl+V nebo příkaz „Vložit“). Pak soubor uložte pod vámi zvoleným názvem a pokračujte následujícím bodem běžného postupu.
[25] Postup, jak zjistit klávesovou zkratku znaku, který často používáme: Vložit / Symbol, najít příslušný symbol, myší na něj klepnout; zobrazí se nám zkratka, kterou symbol má, vyzkoušíme si její funkčnost a naučíme se ji nazpaměť. Pokud daný znak klávesovou zkratku nemá, lze ji nadefinovat v téže nabídce pod tlačítkem Klávesová zkratka). Tímto způsobem zanedlouho budete psát složité znaky stejně snadno jako ď nebo ó. Někomu tento způsob vyhovuje mnohem lépe než užívání cizí klávesnice (např. francouzské), která dané znaky obsahuje. V případě užívání těchto symbolů ovšem dejte pozor, zda je váš textový editor při dalším otevření souboru nezmění, např. è na č.
[26] Wordovská makra, která by rozhodně mohla zajímat ty, kdo importují do slovníku Millennium nebo ukládají z Millennia slovíčka do souboru a pak je upravují do přehlednější formy: viz http://mujweb.cz/www/david.zbiral/NewMacros.bas (ImportFrSlovnik pro nahrazení speciálních znaků tak, aby to grafickou podobu pokazilo, ale naopak aby to Millennium interpretovalo správně, např. ê nahradí za ę, a též makro FrSlovnikTerms pro převod souboru, jejž využíváte pro funkci „ukládání do souboru“, které provede opačný postup, znaky tak napraví do fr. podoby, např. ę nahradí za ê, převede text do přehledné tabulky atd.). Makra nesmírně šetří čas a námahu, vyplatí se s nimi naučit pracovat a upravovat je přímo v MS Visual Basicu. Dodržujte při použití jistou opatrnost, užívejte jen v kopiích svých dokumentů, viz též varování v http://mujweb.cz/www/david.zbiral/PC-tipy.htm. Je nutno tato makra v MS Visual Basicu jemně přizpůsobit vašim potřebám, např. co se týče cest, kam se soubory ukládají, atd.
[27] Raději si však import vyzkoušejte hned po vypsání např. 3 prvních slovíček, jednak abyste si postup zažili, jednak (a především) abyste zjistili, jestli bez problémů funguje. Pokud nefunguje, pročtěte si ještě jednou výše uvedený návod. I pokud jste dodrželi pracovní postup ve všech bodech, pokuste se raději o import ještě jednou. Jestliže nepomůže ani to, obraťte se s dotazem na někoho ve svém okolí, kdo dobře rozumí počítačům.
[28] U slovníků je původnost kamenem úrazu, a to samozřejmě nejen u elektronických. Bylo by iluzí se domnívat, že tvůrci slovníků vše berou z vlastních excerpt; ve skutečnosti v naprosté většině případů bohatě využívají – a je to dobře – práce předchozích lexikografů. To stejné pochopitelně děláme my. Původnost není problémem ani tak u jednoduchých hesel zaznamenávající pouze základní významy (tam je obvykle vše celkem jasné a moc vlastního leckdy ani přidat nelze), jako spíš u komplexně zpracovaných hesel, které jen opisují významy z některého slovníku. Tak by bylo lepší nepostupovat. Důležité je, aby byl původní slovník ve svém celku, ne nutně v každém jednotlivém hesle: aby dodával jednotky a významy v jiných slovnících neobsažené, aby přeskupil ekvivalenty a významy v rámci hesla (pokud autor považuje jiné uspořádání příslušného hesla za účelnější), atd.
[29] Pokud jde o využití maker a skriptů, je možné: pokud je umíte trochu programovat a online slovník má transparentní zadání vyhledávacího řetězce, takže adresa s výsledky vypadá třeba takto: http://www.dictionary.com/engver/index.php?ring+of+power a vy jste hledali sousloví „ring of power“, tak už jste pochopili vyhledávací mechanismus a můžete s ním v makru či skriptu pracovat a práci si tak ulehčit: např. by si makro nechalo něco napsat do okénka, automaticky by to začalo vyhledávat, pak by to vložilo do wordovského souboru výsledek hledání (to už je těžší a ne vždy možné) a vepsalo to i váš dotaz, takže byste měli hotové heslo bez kopírování přes schránku či vpisování jak ve Wordu, tak do kolonky na stránkách atd. Ale to je jen pro poučenější uživatele, kteří zvládli základy skriptování. A ne vždy je jisté, že to za úsilí věnované programování bude stát.
[30] V nahrazování včetně takových věcí jako hledání tabulátoru či určitým stylem, barvou, tučností apod. formátovaného písma je Word naprosto nepřekonatelný. Neznám textový editor, který by měl složité hledání a nahrazování lépe zvládnuto než Word, ani jsem o žádném neslyšel.
[31] Ne všechny byly dodrženy ve zde publikovaných databázích. Důvod je jednoduchý: 1.) ne vše, co se mi dostalo do rukou, se mi podařilo žádoucím způsobem upravit, 2.) většina těchto zásad se formulovala postupně, během práce s elektronickými slovníky, tzn. že ty položky databáze, které byly vytvořeny před jejich formulováním, s nimi nejsou v souladu. Někdy lze chyby opravit jen s vynaložením velkého úsilí (a někdy vůbec). Proto je lépe se snažit těmito zásadami od počátku řídit.
[32] Šipky lze kombinovat pro delší skoky s klávesou Ctrl.
[33] Některé tipy pro práci s PC lze nalézt na adrese http://mujweb.cz/www/david.zbiral/PC-tipy.htm.
[34] Poznámka o oboustrannosti slovníků: samozřejmě že by bylo lepší tvořit databázi z každé strany zvlášť. Ale na druhou stranu jednotka zpracovaná jako francouzsko-česká má jistou cenu i pro překlad z češtiny do francouzštiny. Proto je dobré obě dávat do stejného slovníku (Millennium na tomto základu pracuje). Jednotky se tak mohou „duplikovat“, tj. nám slovník může najít jednak naši jednotku, kterou jsme zpracovali jako francouzsko-českou, tak naši jednotku, kterou jsme zpracovali jako česko-francouzskou. Tato duplicita je ale mnohem lepší než nenajít nic. Např. consterné, -e ohromený, vyděšený, zděšený, konsternovaný, překvapený (nepříjemně), zmatený je očividně jednotka patřící do slovníku francouzsko-českého. Ale náš čas je omezený: zpracovat kvůli hledání jednotky consterné také česko-francouzsky hesla „ohromený“, „zmatený“ atd. by nám dalo moc práce. Proto to nyní neuděláme, počkáme na jindy, až budeme hledat naopak slovo „ohromený“; teprve tehdy zpracujeme heslo „ohromený“ česko-francouzsky. Do té doby prostě když budeme hledat „ohromený“, tak v oboustranně řešeném slovníku najdeme heslo „consterné, -e ohromený, vyděšený, zděšený, konsternovaný, překvapený (nepříjemně), zmatený“, což očividně není ideální, protože by bylo vhodnější najít „ohromený stupéfait, éberlué; consterné“, ale je to lepší, než když jsou striktně oddělené slovníky česko-francouzský a francouzsko-český, kde bychom vůbec neměli možnost využít své francouzsko-české jednotky alespoň zčásti i pro hledání česko-francouzské. Závěr: oboustranné slovníky jsou striktně lexikograficky vzato méně šikovné než jednostranné (a vlastně „chybné“), ale pokud si doplňujeme uživatelský slovník, je škoda jednotek nevyužít v obou směrech, byť nikdy nejsou v obou směrech stejně plnohodnotné. Zoufat si nad tím, že „se to tak dělat nemá“, je plané. Jedna věc je ideál, druhá věc jsou reálné časové možnosti.
[35] Příklad: pokud napíšete do levého sloupce „snow“ a do pravého „sníh, sněžit, zbělet, balamutit“ a někdy později (po importu databáze, jejíž je tato položka součástí, do uživatelského slovníku) budete hledat slovo „balamutit“, tak lepší elektronický slovník najde i balamutit, třebaže je na samotném konci hesla, ale nemusí to být případ všech elektronických slovníků. (Slovník Millennium toto hledání podporují, tj. najdou slovo „balamutit“ i tehdy, když je uprostřed nebo na konci hesla.)
[36] To v případě nastavení „vždy nahoře“, které je pro někoho výhodnější než „při opuštění minimalizovat“, to záleží na tom, čemu každý uživatel uvykne.
[37] Viz např. Ella Sekaninová, Dvojjazyčná lexikografia v teórii a praxi, Veda (Vydavateľstvo Slovenskej akadémie vied), Bratislava 1993, s. 134.
[38] Pozn.: u speciálních znaků není důležité, zda vypadají správně v daném souboru, nýbrž zda je program, do jehož databáze je importujete, správně interpretuje; proto také najdete mnohé podivné znaky v některých zde publikovaných souborech. Proto také zvlášť v případě francouzštiny doporučuji zasílání přímo souborů ve formátu Word nebo HTML, neboť mám sestavená makra, která mi velmi rychle převedou speciální znaky do podoby, která je vizuálně špatná, ale po převodu do slovníku je naopak interpretována správně (kdežto vizuálně správná je interpretována špatně).
[39] Tento způsob práce není pouhou teorií: já takto skutečně pracuji s latinou, srbštinou, bulharštinou, staroslověnštinou, španělštinou a dalšími jazyky a díky rychlosti hledání v elektronických slovnících se mi to časově vyplácí. Kromě toho je z této činnosti i nějaký zveřejnitelný výstup pro rozvoj a zkvalitnění elektronických slovníků.
[40] Např. model „zadej výraz, vyplivnu ti patnáct slovíček bez jakéhokoli komentáře a ty si vyber“, je neúčinný, zvlášť při překladu z mateřského jazyka do cizího, kde se nemůžeme dost dobře spolehnout na jazykový cit. To neznamená, že hesla konstruovaná jako česko-cizojazyčná a hesla konstruovaná jako cizojazyčno-česká nemohou být součástí téže databáze, ale není možné jen vrstvit kolem výrazu jazyka A věnec výrazů jazyka B bez minimálního kontextu a omezení významu; tak bohužel pracuje slovník Millennium – ale od toho jsou tu mj. zde publikované databáze, zatím zejm. ta francouzská, které se snaží zavést část osvědčených lexikografických zásad i do elektronických slovníků).