Přeskoč navigaci

Zde hledá Jyxo.

Jyxo

Kontrolované slovníky při stavbě a správě webu (část první)

Martin Kopta, vydáno/aktualizováno: 9.9.2003/09.09.2003

Když přede mnou někdo ještě před pár měsíci prohodil tajemná slova kontrolovaný slovník (controlled vocabulary), koukal jsem na něj jako sůva z nudlí. Záhy jsem ale pochopil, že kontrolované slovníky při stavbě, a především při správě webu, běžně používám.

Proč ne slovník, ale rovnou slovníky? Je jich více druhů a na webu jich ke slovu přijde hned několik:

  • autoritativní seznam (authority file)
  • synonymická řada (synonym ring)
  • třídicí schéma (classification scheme)
  • tezaurus (thesauri)

Rozdělení jsem převzal z knihy Information Architecture for the World Wide Web [1], kde o kontrolovaných slovnících najdete kapitolu. Nyní si probereme autoritativní seznamy a synonymické řady a příště se podíváme na třídicí schémata a tezaury.

Autoritativní seznam

(Jinak také: vertikální seznam)

S jedním autoritativním seznamem se setkáváte už od základní školy a měli byste se ho držet i na webu— znáte ho pod názvem Pravidla pravopisu. Autoritativní seznam není nic jiného než seznam slov, která je záhodno na webu používat. Takový seznam se hodí v případě, že existuje více variant psaní téhož výrazu.

Budete psát název své firmy s iniciálami Český Telecom, nebo VERZÁLKAMI? Budete psát on-line se spojovníkem, nebo bez? Rozhodněte se mezi možnostmi a do autoritativního seznamu své rozhodnutí zvěčněte. Příště už budete mít, kam se podívat.

Autoritativní seznam ale není náhradou pravopisných pravidel— to bychom pak nepotřebovali Ústav pro jazyk český. Autoritativní seznam pakřijde vhod především v těch případech, kdy existuje několik alternativ nebo synonym pro pojmenovávanou skutečnost.

Například v obchodě s digitální technikou se budete muset rozhodnout, zda nazvete kategorii výrobků digitály, digiťáky nebo digitální fotoaparáty. Tady už přichází vedle libovůle a pravopisu ke slovu také optimalizace pro vyhledavače.

Když to shrneme, autoritativní seznam je seznam slov a tvarů, které budete závazně používat na webu. Jejich výhodou je konzistentnost stylu, a tedy zjednodušení orientace na webu pro uživatele a lepší připravenost pro vyhledavače.

Seznam pro rejstříky a křížové odkazy

Autoritativní seznam má několik ryze praktických využití. Hodí se při automatickém generování rejstříků nebo křížových odkazů— prostě stačí postupně vyhledat všechny položky seznamu a nalezené dokumenty vzájemně provázat odkazy (například: O domácích robotech také na stránkách...).

Seznam pro manuál editora, neboli styleguide

Autoritativní rejtřík je základem redakčního manuálu. Editoři budou vědět, že ČESKÉ RADIOKOMUNIKACE se píší jako České Radiokomunikace a při prvním výskytu mají do závorky za názvem firmy uvést zkratku ČRa, jež se pak bude objevovat místo něj.

Synonymická řada

(Jinak také: horizontální seznam)

Kdo četl knihy Karla Čapka, jistě si vzpomene, jak vodník kašlal, kejchal, chrchlal, sípal, chroptěl… Synonymické řady na webu ale nevyužíváme ke zvýšení literární hodnoty. Naopak dá se říci, že pokud se synonym vzdáte a budete se řídit autoritativním seznamem, zkrátí se doba, kterou uživatelé budou potřebovat k pochopení vašeho webu.

Na druhou stranu, pokud někdo bude hledá mikrovlnky a vy máte na webu jen mikrovlnné trouby, asi těžko k vám přijde nakoupit. To je také největší úskalí autoritativních seznamů.

Synonyma pro vnitřní prohledávání

Při pohledu na dotazy, které pokládají uživatelé na vašem webu zjistíte, že ať se snažíte sebelépe vystihnout nejběžnější pojmenování, vždy se najde dost lidí, kteří slovo zadají s drobnou odlišností, s překlepem, pravopisnou chybou, v jiném jazyku, synonymem nebo zkratkou. Interní vyhledavač pak nemůže dotaz obsloužit tak, aby se uživatel dostal k požadovaným informacím.

Právě překlepy, zkratky, varianty, chyby a synonyma uplatníte při řozšiřování vertikálního autoritativního seznamu o vodorovnou osu. Interní vyhledavač pak může hledaná slova ověřit proti synonymickým řadám a nahradit výrazy jejich autoritativní variantou a hledat teprve tu. Případně, pokud na webu používáte více variant hledaného slova (například zkrácený tvar), můžete o něj hledání rozšířit.

Minimálním rozšířením autoritativních seznamů v češtině je skloňování a časování— pokud ohýbat slova neumí už vyhledavač.

Nezapoměňte uživateli vždy sdělit, co jste s dotazem provedli, aby nebyl zmatený, až nalezené dokumenty jím hledané slovo nebudou obsahovat.

Synonyma pro zvýšení návštěvnosti

V případě, kdy potřebujete použít synonyma, abyste získali vyšší návštěvnost z fulltextových vyhledavačů, musíte často hledaná slova dostat do textu na svém webu— metadata vám v tomhle případě nepomohou.

Zvažte, která ze synonym použít, a která nikoli. Asi nemá smysl psát do textu záměrně překlepy, ale někdy se může vyplatit zmínit se o častých pravopisných chybách v drobné poznámce— například mikrovlné trouby. Obvykle stačí použít odborný (oficiální) a hovorový (běžný) výraz. Poraďte se o poměru způsobu použití variant s konzultantem optimalizace pro vyhledavače.

(Příště: TŘÍDICÍ SCHÉMA a TEZAURUS)

Doporučené odkazy

  1. ROSENFELD, Louis. MORVILLE, Peter. Chater 9. Thesauri, Controlled Vocabularies, and Metadata. in Information Architecture for The World Wide Web. Second Edition. Strany 176--208. O'Reilly & Associates. Sebastopol (USA, Kalifornie). Srpen 2002. ISBN 0-596-00035-9.
  2. Riecks, David. Controlled Vocabulary.com.
  3. Web Style Guide.

© 2003 Martin Kopta, martin.kopta@garcon.cz


O autorovi

Martin Kopta je wedoucím projektu DigiWeb.cz.

Tato stránka je přístupná libovolným prohlížečem, nejlépe však vypadá v prohlížeči, který podporuje HTML 4.0 a CSS 2 (Internet Explorer od verze 5, Mozilla, Opera a další). Pokud čtete tuto zprávu, váš prohlížeč zřejmě dostatečně nepodporuje CSS. Stránku sice vidíte bez pokročilejšího formátování, avšak veškerý obsah je plně přístupný i pro vás.