Logo archivu

Softwarové noviny
č. 10/97

zpet na domovskou stranku
titulni strana
obsah
predchozi cast
nasledujici cast
Co muze Internet nabidnout?
Vyhledávací služby databázového typu
titulni strana obsah
predchozi dil nasledujici dil

Hlavní překážkou, která katalogům brání v obsáhnutí výrazně většího počtu dostupných zdrojů, je nutné zapojení člověka při zatřiďování jednotlivých odkazů. Pro objevování nových zdrojů je sice možné použít automaticky fungující programy, ale zatřiďování nalezených zdrojů do předmětové hierarchie vždy vyžaduje lidskou práci. Jedinou alternativou je nesnažit se o zatřiďování nových odkazů, ale ponechávat je všechny "na jedné hromadě", přesněji v jedné velké databázi. A právě na tomto principu pracují největší vyhledávací služby, které dokáží zmapovat až desítky milionů WWW stránek.

Důležitým a podstatným důsledkem tohoto přístupu je skutečnost, že u vyhledávacích služeb databázového typu neexistují žádné předmětové kategorie a soustava nabídkových stránek, kterou by se uživatel mohl brouzdat. Jediným způsobem, jak se čehokoli dobrat, je položit databázi vyhledávací dotaz, na jehož základě pak ona odpoví seznamem vyhovujících odkazů. To je samozřejmě možné a výhodné v situaci, kdy uživatel dosti přesně ví co hledá, a dokáže to popsat pomocí vhodných klíčových slov. Obecně ale platí, že čím větší je vyhledávací služba (čím více dostupných zdrojů eviduje), tím těžší je správně se jí zeptat - co je uživateli platné, když se najdou desítky tisíc stránek vyhovujících jeho dotazu. Stejně nemá šanci je všechny postupně projít, a tak musí svůj dotaz postupně upřesňovat. A takovéto upřesňování je v praxi na celém hledání nejobtížnější.

Vyhledávací služby databázového typu se za dobu své existence zajímavým způsobem vyvíjely. Zpočátku , kdy kapacita jejich databází ještě nebyla taková jako dnes, si tyto služby nemohly dovolit pamatovat si doslova "všechno, co kde našly", neboli plné znění všech WWW stránek, na které v Internetu narazily. Místo toho si všímaly pouze jejich částí, například tzv. titulků (jednořádkových názvů stránky, které jednotlivé browsery vypisují ve svém rámečku úplně nahoře), nebo prvních deseti řádků textu stránky, prvních 20 slov apod. S postupem času ale docházelo ke zvětšování objemu databází, které tyto vyhledávací služby používají, a v určitém okamžiku se již stalo únosné, aby si tyto služby pamatovaly celý obsah jednotlivých WWW stránek - přesněji aby si mohly vytvořit indexy z celého a plného znění WWW stránky, pamatovat si je, a pak nabízet možnost plnotextového vyhledávání v rámci celých WWW stránek, v rozsahu prakticky celého Internetu. První službou, která takovouto možnost nabídla, byla služba Alta Vista (uvedená do provozu v prosinci 1995 firmou Digital, na adrese http://altavista.digital.com).

V ČR jsou k dispozici mj. tyto služby pro plnotextové vyhledávání v rámci českého Internetu:


Tento článek může být volně šířen, pokud se tak děje pro studijní účely, na nevýdělečném základě a se zachováním tohoto dovětku. Podrobnosti hledejte zde, resp. na adrese http://archiv.czech.net/copyleft.htm