Prieskum archívu WWW

Do webového archívu možno pristupovať priamo z  webovej stránky webdepozit. Používateľ má na hlavnej stránke k dispozícii jediné textové pole pre zadanie vyhľadávaného výrazu. Pod poľom je umiestnený prepínač, ktorým si používateľ vyberie archív webového obsahu – www pramene.

Jednoduchý prieskum | Rozšírený prieskum | Príklady vyhľadávania

Jednoduchý prieskum

Do poľa pre hľadaný výraz môže používateľ zadať niekoľko slov (fragmentov), ktorých výskyt sa vyhľadáva v indexe, ktorý obsahuje metaúdaje a heslá z archivovaných entít. Index na vyhľadávanie v archíve WWW sídiel sa vytvára z metaúdajov aktuálneho katalógového záznamu príslušného sídla vo formáte MARC 21 (viď. Metadátový model DIP WWW). Vzťah medzi jednotlivými výrazmi je „aj“ (logický súčin: AND), pričom akceptované sú iba slová s dĺžkou 3 a viac znakov.

Jednoduchý prieskum je jednoduché vyhľadávanie, pri ktorom sa do textového poľa zadá hľadaný výraz – kľúčové slovo. Na jednoduchý prieskum možno použiť iba výrazy (slová) s dĺžkou 3 a viac znakov, pričom špeciálne znaky sa nahradzujú medzerou. Vyhľadávanie možno spresniť výberom faziet (panel „kategórie“ vľavo).

Všetky kategórieHľadaný výrazHľadajZruš filter

Výsledky vyhľadávania sú zobrazené na stránke otvorenej v novej záložke webového prehliadača v stránkovanom zozname. Výsledkom je výber všetkých WWW sídiel, ktoré obsahujú hľadaný výraz v textovej zložke vstupnej WWW stránky. Položky výsledkov obsahujú náhľad stránky v čase zberu a základné informácie (metaúdaje) o nájdenej entite. V prípade vyhľadania viacerých zberov jednej domény sa zobrazia všetky dostupné verzie s príslušným časom.  Používateľ kliknutím na položku v zozname výsledkov otvorí archivovanú verziu sídla vo webovej aplikácii OpenWayback.

Rozšírený prieskum

Systém IS DIP poskytuje viacero možností na rozšírené vyhľadávanie, ktoré sa odlišujú podľa zvolenej syntaxe: jednoduchá syntax (logický súčin výrazov) alebo SOLR syntax.

Hľadaný výraz – Podľa zvolenej syntaxe výrazu vpíšte do textového poľa kľúčové slová alebo logický výraz.

Syntax výrazu

  • jednoduchá – do textového poľa pre hľadaný výraz zadajte slová podobne ako pri vyhľadávani v Google. Zo zadaných slov sa berú do úvahy len tie, ktoré majú viac ako 3 znaky. Vyhľadávač vráti iba tie záznamy, ktoré obsahujú v indexovanom textovom obsahu všetky zadané slová.
  • SOLR – umožňuje vytvoriť komplexný výraz s použitím logických operátorov. Vyhľadávať je možné buď voči všetkému indexovanému textovému obsahu (meta_all), alebo voči konkrétnemu MARC poľu (napr. 650#4$a_meta). Logické operátory možu byť: a zároveň (AND), alebo (OR) alebo negácia (-).

Vyhľadať v MARC

Táto možnosť je prístupná iba pri nastavení jednoduchej syntaxe výrazu. V zozname MARC polí vyberte konkrétne pole voči ktorému sa budú hľadať zadané slová. Vyhľadávač vráti iba tie záznamy, ktoré vo zvolenom MARC poli obsahujú všetky zadané slová.

Dátum archivácie – Časové ohraničenie výsledkov vyhľadávania podľa dátumu archivácie.

Spresniť – Dynamický filter tvorený fazetami zvolených polí.

Príklady vyhľadávania

Jednoduché vyhľadávanie (prieskum)

Všetky kategórieSkolaHľadajZruš filter

HTML kód vstupnej stránky sídla obsahuje reťazec *skola* (škola, poškolák, … ),

Všetky kategóriekniz porHľadajZruš filter

HTML kód vstupnej stránky sídla obsahuje obidva reťazce *kniz* (knižničný) a zároveň *por* (poriadok, …). Logická väzba dotazu: „kniz“ AND „por“

HudbakoncertHľadajZruš filter

HTML kód vstupnej stránky sídla obsahuje reťazec koncert a zároveň metadátový záznam má v poli konspekt heslo „hudba“. Logická väzba dotazu: „hudba“ AND „koncert“

Rozšírené vyhľadávanie (prieskum)

meta_all:*blog* OR meta_all:*sme*

URL adresa WWW sídla obsahuje reťazec blog alebo sme

650#4$a_meta:*politik* AND (970##$a_meta:*ludia* OR 970##$a_meta:*spravy*) AND -970##$a_meta:*hlavne*

metadátový (katalógový) záznam WWW sídla v poli 650#4$a obsahuje reťazec politik a pole 970##$a obsahuje buď ludia alebo spravy, a neobsahuje hlavne.

720##$a_meta:“Petit Press a.s.“

metadátový (katalógový) záznam WWW sídla v poli 720##$ obsahuje Petit Press a.s