Prieskum archívu WWW

Do webového archívu možno pristupovať priamo z  webovej stránky webdepozit, alebo možno použiť URL archívu :

Jednoduchý prieskum

S cieľom dosiahnuť používateľskú prívetivosť a intuitívne použitie vyhľadávania v archívoch má používateľ na hlavnej stránke k dispozícii jediné textové pole pre zadanie vyhľadávaného výrazu. Pod poľom je umiestnený prepínač, ktorým používateľ určí, v ktorom z archívov sa má vyhľadávať:

  • archív webového obsahu,
  • archív elektronických publikácií.

Do poľa pre hľadaný výraz môže používateľ zadať niekoľko slov (fragmentov), ktorých výskyt sa vyhľadáva v indexe, ktorý obsahuje metaúdaje a heslá z archivovaných entít. Index na vyhľadávanie v archíve WWW sídiel sa vytvára z metaúdajov aktuálneho katalógového záznamu príslušného sídla vo formáte MARC 21 (viď. Metadátový model DIP WWW). Vzťah medzi jednotlivými výrazmi je „aj“ (logický súčin: AND), pričom akceptované sú iba slová s dĺžkou 3 a viac znakov.

Jednoduchý prieskum je jednoduché vyhľadávanie, pri ktorom sa do textového poľa zadá hľadaný výraz – kľúčové slovo. Na jednoduchý prieskum možno použiť iba výrazy (slová) s dĺžkou 3 a viac znakov, pričom špeciálne znaky sa nahradzujú medzerou. Vyhľadávanie možno spresniť výberom faziet (panel „kategórie“ vľavo).

Všetky kategórie Hľadaný výraz

Hľadaj

Zruš filter

Výsledky vyhľadávania sú zobrazené na stránke otvorenej v novej záložke webového prehliadača v stránkovanom zozname. Výsledkom je výber všetkých WWW sídiel, ktoré obsahujú hľadaný výraz v textovej zložke vstupnej WWW stránky. Položky výsledkov obsahujú náhľad stránky v čase zberu a základné informácie (metaúdaje) o nájdenej entite. V prípade vyhľadania viacerých zberov jednej domény sa zobrazia všetky dostupné verzie s príslušným časom. Používateľ kliknutím na položku v zozname výsledkov otvorí, vo webovej aplikácii OpenWayback, archivovanú verziu sídla.

Rozšírený prieskum

Systém IS DIP poskytuje viacero možností na rozšírené vyhľadávanie, ktoré sa odlišujú podľa zvolenej syntaxe: jednoduchá syntax (logický súčin výrazov) alebo SOLR syntax.

Hľadaný výrazPodľa zvolenej syntaxe výrazu vpíšte do textového poľa kľúčové slová alebo logický výraz.

Syntax výrazu

  • jednoduchá – do textového poľa pre hľadaný výraz zadajte slová podobne ako pri vyhľadávani v Google.
    Zo zadaných slov sa berú do úvahy len tie, ktoré majú viac ako 3 znaky.
    Vyhľadávač vráti iba tie záznamy, ktoré obsahujú v indexovanom textovom obsahu
    všetky zadané slová.
  • SOLR – umožňuje vytvoriť komplexný výraz s použitím logických operátorov.
    Vyhľadávať je možné buď voči všetkému indexovanému textovému obsahu (meta_all), alebo voči konkrétnemu MARC poľu (napr. 650#4$a_meta).
    Logické operátory možu byť:
    a zároveň (AND), alebo (OR) alebo negácia (-).

Vyhľadať v MARC

Táto možnosť je prístupná iba pri nastavení jednoduchej syntaxe výrazu. V zozname MARC polí vyberte konkrétne pole voči ktorému sa budú hľadať zadané slová. Vyhľadávač vráti iba tie záznamy, ktoré vo zvolenom MARC poli obsahujú všetky zadané slová.

Dátum archivácieČasové ohraničenie výsledkov vyhľadávania podľa dátumu archivácie.

Spresniť – Dynamický filter tvorený fazetami zvolených polí.

Príklady vyhľadávania

Jednoduché vyhľadávanie :

Všetky kategórie Skola

Hľadaj

Zruš filter

HTML kód vstupnej stránky sídla obsahuje reťazec *skola* (škola, poškolák, … ),

Všetky kategórie kniz por

Hľadaj

Zruš filter

HTML kód vstupnej stránky sídla obsahuje obidva reťazce *kniz* (knižničný) a zároveň *por* (poriadok, …). Logická väzba dotazu: „kniz“ AND „por“

Hudba koncert

Hľadaj

Zruš filter

HTML kód vstupnej stránky sídla obsahuje reťazec koncert a zároveň metadátový záznam má v poli konspekt heslo „hudba“. Logická väzba dotazu: „hudba“ AND „koncert“

Rozšírené vyhľadávanie

meta_all:*blog* OR meta_all:*sme*

Textová zložky WWW sídla obsahuje reťazec blog alebo sme

650#4$a_meta:*politik* AND (970##$a_meta:*ludia* OR 970##$a_meta:*spravy*) AND -970##$a_meta:*hlavne*

metadátový (katalógový) záznam WWW sídla v poli 650#4$a obsahuje reťazec politik a pole 970##$a obsahuje buď ludia alebo spravy, a neobsahuje hlavne.

720##$a_meta:”Petit Press a.s.”

metadátový metadátový (katalógový) záznam WWW sídla v poli 720##$ obsahuje Petit Press a.s

Print Friendly, PDF & Email

Partneri

Úrad vlády SR Operačný program informatizácia spoločnosti Ministerstvo kultúry Slovenskej republiky Európska únia
Tvoríme vedomostnú spoločnosť Spolufinancované z prostriedkov EFRR www.opis.gov.sk www.nsrr.sk