Celoplošný zber 2020

V októbri 2020 sa v rámci Digitálnych prameňov uskutočnil piaty celoplošný (celodoménový, komplexný) zber. Pre tento zber boli nastavené maximálne limity (na doménu) 20 000 objektov, 4 hodiny a 400 MB. Z celkového počtu 594 434 domén v katalógu DIP sa úspešne zozbieralo 330 874 domén slovacikálneho charakteru v objeme približne 16.12 TB.

Viac informácií v dokumente Vyhodnotenie celoplošného zberu 2020 (.pdf 776 KB).

Základné údaje po celoplošnom zbere

 
Celoplošný zber 2020 Počet GB TB  
Nekomprimovaná veľkosť   16502,53 16,12  
Komprimovaná veľkosť   6047,26 5,91  
Celkový počet URL z katalógu DIP 594 434      
Úspešné URL z katalógu DIP 330 874      
Neúspešné URL z katalógu DIP 31 325      
Zrušené/vynechané zo zberu 232 235   Spustenie 1.10.2020
        08:45
      Ukončenie 21.10.2020
Počet WARC 330 956     02:14