Deprecated: Function set_magic_quotes_runtime() is deprecated in /DISK2/WWW/lokiware.info/mff/wakka.php on line 35 Matfiz : Organizace A Zpracování Dat
Přihlášení:  Heslo:  
Matfiz: OrganizaceAZpracováníDat ...
Hlavní Stránka | Seznam Stránek | Poslední Změny | Poslední Komentované | Uživatelé | Registrace |
Toto je stará verze stránky OrganizaceAZpracováníDat z 2009-01-15 17:05:09..

Organizace a zpracování dat I


Přednášející: Michal Žemlička
Slajdy: lze se jich doklikat na webu přednášky


Informace a příklady


Vybraná témata

Statické (vs. dynamické) metody organizace souborů

Ze slajdů to není zcela jasné, ale statické metody jsou (podle skript):

(a) hromada, sekvenční soubor, indexsekvenční soubor, indexovaný soubor, soubor s přímým přístupem
(b) (podle kontextu) bitové mapy
(c) (podle kontextu) základní hashování (Cormack, Larson-Kajla)

Asi tušíte, že se tu tak trochu míchají jablka s banány:


Nepořádek podle mě částečně pramen z toho:


Toť můj osobní názor a pokus o shrnutí poznatků ze slajdů a skript. — Adam

Seznamy adres

V přednášce je jim věnován jeden slajd, je na něm napsáno pouze «Odstranění duplicit» a následují tři nicneříkající obrázky. Odpovídá tomu kapitolka «Indexované soubory v DIS» ve skriptech. Vězte, že ty tři obdélníky reprezentují soubor indexů, soubor souřadnic a primární soubor. V souboru indexů by u slov měly být počty «hitů» (zásahů) a ukazatele (na slajdech je jen jedno pole, zřejmě ukazatele, počty hitů lze totiž dopočítat), v souboru souřadnic jsou pak ony “seznamy adres”, resp. ukazatelů do jednotlivých dokumentů. Každé slovo je tedy v souboru indexů právě jednou (s nějakým počtem hitů), to je ono «odstranění duplicit”. Skripta dále říkají, že v základní variantě jde o statický, jednoúrovňový index, ve kterém se hledá půlením intervalů a při přidání/odebrání/aktualizaci dokumentů se musí přestavět.

Zkouška



 
Na stránce nejsou žádné soubory. [Zobrazit soubory (formulář)]
Na stránce nejsou žádné komentáře. [Zobrazit komentáře (formulář)]