ZSBD-2st-1.2-w7.tresc-1.4-Slajd27

Z Studia Informatyczne
Przejdź do nawigacjiPrzejdź do wyszukiwania

Ekstrakcja i indeksowanie właściwości

Ekstrakcja i indeksowanie właściwości


Ekstrakcja właściwości wykorzystywanych do wyszukiwania w oparciu o zawartość z obiektów multimedialnych może odbywać się: a priori – w momencie ładowania obiektów do bazy danych lub dynamicznie – w momencie gdy pojawia się zapytanie, które się do nich odwołuje.

Zaletą ekstrakcji a priori jest większa szybkość realizacji zapytań, gdyż właściwości dla obiektów w bazie danych są już wyznaczone, a być może również poindeksowane. W przypadku ekstrakcji a priori wydłuża się jednak czas ładowania obiektów do bazy danych i rosną wymagania na pamięć dyskową. Z kolei ekstrakcja dynamiczna prowadzi do spowolnienia zapytań, gdyż algorytmy ekstrakcji właściwości są czasochłonne.

Ogólnie, lepszym rozwiązaniem jest ekstrakcja a priori, gdyż pamięć dyskowa nie jest dziś droga, a ważniejsza jest redukcja czasu zapytań (wykonywanych wielokrotnie) niż ładowania danych do bazy (wykonywanego raz). Ekstrakcja a priori daje też możliwość poindeksowania właściwości, co dodatkowo może przyspieszyć realizację zapytań. Poleganie na samej tylko ekstrakcji a priori wiąże się jednak z koniecznością wskazania, które właściwości będą mogły być wykorzystywane w zapytaniach, już na etapie projektowania struktur danych. Dlatego też, możliwym kompromisem jest ekstrakcja a priori dla najważniejszych w danej aplikacji właściwości, z możliwością ekstrakcji dynamicznej tych rzadziej wykorzystywanych.

Wyszukiwanie w oparciu o zawartość może być wspierane za pomocą struktur indeksowych. Właściwości obiektów multimedialnych mogą być reprezentowane jako punkty w przestrzeni wielowymiarowej. Z tego powodu, multimedialne bazy danych wykorzystują struktury indeksów wielowymiarowych, takie jak R-drzewa, pliki kratowe, k-d-B-drzewa, itp. Od indeksów wymaga się wspierania zapytań:

(a) punktowych – do wyszukiwania obiektów o dokładnie takich samych właściwościach;

(b) przedziałowych - do wyszukiwania obiektów o właściwościach zbliżonych;

(c) typu najbliższy sąsiad – do wyszukiwania obiektu najbardziej podobnego do danego.


<< Poprzedni slajd | Spis treści | Następny slajd >>