ZSBD-2st-1.2-w13.tresc-1.1-Slajd24
Kompresja bloków danych
Technika kompresji danych w blokach została zilustrowana na slajdzie. W bloku nieskompresowanym powtarzające się wartości atrybutów są przechowywane wielokrotnie. Natomiast w bloku skompresowanym, powtarzające się wartości są umieszczane na początku bloku, w przeznaczonym do tego celu obszarze/katalogu. W rekordach są umieszczane wskaźniki do odpowiedniej pozycji z katalogu. Ta technika została zaimplementowana m.in. w systemie Oracle.
Na slajdzie, po lewej stronie, przedstawiono nieskompresowany blok danych. Jak widać nazwa kosmetyku powtarza się wielokrotnie. Po prawej natomiast, przedstawiono skompresowany blok danych. Na początku bloku znajduje się katalog wartości, zawierający niepowtarzające się wartości. W dalszej części bloku znajdują się właściwe rekordy danych. W tym przypadku jednak zamiast wartości (nazwy kosmetyku) w rekordzie znajduje się wskaźnik do odpowiedniej pozycji z katalogu.
W typowym bloku o rozmiarze rzędu kB do zaadresowania pozycji z katalogu wystarczą wskaźniki 2B. Współczynnik kompresji zależy od oryginalnej długości atrybutów i szerokości dziedziny atrybutów znajdujących się w bloku. Dla wąskich dziedzin (np. kilka wartości) współczynniki kompresji są wyższe niż dla szerokich dziedzin.