BD-2st-1.2-w06.tresc-1.1-Slajd12
Model kosztów
Każda operacja na pliku posiada swój tzw. koszt, który jest oczywiście zależny od organizacji wewnętrznej pliku. Koszt jest konkretną wartością, której miarą może być np. czas wykonania, liczba dostępów do dysku. Koszt jest wartością wynikającą z tzw. modelu kosztów (ang. cost model).
W celach analizy kosztów dostępu do plików nieuporządkowanch, uporządkowanych i haszowych przyjmiemy następujący model kosztów.
Niech:
- N oznacza liczbę bloków;
- każdy blok zawiera R rekordów;
- średni czas odczytu/zapisu bloku dyskowego wynosi D;
- średni czas przetwarzania rekordu (np., porównanie wartości atrybutu ze stałą) wynosi C;
- w przypadku plików haszowych stosujemy funkcję haszową odwzorowującą wartości rekordów na liczby naturalne; czas obliczenia wartości funkcji haszowej wynosi H;
Typowe wartości wymienionych parametrów wynoszą D = 15 ms, C i H od 1 do 10 µs. Jak widać, czas dostępu do dysku (I/O) jest tu dominującym.