ED-4.2-m05-1.0-Slajd12

Z Studia Informatyczne
Wersja z dnia 07:26, 5 wrz 2006 autorstwa ALesniewska (dyskusja | edycje)
(różn.) ← poprzednia wersja | przejdź do aktualnej wersji (różn.) | następna wersja → (różn.)
Przejdź do nawigacjiPrzejdź do wyszukiwania

Przykład (1)

Przykład (1)


Rozważmy przykładową bazę danych przedstawioną na slajdzie w tabeli Recepty. Baza danych zawiera informacje o: pacjentach (pacjentId),

receptach (receptaId), dacie wypisania recepty (data) oraz zapisanych lekach (lekId). Interpretacja tabeli jest następująca, rozważmy pierwszy rekord przedstawiony w tabeli. Rekord ten przedstawia sytuację, że 26 stycznia 1998 roku pacjent o identyfikatorze 105 otrzymał receptę 112 na lek o identyfikatorze 30. Kilka dni później, czyli 28 stycznia 1998 roku ten sam pacjent o identyfikatorze 105 otrzymał kolejną receptę 114 na lek o identyfikatorze 90. Przykładowo pacjent o identyfikatorze 200 otrzymał recepty o identyfikatorze 117 w dniu 3/9/98 na następujące leki: lek o identyfikatorze 30, lek o identyfikatorze 50 oraz lek o identyfikatorze 70. Przedstawioną bazę danych można przedstawić w postaci bazy danych sekwencji, w której kolejność występowania zdarzeń jest reprezentowana poprzez uporządkowanie wyrazów sekwencji. W tym przypadku zdarzeniem jest wypisanie recepty pojedynczemu pacjentowi na określony zbiór leków. Analizując bazę danych sekwencji można w niej odkryć, zakładając próg minimalnego wsparcia minsup = 0.25, następujące cztery wzorce sekwencji:

1) ((30), (40) sup = 0,4

  1. ((30), (70) sup = 0,4
  2. ((30), (90)) sup = 0,4
  3. ((30), (40 70)) sup = 0,4

Wzorce (3) i (4) są maksymalnymi wzorcami sekwencji. Interpretacja odkrytych wzorców sekwencji jest następująca. W 40% przypadków

lekarze zapisują lek 30, a następnie, lek 90. Inną popularną terapią stosowaną przez lekarzy (40% przypadków) jest stosowanie leku 30, a następnie, pary leków 40 i 70.


<< Poprzedni slajd | Spis treści | Następny slajd >>