Sztuczna inteligencja/SI Ćwiczenia 12: Różnice pomiędzy wersjami
Linia 12: | Linia 12: | ||
Z czego wynika potrzeba rozdzielenia zbioru danych na dane uczące i testowe? | Z czego wynika potrzeba rozdzielenia zbioru danych na dane uczące i testowe? | ||
<div class="mw-collapsible mw-made=collapsible mw-collapsed"> | |||
'''Rozwiązanie''' | |||
<div class="mw-collapsible-content" style="display:none"> | |||
</div> | |||
</div> | |||
== Zadanie 3 == | == Zadanie 3 == |
Wersja z 21:32, 30 lip 2006
Zadanie 1
Narysować trójwymiarowy wykres przedstawiający funkcję realizowaną przez aproksymator - sieć neuronową z rozdziału 12.
Rozwiązanie
Zadanie 2
Z czego wynika potrzeba rozdzielenia zbioru danych na dane uczące i testowe?
Rozwiązanie
Zadanie 3
Załóżmy, że mamy dwie różne sieci neuronowe, uczone niezależnie od siebie na tym samym zbiorze uczącym. Załóżmy też, że rozkład błędu obu sieci na zbiorze testowym jest rozkładem normalnym o zerowej wartości oczekiwanej i standardowych odchyleniach odpowiednio: i . Jaki jest rozkład na zbiorze testowym wartości gdzie , oznaczają wyjścia obu sieci? Jak można wykorzystać ten wynik do poprawy jakości aproksymacji?
Zadanie 4
Załóżmy, że mamy użyć sieci neuronowej do prognozowania przyszłej wartości pewnego procesu zmiennego w czasie, charakteryzującego się tym, że jego przyszłe wartości zależą od przeszłych zgodnie z równaniem:
gdzie oznacza czas, jest nieznaną funkcją, zaś stałą, określającą najdalszą zależność między przeszłością a przyszłością (taki proces jest przykładem tzw. szeregu czasowego).
Zaproponować sposób użycia sieci neuronowej do wykonania prognozy. Jak stworzyć zbiór trenujący dla sieci?
Zadanie 5
Czym skutkuje obecność w zbiorze trenującym elementów powtarzających się?
Zadanie 6
Funkcja błędu minimalizowana w czasie uczenia sieci neuronowej ma minima lokalne i punkty siodłowe (w których gradient zeruje się), a także obszary płaskie o bardzo małych wartościach modułu gradientu. Z czego wynikają te zjawiska? Dla jakich wartości wag da się je zaobserwować?