Teoria informacji/TI Ćwiczenia 3

Z Studia Informatyczne
Wersja z dnia 12:38, 20 lip 2006 autorstwa Wojnarski (dyskusja | edycje)
(różn.) ← poprzednia wersja | przejdź do aktualnej wersji (różn.) | następna wersja → (różn.)
Przejdź do nawigacjiPrzejdź do wyszukiwania

Zadanie 1: kompresja danych

  1. Przygotuj trzy pliki, zawierające tekst w trzech różnych językach: polskim, angielskim i trzecim dowolnie wybranym. Każdy plik powinien zawierać przynajmniej 50000 znaków. Duży wybór tekstów w różnych językach można znaleźć na przykład na stronie [gutenberg.org].
  2. Napisz program litery, który czyta plik tekstowy o podanej nazwie i wypisuje wszystkie symbole występujące w pliku wraz z ich częstotliwością, w formie: A 0.134 b 0.126 .... Nie musisz poprawnie wypisywać znaków narodowych. Program powinien wypisać też na końcu entropię binarną obliczonego rozkładu prawdopodobieństwa. Porównaj wyniki działania programu dla trzech przygotowanych wcześniej plików.