Teoria informacji/TI Ćwiczenia 3
Z Studia Informatyczne
Przejdź do nawigacjiPrzejdź do wyszukiwania
Zadanie 1: kompresja danych
- Przygotuj trzy pliki, zawierające tekst w trzech różnych językach: polskim, angielskim i trzecim dowolnie wybranym. Każdy plik powinien zawierać przynajmniej 50000 znaków. Duży wybór tekstów w różnych językach można znaleźć na przykład na stronie [gutenberg.org].
- Napisz program litery, który czyta plik tekstowy o podanej nazwie i wypisuje wszystkie symbole występujące w pliku wraz z ich częstotliwością, w formie: A 0.134 b 0.126 .... Nie musisz poprawnie wypisywać znaków narodowych. Program powinien wypisać też na końcu entropię binarną obliczonego rozkładu prawdopodobieństwa. Porównaj wyniki działania programu dla trzech przygotowanych wcześniej plików.