Aktualna wersja na dzień 09:19, 5 wrz 2023

autor: Paweł Górecki (gorecki@mimuw.edu.pl)

Optymalizacja II

Na tym wykładzie zajmiemy się globalną analizą przepływu danych, którą można wykorzystać do optymalizowania i generowania kodu. Globalna analiza przepływu danych polega na zebraniu informacji związanych z każdym blokiem (bądź fragmentem bloku) grafu przepływu (stąd "globalność"), a następnie wykorzystaniu jej w poprawianiu kodu i generowaniu kodu docelowego. Podstawowym narzędziem są "równania przepływu", które będziemy rozwiązywać w celu obliczenia potrzebnych informacji. Interesujące jest to, że wiele problemów globalnej analizy przepływu danych podlega podobnym regułom rozwiązywania, co wykorzystamy do przedstawienia efektywnych algorytmów.

Ilustracją będą dwa problemy:

definicji osiągających - stosowanych w rozwiązywaniu globalnej propagacji kopii i eliminacji zmiennych indukcyjnych,
zmiennych żywych - stosowanych w generowaniu kodu (tzw. przydział rejestrów procesora).

Podstawy

Równania przepływu danych

Informacje dotyczące przepływu danych zwykle wylicza się za pomocą układów równań, które przedstawiają zależności między występowaniem tych informacji pomiędzy różnymi punktami programu. Zwykle równanie ma postać:

$o u t [S] = g e n [S] \cup (i n [S] - k i l l [S])$ .

Należy je rozumieć w następujący sposób: informacja dostępna na końcu instrukcji jest sumą zbiorów informacji

przez nią generowanych (oznaczonych jako $g e n [S]$ )
dostępnych na wejściu do niej ( $i n [S]$ ) ale bez informacji, które są niszczone przez tą instrukcję ( $k i l l [S]$ ).

W zależności od rozwiązywanego zadania, będziemy rozważać równania, w których $i n [S]$ definiuje się za pomocą $o u t [S]$ (w analizie od końcowego bloku). W globalnej analizie przepływu danych zamiast pojedyńczej instrukcji stosuje się bloki bazowe z grafu przepływu.

Definicje osiągające

Definicją zmiennej nazywamy instrukcję, która wiąże lub może wiązać tą zmienną z wartością. Przypisania lub czytanie z pliku to instrukcje zawsze definiującą zmienną. Nazywamy je definicjami pewnymi. Instrukcje niepewne to takie, którę mogą definiować zmienną np.:

wywołanie procedury ze zmienną jako argumentem przekazywanym nie przez wartość,
przypisania przez wskaźnik do zmiennej (w praktyce oznacza to defnicję każdej zmiennej).

Rozważmy ścieżkę w grafie przepływu łączącą dwa punkty. Wystąpienie pewnej definicji zmiennej a na tej ścieżce zabija wcześniejszą definicję tej zmiennej. Piszemy, że definicja D osiąga punkt P w grafie przepływu, jeśli istnieje ścieżka z miejsca występującego bezpośrednio po D do P taka, że D nie jest zabijane na tej ścieżce. Zauważmy, że w danym punkcie mogą być osiągalne pewne i niepewne definicje.

W poniższym przykładzie definicje X=1 i X=3 są pewne, a *Z=1 jest niepewna. Definicja X=1 nie jest zabijana przez definicje z bloku C, zatem w bloku D jest osiągalna. Jednocześnie w bloku D jest osiągalna definicja niepewna *Z=1, która potencjalnie też jest definiującą dla zmiennej X. Instrukcja X=3 w bloku E zabija wcześniejsze definicje X.

Zakładamy, że docelowy program będzie wykorzystywał wszystkie krawędzie (sprawdzenie tego jest problemem nierozstrzygalnym). Wszelkie wątpliwości rozważamy konserwatywnie tak, by uwzględnić każdy potencjalny scenariusz wykonania. Dlatego musimy rozważać definicje pewne zasłonięte przez definicje niepewne i ścieżki, które być może nigdy nie zostaną wykorzystane.

Programy strukturalne i obliczanie definicji osiągających

Załóżmy standardową gramatykę pewnego języka strukturalnego:

S ::= S1 ;  S2                  // Złożenie
    | if E then S1 else S2      // Instrukcja warunkowa
    | do S1 while E             // Pętla 
    | id := E                   // Przypisanie (definicja pewna)
E ::= id + id
    | id

Zakładamy, że wszystkie definicje są pewne. Równania przepływu danych dla definicji osiągających można łatwo zapisać:

S ::= S1 ;  S2                   $g e n [S] = g e n [S 2] \cup (g e n [S 1] - k i l l [S 2])$ 
                                 $k i l l [S] = k i l l [S 2] \cup (k i l l [S 1] - g e n [S 2])$     
                                 $i n [S 1] = i n [S]$ 
                                 $i n [S 2] = i n [S 1]$ 
                                 $o u t [S] = o u t [S 2]$ 
            
    | if E then S1 else S2       $g e n [S] = g e n [S 1] \cup g e n [S 2]$ 
                                 $k i l l [S] = k i l l [S 1] \cap k i l l [S 2]$ 
                                 $i n [S 1] = i n [S]$ 
                                 $i n [S 2] = i n [S]$ 
                                 $o u t [S] = o u t [S 1] \cup o u t [S 2]$ 

    | do S1 while E              $g e n [S] = g e n [S 1]$ 
                                 $k i l l [S] = k i l l [S 1]$ 
                                 $i n [S] = i n [S] \cup g e n [S 1]$ 
                                 $o u t [S] = o u t [S 1]$ 

    | id := E                    $g e n [S] = {i d : = E}$ 
                                 $k i l l [S] = D_{i d} - {i d : = E}$ 
                                 $o u t [S] = g e n [S] \cup (i n [S] - k i l l [S])$

Tu $D_{i d}$ to zbiór wszystkich definicji zmiennej id w programie.

Cechy oblicznych zbiorów:

"prawdziwy" kill (tzn. taki, który zostałby wygenerowany podczas pewnego uruchomienia programu) jest zawsze nadzbiorem obliczanego (wg powyższych reguł),
"prawdziwy" gen jest zawsze podzbiorem obliczanego.

Takie różnice są akceptowalne (bezpieczne), pod warunkiem, że wykonane optymalizacje w oparciu o takie zbiory wygenerowanych definicji osiągających nie zmieniają obliczanej funkcji programu.

Definicje osiągające można wykorzystać w algorytmach globalnej optymalizacji np.:

globalnej propagacji kopii
eliminacji zmiennych indukcyjnych

Tutaj pominiemy szczegóły tych algorytmów. Zainteresowanych odsyłamy do książki "Kompilatory", Aho, Sethi i Ullmana.

Podejście iteracyjne

W ogólnej sytuacji stosuje się podejście iteracyjne. Ponieważ wiele problemów związanych z analizą przepływu danych ma charakter "generowania-zabijania", pokażemy na przykładzie problemu definicji osiągających, jak rozwiązywać równania przepływu danych dla dowolnych grafów przepływu.

Schemat:

zbuduj graf przepływu,
oblicz zbiory gen i kill dla bloków bazowych,
oblicz jednocześnie, stosując podejście iteracyjne, zbiory in i out.

Bedziemy wyróżniać dwa rodzaje obliczeń:

do przodu, gdy zbiory out oblicza się na podstawie zbiorów in,
do tyłu, gdy zbiory in oblicza się na podstawie zbiorów out.

Operatorem łączącym nazywamy operator użyty do zdefiniowania zbiorów przychodzących do danego bloku. Np. dla problemu definicji osiągających jest to operator sumy.

Problem osiągających definicji

Równania dla tego problemu są następujące:

Parser nie mógł rozpoznać (błąd składni): {\displaystyle in[B] = \bigcup_{P\ \mbox{\small poprzednik}\ B}\ out[B]}

 $o u t [B] = g e n [B] \cup (i n [B] - k i l l [B])$

Algorytm iteracyjny obliczający in i out jest dość naturalny:

1. Oblicz gen i kill dla bloków bazowych
2. for każdy blok bazowy B do 
       $o u t [B] : = g e n [B]$  
       $i n [B] : = \emptyset$ 
3. end for
4. while zbiory in lub out zmieniają się do
5.    for każdy blok bazowy B do     
           Parser nie mógł rozpoznać (błąd składni): {\displaystyle in[B]:= \bigcup_{P\ \mbox{\small poprzednik}\ B}\ out[B]}
       
            $o u t [B] = g e n [B] \cup (i n [B] - k i l l [B])$ 
6.    end for
5. done

Zmienne żywe

Przypomnijmy definicję zmiennej żywej: zmienna jest żywa w danym miejscu, jeśli może być użyta na pewnej ścieżce rozpoczynającej się od tego miejsca. W przeciwnym przypadku mówimy, że zmienna jest martwa. Ta informacja jest ważna w generowaniu kodu wynikowego, np. w sytuacji gdy potrzebujemy wolnego rejestru można użyć tych, które aktualnie przechowują zmienne martwe.

Równania dla tego problemu są następujące:

 $i n [B] = u s e [B] \cup (o u t [B] - d e f [B])$ 
Parser nie mógł rozpoznać (błąd składni): {\displaystyle in[B] = \bigcup_{S\ \mbox{\small następnik}\ B}\ in[S]}

gdzie

in[B] - zbiór zmiennych żywych bezpośrednio przed blokiem B
out[B] - zbiór zmiennych żywych bezpośrednio za blokiem B
def[B] - do tego zbioru należy każda zmienna, której definicja i póżniejsze użycie jest w B (odpowiednik zbioru gen)
use[B] - do tego zbioru należy każda zmienna, która może być użyta w B przed dowolną definicją tej zmiennej (odpowiednik zbioru kill)

Algorytm iteracyjny jest analogiczny do poprzedniego.

@@ Linia 1: / Linia 1: @@
-= Globalna analiza przepływu danych =
+autor: Paweł Górecki (gorecki@mimuw.edu.pl)
-Opracowana na podstawie "Kompilatory" Aho, Sethi, Ullmana.
+= Optymalizacja II =
+Na tym wykładzie zajmiemy się globalną analizą przepływu danych, którą można wykorzystać
+do optymalizowania i generowania kodu.
+Globalna analiza przepływu danych polega na zebraniu informacji związanych z każdym blokiem (bądź fragmentem bloku)
+grafu przepływu (stąd "globalność"), a następnie wykorzystaniu jej w poprawianiu kodu i generowaniu kodu docelowego. Podstawowym narzędziem są
+"równania przepływu", które będziemy rozwiązywać w celu obliczenia potrzebnych informacji.
+Interesujące jest to, że wiele problemów globalnej analizy przepływu danych podlega podobnym regułom
+rozwiązywania, co wykorzystamy do przedstawienia efektywnych algorytmów.
+Ilustracją będą dwa problemy:
+* definicji osiągających - stosowanych w rozwiązywaniu globalnej propagacji kopii i eliminacji zmiennych indukcyjnych,
+* zmiennych żywych - stosowanych w generowaniu kodu (tzw. przydział rejestrów procesora).
 == Podstawy ==
 === Równania przepływu danych ===
-''(Zakładam, ze pojęcie grafu przepływu jest już znane.)''
 Informacje dotyczące przepływu danych zwykle wylicza się za pomocą układów
@@ Linia 14: / Linia 24: @@
 Zwykle równanie ma postać:
-<math>out[S]=gen[S] \cup ( in[S] - kill[S] ).</math>
+<math>out[S]=gen[S] \cup ( in[S] - kill[S] )</math>.
-Należy je rozumieć w następująco: informacja dostępna na końcu instrukcji jest sumą zbiorów
+Należy je rozumieć w następujący sposób: informacja dostępna na końcu instrukcji jest sumą zbiorów
 informacji
 * przez nią generowanych (oznaczonych jako <math>gen[S]</math>)
@@ Linia 35: / Linia 45: @@
 na tej ścieżce '''zabija''' wcześniejszą definicję tej zmiennej.
 Piszemy, że definicja ''D'' '''osiąga''' punkt ''P'' w grafie przepływu, jeśli
-istnieje ścieżka z miejsca występującego bezpośrednio po ''D'' do ''P'', taka że ''D''
+istnieje ścieżka z miejsca występującego bezpośrednio po ''D'' do ''P'' taka, że ''D''
 nie jest zabijane na tej ścieżce.
 Zauważmy, że w danym punkcie mogą być osiągalne pewne i niepewne definicje.
 W poniższym przykładzie definicje ''X=1'' i ''X=3'' są pewne, a ''*Z=1'' jest niepewna.
@@ Linia 48: / Linia 60: @@
 Zakładamy, że docelowy program będzie wykorzystywał wszystkie krawędzie (sprawdzenie tego
 jest problemem nierozstrzygalnym).
-Wszelkie wątpliwości rozważamy ``konserwatywnie'', tak by uwzględnić każdy potencjalny
+Wszelkie wątpliwości rozważamy ''konserwatywnie'' tak, by uwzględnić każdy potencjalny
 scenariusz wykonania. Dlatego musimy rozważać definicje pewne zasłonięte przez
 definicje niepewne i ścieżki, które być może nigdy nie zostaną wykorzystane.
-=== Programy strukturalne i obliczanie definicji osiągalnych ===
+=== Programy strukturalne i obliczanie definicji osiągających ===
 Załóżmy standardową gramatykę pewnego języka strukturalnego:
@@ Linia 63: / Linia 75: @@
 Zakładamy, że wszystkie definicje są pewne. Równania przepływu danych
-dla definicji osiągalnych można łatwo zapisać:
+dla definicji osiągających można łatwo zapisać:
   S ::= S1 ;  S2                  <math>gen[S]=gen[S2] \cup (gen[S1] - kill[S2])</math>
@@ Linia 89: / Linia 101: @@
 Cechy oblicznych zbiorów:
-* "prawdziwy" ''kill'' (tzn. taki który zostałby wygenerowany podczas pewnego uruchomienia programu) jest zawsze nadzbiorem obliczanego (wg powyższych reguł),
+* "prawdziwy" ''kill'' (tzn. taki, który zostałby wygenerowany podczas pewnego uruchomienia programu) jest zawsze nadzbiorem obliczanego (wg powyższych reguł),
 * "prawdziwy" ''gen'' jest zawsze podzbiorem obliczanego.
 Takie różnice są akceptowalne (bezpieczne), pod warunkiem, że wykonane optymalizacje w oparciu o takie
-zbiory wygenerowanych definicji osiągalnych nie zmieniają obliczanej funkcji programu.
+zbiory wygenerowanych definicji osiągających nie zmieniają obliczanej funkcji programu.
+Definicje osiągające można wykorzystać w algorytmach globalnej optymalizacji np.:
+* globalnej propagacji kopii
+* eliminacji zmiennych indukcyjnych
+Tutaj pominiemy szczegóły tych algorytmów. Zainteresowanych odsyłamy do książki
+"Kompilatory", Aho, Sethi i Ullmana.
+== Podejście iteracyjne ==
+W ogólnej sytuacji stosuje się podejście iteracyjne. Ponieważ wiele problemów
+związanych z analizą przepływu danych ma charakter "generowania-zabijania",
+pokażemy na przykładzie problemu definicji osiągających, jak rozwiązywać równania
+przepływu danych dla dowolnych grafów przepływu.
+Schemat:
+* zbuduj graf przepływu,
+* oblicz zbiory ''gen'' i ''kill'' dla bloków bazowych,
+* oblicz jednocześnie, stosując podejście iteracyjne, zbiory ''in'' i ''out''.
+Bedziemy wyróżniać dwa rodzaje obliczeń:
+* '''do przodu''', gdy zbiory ''out'' oblicza się na podstawie zbiorów ''in'',
+* '''do tyłu''', gdy zbiory ''in'' oblicza się na podstawie zbiorów ''out''.
+'''Operatorem łączącym''' nazywamy operator użyty do zdefiniowania zbiorów przychodzących
+do danego bloku. Np. dla problemu definicji osiągających jest to operator  sumy.
+=== Problem osiągających definicji ===
-= Generowanie kodu wynikowego - przydział rejestrów =
+Równania dla tego problemu są następujące:
-Może osobny wykład?
+ <math>in[B] = \bigcup_{P\ \mbox{\small poprzednik}\ B}\ out[B]</math>
+ <math>out[B] = gen[B] \cup ( in[B] - kill[B] )</math>
+Algorytm iteracyjny obliczający ''in'' i ''out'' jest dość naturalny:
+. Oblicz ''gen'' i ''kill'' dla bloków bazowych
+. '''for''' każdy blok bazowy B '''do'''
+       <math>out[B]:=gen[B]</math>
+       <math>in[B]:=\emptyset</math>
+. '''end for'''
+. '''while''' zbiory ''in'' lub ''out'' zmieniają się '''do'''
+.    '''for''' każdy blok bazowy B '''do'''
+            <math>in[B]:= \bigcup_{P\ \mbox{\small poprzednik}\ B}\ out[B]</math>
+            <math>out[B] = gen[B] \cup ( in[B] - kill[B] )</math>
+.    '''end for'''
+. '''done'''
+=== Zmienne żywe ===
+Przypomnijmy definicję zmiennej żywej: zmienna  jest '''żywa''' w danym miejscu, jeśli może być użyta
+na pewnej ścieżce rozpoczynającej się od tego miejsca. W przeciwnym przypadku mówimy, że zmienna
+jest '''martwa'''.
+Ta informacja jest ważna w '''generowaniu kodu wynikowego''', np. w sytuacji gdy potrzebujemy
+wolnego rejestru można użyć tych, które aktualnie przechowują zmienne martwe.
+Równania dla tego problemu są następujące:
+ <math>in[B] = use[B] \cup ( out[B] - def[B] )</math>
+ <math>in[B] = \bigcup_{S\ \mbox{\small następnik}\ B}\ in[S]</math>
+gdzie
+* ''in[B]'' - zbiór zmiennych żywych bezpośrednio przed blokiem ''B''
+* ''out[B]'' - zbiór zmiennych żywych bezpośrednio za blokiem ''B''
+* ''def[B]'' - do tego zbioru należy każda zmienna, której definicja i póżniejsze użycie jest w ''B'' (odpowiednik zbioru ''gen'')
+* ''use[B]'' - do tego zbioru należy każda zmienna, która może być użyta w ''B'' przed dowolną definicją tej zmiennej (odpowiednik zbioru ''kill'')
+Algorytm iteracyjny jest analogiczny do poprzedniego.

Metody realizacji języków programowania/MRJP Wykład 11: Różnice pomiędzy wersjami

Aktualna wersja na dzień 09:19, 5 wrz 2023

Spis treści

Optymalizacja II

Podstawy

Równania przepływu danych

Definicje osiągające

Programy strukturalne i obliczanie definicji osiągających

Podejście iteracyjne

Problem osiągających definicji

Zmienne żywe

Menu nawigacyjne

Działania na stronie

Opcje strony

Narzędzia osobiste

Nawigacja

Szukaj

Narzędzia