ZSBD-2st-1.2-w8.tresc-1.4-Slajd6

Z Studia Informatyczne
Wersja z dnia 12:54, 9 sie 2006 autorstwa PKrzyzagorski (dyskusja | edycje)
(różn.) ← poprzednia wersja | przejdź do aktualnej wersji (różn.) | następna wersja → (różn.)
Przejdź do nawigacjiPrzejdź do wyszukiwania

SQL/MM Full-Text

SQL/MM Full-Text


SQL/MM Full-Text dotyczy przetwarzania dokumentów tekstowych, które od tradycyjnych łańcuchów znaków odróżnia przede wszystkim znacznie większy rozmiar, ale również obecność struktury (podział na zdania i akapity) oraz charakter operacji wyszukiwania. O ile dla prostych łańcuchów znaków wyszukiwanie sprowadza się do prostego dopasowywania do wzorca, w przypadku danych tekstowych kryteria wyszukiwania dotyczą obecności słów kluczowych lub fraz iuwzględniają odmianę, wymowę, a nawet znaczenie poszczególnych słów czy fraz w kontekście konkretnego języka.

Standard SQL/MM Full-Text definiuje typy danych dla dokumentów tekstowych i wzorców wyszukiwania, a także metody dopasowywania dokumentów tekstowych do wzorca. W zakres standardu wchodzą również metody konwersji danych tekstowych do/z typów znakowych.

SQL/MM Full-Text zakłada obsługę wielu języków. Niemniej, mechanizmy przeszukiwania tekstów objęte standardem SQL/MM są szczególnie odpowiednie dla języków, które łatwo poddają się analizie komputerowej w zakresie wyodrębniania poszczególnych słów i zdań. Do tej klasy języków należą języki zachodnie (w tym np. angielski, niemiecki, polski), w przypadku których słowa oddzielone są odstępami, a zdania znakami interpunkcyjnymi. Inaczej jest np. w języku japońskim, gdzie wyodrębnienie słów z tekstu wymaga analizy kontekstu.


<< Poprzedni slajd | Spis treści | Następny slajd >>