ZSBD-2st-1.2-w8.tresc-1.4-Slajd6
SQL/MM Full-Text
SQL/MM Full-Text dotyczy przetwarzania dokumentów tekstowych, które od tradycyjnych łańcuchów znaków odróżnia przede wszystkim znacznie większy rozmiar, ale również obecność struktury (podział na zdania i akapity) oraz charakter operacji wyszukiwania. O ile dla prostych łańcuchów znaków wyszukiwanie sprowadza się do prostego dopasowywania do wzorca, w przypadku danych tekstowych kryteria wyszukiwania dotyczą obecności słów kluczowych lub fraz iuwzględniają odmianę, wymowę, a nawet znaczenie poszczególnych słów czy fraz w kontekście konkretnego języka.
Standard SQL/MM Full-Text definiuje typy danych dla dokumentów tekstowych i wzorców wyszukiwania, a także metody dopasowywania dokumentów tekstowych do wzorca. W zakres standardu wchodzą również metody konwersji danych tekstowych do/z typów znakowych.
SQL/MM Full-Text zakłada obsługę wielu języków. Niemniej, mechanizmy przeszukiwania tekstów objęte standardem SQL/MM są szczególnie odpowiednie dla języków, które łatwo poddają się analizie komputerowej w zakresie wyodrębniania poszczególnych słów i zdań. Do tej klasy języków należą języki zachodnie (w tym np. angielski, niemiecki, polski), w przypadku których słowa oddzielone są odstępami, a zdania znakami interpunkcyjnymi. Inaczej jest np. w języku japońskim, gdzie wyodrębnienie słów z tekstu wymaga analizy kontekstu.