Nie tak dawno świat obiegła wiadomość na temat wykorzystania semantycznych zapytań przez Google (link do informacji). Jakieś bardzo ogólne informacje na temat tego, że Google pracuje nad semantycznymi zapytaniami dotarły do mnie już ze 2 lata temu, bo jakoś pod koniec 2006 roku pojawiły się informacje na temat pewnej koncepcji adwords, która zakładała lepsze rozumienie wpisywanego przez użytkownika zapytania, co sugerowało że temat „rozumienia” zapytania przez wyszukiwarkę nie jest dla inżynierów Googla obcy.
Ostatnio też pojawiła się inna usługa dotycząca lepszego targetowania wyświetlanych reklam. Nazwane to zostało „interest-based advertising„, co bardziej czytelniej, ale nie do końca po polsku można nazwać tergetowaniem behawioralnym.
Pniżej film promocyjny googla prezentujący idee.
Innym przykładem możliwości jest chociażby całkiem sprawny translator dostępny jako jedna z usług google i radzący sobie całkiem nieźle nawet z bardzo trudnymi gramatycznie językami, jakim jest np. polski.
Zbierając te informacje razem i doszukując się teorii spiskowych, zaczyna się pojawiać kilka wniosków.
Wiadomo że Google posiada prawdopodobnie najobszerniejszą bazę danych na świecie, zawierającą właściwie dowolną informację, od tych oczywistych danych encyklopedycznych, po dane osobowe, aktywne karty kredytowe itd… Czyli to wszystko co świadomie lub przypadkiem użytkownicy zostawiają na stronach.
Posiadając tak ogromne dane nie trzeba być geniuszem aby wpaść na pomysł że można z tymi danymi zrobić coś więcej niż tylko je „wyszukiwać” ;). Google posiada w swojej bazie wszystkie możliwe wzory i użycia języka, teoretycznie kompletną bazę wiedzy itd. czyli to wszystko co stanowi podstawę do budowy semantycznych rozwiązań w wyszukiwaniu, tłumaczeniu, ale nie tylko… a przecież ta baza nie została zbudowana wczoraj…
Google od długiego czasu jest monopolistą, aczkolwiek teraz może nie jest już tak różowo. Ostatnie dane pokazują rosnący potencjał między innymi Yahoo a spadający Google, ale mimo to nadal przewaga jest miażdżąca (informacja z lutego).
Prawdopodobnie Google mogło odpalić bez większych problemów semantyczne wyszukiwanie dużo wcześniej, algorytmy do analizy języka naturalnego nie są czymś nowym. Fakt, są różne dla każdego języka, ale mimo to nie przypuszczam aby stanowiło to jakiś problem dla ludzi z Google. A moce obliczeniowe komputerów i serwerów pozwalały na poważne zajęciem się tematem już kilka lat wcześniej.
Na pewno jednym z impulsów był zakup firmy Powerset przez Microsoft, która rozwijała swoje semantyczne algorytmy pracując na wikipedii.
Prawdopodobnie jedynym hamulcem w tym wypadku była polityka firmy, która będąc monopolistą na rynku wyszukiwarek może pozwalać sobie na takie opóźnienia. Pytanie które można postawić na koniec tego wywodu – to ile jeszcze takich smaczków Google chowa przed użytkownikami, prawdopodobnie z dość kuriozalnego powodu – bo konkurencja na razie się tym nie zajmuje, a aktualne produkty są jeszcze w fazie w której świetnie zarabiają…
Teraz czeka nas prawdopodobnie wysyp semantycznych gadżetów od googla, które będą miały za zadanie zdystansować konkurencję w temacie inteligentnego przetwarzania danych.
Zastanawiając się nad powyższym problemem można postawić tezę że google jest w pewnym sensie z jednej strony innowatorem w sieci, z drugiej, możliwe że całkiem świadomie, potężnym hamulcem…
Oczywiście należy to traktować lekko z przymrożeniem oka, jednak czy nie jest to możliwe? ;)
Tags: adwords, google, microsoft, semantyka, targetowanie behawioralne, wyszukiwarka
