NullWorld Blog

Startupy, projekty i ciekawe inicjatywy w sieci…
Marzec 27, 2009

Semantyka w google, tylko dlaczego tak późno

Nie tak dawno świat obiegła wiadomość na temat wykorzystania semantycznych zapytań przez Google (link do informacji).  Jakieś bardzo ogólne informacje na temat tego, że Google pracuje nad semantycznymi zapytaniami dotarły do mnie już ze 2 lata temu, bo jakoś pod koniec 2006 roku pojawiły się informacje na temat pewnej koncepcji adwords, która zakładała lepsze rozumienie wpisywanego przez użytkownika zapytania, co sugerowało że temat „rozumienia” zapytania przez wyszukiwarkę nie jest dla inżynierów Googla obcy.

Ostatnio też pojawiła się inna usługa dotycząca lepszego targetowania wyświetlanych reklam. Nazwane to zostało „interest-based advertising„, co bardziej czytelniej, ale nie do końca po polsku można nazwać tergetowaniem behawioralnym.

Pniżej film promocyjny googla prezentujący idee.

Innym przykładem możliwości jest chociażby całkiem sprawny translator dostępny jako jedna z usług google i radzący sobie całkiem nieźle nawet z bardzo trudnymi gramatycznie językami, jakim jest np. polski.

Zbierając te informacje razem i doszukując się teorii spiskowych, zaczyna się pojawiać kilka wniosków.

Wiadomo że Google posiada prawdopodobnie najobszerniejszą bazę danych na świecie, zawierającą właściwie dowolną informację, od tych oczywistych danych encyklopedycznych, po dane osobowe, aktywne karty kredytowe itd… Czyli to wszystko co świadomie lub przypadkiem użytkownicy zostawiają na stronach.

Posiadając tak ogromne dane nie trzeba być geniuszem aby wpaść na pomysł że można z tymi danymi zrobić coś więcej niż tylko je „wyszukiwać” ;). Google posiada w swojej bazie wszystkie możliwe wzory i użycia języka, teoretycznie kompletną bazę wiedzy itd. czyli to wszystko co stanowi podstawę do budowy semantycznych rozwiązań w wyszukiwaniu, tłumaczeniu, ale nie tylko… a przecież ta baza nie została zbudowana wczoraj…
Google od długiego czasu jest monopolistą, aczkolwiek teraz może nie jest już tak różowo. Ostatnie dane pokazują rosnący potencjał między innymi Yahoo a spadający Google, ale mimo to nadal przewaga jest miażdżąca (informacja z lutego).

Prawdopodobnie Google mogło odpalić bez większych problemów semantyczne wyszukiwanie dużo wcześniej, algorytmy do analizy języka naturalnego nie są czymś nowym. Fakt, są różne dla każdego języka, ale mimo to nie przypuszczam aby stanowiło to jakiś problem dla ludzi z Google. A moce obliczeniowe komputerów i serwerów pozwalały na poważne zajęciem się tematem już kilka lat wcześniej.
Na pewno jednym z impulsów był zakup firmy Powerset przez Microsoft, która rozwijała swoje semantyczne algorytmy pracując na wikipedii.

Prawdopodobnie jedynym hamulcem w tym wypadku była polityka firmy, która będąc monopolistą na rynku wyszukiwarek może pozwalać sobie na takie opóźnienia. Pytanie które można postawić na koniec tego wywodu – to ile jeszcze takich smaczków Google chowa przed użytkownikami, prawdopodobnie z dość kuriozalnego powodu – bo konkurencja na razie się tym nie zajmuje, a aktualne produkty są jeszcze w fazie w której świetnie zarabiają…

Teraz czeka nas prawdopodobnie wysyp semantycznych gadżetów od googla, które będą miały za zadanie zdystansować konkurencję w temacie inteligentnego przetwarzania danych.

Zastanawiając się nad powyższym problemem można postawić tezę że google jest w pewnym sensie z jednej strony innowatorem w sieci,  z drugiej, możliwe że całkiem świadomie, potężnym hamulcem…

Oczywiście należy to traktować lekko z przymrożeniem oka, jednak czy nie jest to możliwe? ;)

Tags: , , , , ,

Wrzesień 17, 2008

GOOSH – fenomen linii poleceń

Goosh.org nie jest już żadną nowością, w końcu serwis jest dostępny w sieci od mniej więcej początku czerwca. Jednak w dobie migających i ociekających grafiką stron jest na tyle ciekawy, że postanowiłem do niego wrócić.

Pomysł prosty, ale genialny w swojej prostocie – wykorzystać Api Google i nie opakowywać je w grafikę a dopisać shella w javascripcie. Efekt – puryści shellowi, o ile tylko zdecydują sią na odblokowanie javascriptu w swoich przeglądarkach, będą dopieszczeni…  Goosh to absolutne przeciwieństwo WIMP w świecie WIMP.

Gosh pokazuje w zaskakujący sposób moc aplikacji web 2.0 zmieniając przeglądarkę w narzędzie, które za pomocą linii poleceń umożliwia nam normalną interakcję z wyszukiwarką. Po wpisaniu polecenia help (lub h) otrzymujemy sporą listę poleceń dla samej strony, bardzo przypominających polecenia dostępne np. w serwerach ftp. Polecenia są dość intuicyjne i umożliwiają nam określenie, czego dokładnie szukamy lub nawet modyfikacja na stałe parametrów wyszukania, na zasadzie ustawienia zmiennych środowiskowych (np. set lang pl powoduje ustawienie języka polskiego, jako podstawowego języka wyników wyszukania, czy wbudowanego translatora).

Wpisanie np. images warsaw powoduje wyświetlenie obrazków o w/w temacie. Analogicznie działają polecenia video, czy place – poprzedzające zapytanie, ten ostatni pokaże nam fragment mapy z oznaczeniem poszukiwanego miejsca. Jednak nie jest to jedyna metoda wyboru kontentu, możemy użyć np. polecenia cd blogs (i analogicznie cd images, czy cd video, itd.) aby na stałe wybrać interesujący nas rodzaj treści, co możemy rozpoznać po zmienienie nazwy znaku zachęty na adekwatny do wybranej kategorii zapytania (np.:  guest@goosh.org:/blogs>). Każdy ciąg który nie jest poleceniem wpisany w wiersz poleceń jest traktowany jako hasło do wyszukania w ramach wybranego zakresu treści.

Co dodaje dodatkowego smaczku, do Goosh można się też zalogować, sprawdzić pocztę na gmailu itd.  :)

Autorem tego zamieszania jest Stefan Grothkopp. Goosh oparty jest o Google AJAX Search API. Oczywiście Goosh nie jest oficjalnym produktem google, jak to było przedstawiane na niektórych blogach, to inicjatywa jednego człowieka.

Podobnie do goosh działają takie wyszukiwarki jak np. Yubnub.org czy serchilo.net, przy czym obie należy raczej nazwać multiwyszukwiwarkami, potrafiącymi wykorzystać kilka różnych mechanizmów wyszukania poza google (wiki, ebay, cnn – itd..) Jednak główne podobnieństwo to metapolecenia sterujące wyszukaniem (np. wpisując „g” przed szukanym ciągiem mówimy że multiwyukiwarka ma wykorzystać google, a dodając „w” wskazujemy na wikipedię). Jednak ciężko to nazwać wykorzystaniem shella w takim wymiarze jak zostało to przedstawione przez goosh.org

Z popularnych swojego czasu zabawek opartych o shell przychodzą mi do głowy gwiezdne wojny (telnet towel.blinkenlights.nl) zrealizowane, jako usługa telnet. Przy czym jest to raczej odwrotny kierunek niż w tym wypadku, telnet, jako terminal znakowy został tutaj potraktowany w formie ekranu do wyświetlenia filmu. Swoją drogą po tylu latach od upublicznienia tego rozwiązania nadal robi to na mnie wrażenie :)

Podsumowaniem mogą być opinie użytkowników i zdania „shell jest nieśmiertelny”, cóż na pewno ta forma komunikacji nie da o sobie zapomnieć. Potwierdzeniem tego może być odbiór użytkowników, pojawiła się moda stworzenia z goosh.org strony startowej, nie ukrywam, że podoba mi się ten kierunek i liczę na więcej…

Tags: , , , , ,