Microsoft non si compra Yahoo, ma si compra Powerset

Secondo quanto riportato da VentureBeat, Microsoft è prossima a chiudere l’acquisizione di Powerset per una cifra superire ai 100 milioni di dollari.

Powerset, di cui abbiamo già parlato qui e qui, è una delle startup (insieme a Hakia e ad alcuni altri) che cercano spazio nel mondo dei motori di ricerca web utilizzando tecnologie “semantiche” e di analisi del linguaggio naturale (tecnologia Xerox, nel caso di Powerset).

La mossa di Microsoft è sicuramente dovuta anche ad una certa abbondanza di liquidità rimasta senza destinazione dopo il fallimento dell’operazione Yahoo!, tuttavia è una mossa che colpisce: Powerset non è una piccola startup, ma un’azienda gia’ valutata oltre 40 milioni di dollari dopo l’ultimo round di finanziamento. Tuttavia non è nemmeno un’azienda affermata: dopo un paio di anni e molti denari spesi, oltre a molto hype, esiste soltanto una beta pubblica che cerca su wikipedia. Evidentemente, malgrado la crisi incombente, i tempi sono buoni per investimenti anche in tecnologie non consolidate. Oppure la paura che Microsoft ha di Google è davvero tanta.

Resta da capire come questa acquisizione rientri in una stragegia che sembrava prevedere un rilancio del perennemente in crisi “live search” e l’integrazione delle tecnologie di Fast (acquisita a gennaio per 1,2 miliardi dollari) nelle soluzioni di tipo enterprise. L’impressione è che su questi temi Microsoft navighi un po’ a vista…

Ricerca semantica, mito e realtà

Alex Iskold su ReadWriteWeb pubblica un interessante analisi delle nuove applicazioni di ricerca basate su “tecnologie semantiche”.

Gli elementi di interesse dell’articolo sono due: una chart che definisce il problema della ricerca “semantica”, e la conclusione, su cui torneremo dopo. Nella chart, che riportiamo qui:

Iskold definisce una gerarchia di problemi di ricerca, basata sulla loro complessità computazionale e sulla loro risolvibilità. La gerarchia è apprezzabile soprattutto perche’ afferma una cosa che ultimamente sembra essere un po’ sfuggita: i miracoli non si possono fare. I problemi non risolvibili da un computer restano non risolvibili da un computer, e alcuni problemi che rientrano nell’ambito dei problemi che le tecnologie semantiche sono chiamate a risolvere, rientrano appunto nel novero dei problemi non risolvibili, o risolvibili a tale prezzo che la loro soluzione è di fatto impossibile.

Ma il vero interesse del post è la conclusione: i nuovi player nell’arena della ricerca (poweset, hakia ecc.) commettono l’errore di sfidare google cercando di trovare risultati migliori. La verità è che spesso i risultati ottenuti con tecnologie sofisticate non sono enormemente migliori di quelli ottenuti con tecnologie meno sofisticate. La bottom line dovrebbe essere spostato la’ dove le tecnologie semantiche garantisco un effettivo valore aggiunto, ovvero nella presentazione dei risultati. La forza della semantica (usando il temine sia in quanto riferito all’analisi del linguaggio sia in quanto riferito al semantic web, ambiguità di cui abbiamo già discusso) è nella capacità di mettere in relazione contenuti e unità informative diverse, costruendo reti e percorsi concettuali di somiglianze, che sono impossibili con la ricerca basata esclusivamente su keywords.

Per i motori di ricerca semantici il rischio è apparire molto simili a google, ma con una tecnologia molto più costosa e onerosa. Infatti, se si gioca al gioco del motore di ricerca, con una text area e una pagina di risultati piatta, google vince sempre (anche soltanto per la sua invidiabile posizione di quasi monopolista). Se invece si fa un passo laterale e si sfida Google sulla user experience, allora c’e’ qualche speranza di fare meglio. Il passo laterale consiste nel tornare a definire il caso d’uso, che non è tanto trovare (ovvero cercare con successo), ma esplorare, mettere in relazione, approfondire i risultati.

Per ridefinire il caso d’uso è necessario ripensare alle interfacce utente degli strumenti di ricerca come strumenti di esplorazione che aiutino e supportino l’utente in un percorso di soddisfazione del suo bisogno informativo.

La ricerca semantica secondo Yahoo!

Fino ad oggi il mondo della “ricerca semantica”, intesa come la capacità di un applicazione di sfruttare le informazioni e i metadati presenti nelle pagine web in formati come RDF, è stato popolato da giocatori relativamente piccoli (un confronto si trova qui) o da soluzione ancora non disponibili per l’uso pubblico. Infatti, malgrado una certa enfasi giornalistica (Paul Miller in questo post si chiede a cosa sia dovuto il desiderio dei giornalisti che si occupano di tecnologia di trovare il google killer), siamo ancora lontani non soltanto da avere a disposizione applicazioni di ricerca “di nuovo tipo”, ma anche da avere capito chiaramente come queste nuove applicazioni potranno migliorare la user experience.

Yahoo ha annunciato recentemente che una parte importante della iniziativa definita Open Search Platform è il supporto per gli standard del semantc web, a cominciare da RDF e microformat. Si tratta di una novità importante, visto che Yahoo! resta un player di notevoli dimensioni nel mondo della ricerca. Si tratta anche di un approccio che ci sembra sulla strada giusta: piuttosto che porsi l’obiettivo, ambizioso, ma di difficile definizione, di sostituire la tradizionale ricerca full text con una ricerca diversa (“concettuale” o “semantica”), Yahoo! afferma più debolmente che i risultati ottenuti dall’utilizzo dei metadati strutturati possono servire, “ove possibile” a migliorare la ricerca full text.

Crediamo che in questo caso la parola chiave sia “ove possibile”. Non tutte le informazioni presenti in rete possono essere strutturate usando RDF, ma molte informazioni in rete già lo sono, per esempio dalle informazioni bibliografiche (da amazon alla libreria del confìgresso) o i profili di LinkdIn. La buona idea di Yahoo! è di inziare a sfruttare queste informazioni che gia’ esistono, piuttosto che proporsi di ripartire da zero per assegnare metadati semantici a tutto quanto. L’altra buona idea è di mantere un approccio aperto, consentendo a chiunque, all’interno della open search platform, di accedere a questi dati, distinguendosii in questi da coloro, come twine, che stanno puntando alla creazione di silos informativi prorprietari. Si tratta quindi di iniziare a sperimentare.

Iscriviti

Ricevi al tuo indirizzo email tutti i nuovi post del sito.