Marco Varone su “Che cos’è un motore di ricerca semantico”

Vale la pena rilanciare e commentare questa intervista a Marco Varone su Punto Informatico, almeno per questa affermazione:

“Oggi non è pensabile un motore di ricerca (semantica) per tutto il web come Google – prosegue Varone – ma per alcuni settori, quando il problema non è troppo complesso e ci si limita ad un contesto specifico, è possibile implementare soluzioni che consentono di guadagnare tempo e ottenere risultati migliori”

Rispetto alle mirabolanti promesse di alcuni (powerset, hakia, lo stesso Varone in altri interventi) questo approccio ci riporta in un situazione un po’ più realistica.

Chi si occupa di linguistica o di intelligenza artificiale è abituato, infatti, a trovarsi a che fare con situazioni come questa: il problema è interessante ma è davvero molto complicato da risolvere, sarebbe bellissimo avere una soluzione universale che vada bene per tutte le istanze del problema, ci promettiamo che la avremo entro il prossimo anno (o lustro o secolo) e poi non riusciamo a farcela.

Di fronte a questi problemi che resistono alla soluzione, le reazione sono due. La prima è sfidare virilmente la difficoltà, affermando che il problema è risolvibile e basta risolverlo, ci vorrà tempo e denaro ma ce la faremo (addirittura alcuni dcono che è già stato risolto, ma di solito sanno che non è vero). La seconda è indebolire gli obiettivi e accontentarsi di risolvere il problema non nel caso generale, ma in alcuni (possibilmente tanti) casi particolari.

Gli ultimi due anni hanno visto una schiera di proposte che hanno adottato l’approccio “forte” per sfidare Google nell’arena dei motori di ricerca generalisti. Le pagine istituzionali di powerset, hakia, twine e compagnia sono piene di espressioni quali “comprensione” e “significato”. Tuttavia, se Varone ha ragione (e io penso che abbia ragione) gli investitori che stanno sostenendo questa “nuova generazione” di motori di ricerca potrebbero avere preso un abbaglio (abbastanza costoso, visto che ciascuno di essi ha finanziamento nell’ordine delle decine di milioni): ad oggi non sappiamo ancora come risolvere, nel caso generale, il problema della comprensione del linguaggio.

A 50 anni dalla conferenza di Dartmouth (la madre dell’intelligenza artificiale), il problema generale della comprensione del linguaggio naturale da parte di un programma di computer è un problema non risolto. Aggiungerei: per fortuna è un problema non risolto, ciò significa che è un problema su cui vale la pena ancora lavorare, innovare e fare ricerca, senza esagerare con le promesse, che quando vengono disattese generano diffidenza, fanno fare brutta figura e richiedono lunghe spiegazioni e giustificazioni (come dimostra questo post del fondatore di Twine).

La storia dei successi e dei fallimenti dell’analisi del linguaggio dimostra che l’unico approccio possibile è pragmatico: affrontare i problemi dei singoli domini applicativi uno alla volta e risolverli localmente, con l’obiettivo di migliorare le prestazioni dei sistemi e fornire strumenti che aumentino l’efficienza nei processi di analisi ed elaborazione delle informazioni.

L’analisi delle relazioni tra i cittadini della rete (che per noi è in primo luogo analisi delle conversazioni, visto che le interazioni sono in primo luogo linguistiche) è un problema complesso ed affascinante. Le dinamiche comunicative di chi conversa di moda sono diverse dalle dinamiche comunicative di chi discute di temi finanziari o di motori o di salute (alcuni dei domini su cui ci stiamo cimentando). L’obiettivo è chiaro: capire gli umori delle rete e trasformarli in insight utili per la comprensione delle dinamiche di mercato e l’analisi semantica è uno strumento fondamentale per arrivare a questo obiettivo.

0 Risposte a “Marco Varone su “Che cos’è un motore di ricerca semantico””



  1. No Comments Yet

Lascia una Risposta




Subscribe to MediaMeter

RSS Web mining world

  • Is Your City HyperLocal? Luglio 3, 2009
    Seattle resident’s are spoiled for choice when it comes to hyperlocal blogging. In addition to a couple of networks – Next Door Media {My Ballard, PhinneyWood, Magnolia Voice, Queen Anne View, Fremont Universe} and Neighborlogs {Capitol Hill Seattle, Central District...
    Matthew Hurst
  • Interactive Dashboards: US.Gov Aces, Wimbledon Double Faults Luglio 2, 2009
    The US government has unveiled a dashboard to track IT spending, which looks at first sight a shining example of the power and value of business intelligence. The Wimbledon tennis dashboard, on the other hand, appears less than impressive… As reported in The New York Times, the so-called IT Dashboard was put together by the US government in a remarkably sho […]
    Array
  • Government Dashboard Scores a Bulls-Eye Luglio 2, 2009
    The US government has unveiled a dashboard to track IT spending. Apparently put together in a remarkably short six weeks, it looks at first sight a shining example of the power and value of business intelligence. But don't take my word for it... browse the dashboard yourself! As reported in The New York Times, the so-called IT Dashboard will "track […]
    Array
  • Naughty Feeds Luglio 2, 2009
    Do you have a naughty feed? Come on, admit it. You deliberately left out the title, or did you put in an empty summary? Maybe you’re the one who doesn’t put in any dates, or perhaps you set the permalink...
    Matthew Hurst
  • Bing haz Twitter Luglio 2, 2009
    This is very cool. When Bing recognizes a search for a celeb (of the real space or other varieties), it will provide an answer composed of their Twitter identity and recent tweets. Not yet rolled out for me, but the...
    Matthew Hurst
  • CEP, Events, and Continuous {Transformation | Intelligence} Luglio 1, 2009
    Given that BI thought leaders are wrestling with the notion of events, perhaps we will see a BI-mainstreaming of event processing in the not-too-distant future. Myself, I was way ahead of the game in my expectations of demand for BI access to stream sources. While a combination of legacy database and analytical technology has held BI back, lack of perception […]
    Array
  • Mulling the Mystery of Microsoft's BI Market Share Luglio 1, 2009
    How do you gauge Microsoft's business intelligence market share when it gives BI functionality away for free? That was a bit of a puzzle even before Microsoft's January announcement that it would end development of the PerformancePoint Server, the one and only entirely BI-focused product the company had. As part of that move, Microsoft now bundles […]
    Array
  • Twisting Terms to Make BI Market Share Claims Giugno 30, 2009
    I always look forward to IDC's annual BI market shares, waiting to see who comes out on top and who is losing ground. I'm sure everyone noticed that they were, in fact, a month early this year! Call me a bean counter at-heart, but I like the irrefutable, quantifiable comparison they bring that other evaluations (including my own BI Scorecard) lack. […]
    Array
  • Free, Blogs Giugno 30, 2009
    The Blog Herald comments on the Free skirmish between Gladwell and Anderson by pointing out The blog is alive and kicking, if nothing else but because it is hard to pick critics and arguments to pieces in 140 characters or...
    Matthew Hurst
  • Bucking the Cloud Computing Hype Giugno 29, 2009
    Years ago I was running a large software development shop when the "offshoring" movement became all that and a bag of chips. I felt extreme pressure to fire some of my staff in the US and cut a deal with the dozens of outsourcing firms that were calling me daily. I was asked about offshoring so many times that it was clear to me that the pressure w […]
    Array

mybloglog

Blog Stats

  • 56,476 hits

License