Archivio per la categoria 'Web Mining'

Marco Varone su “Che cos’è un motore di ricerca semantico”

Vale la pena rilanciare e commentare questa intervista a Marco Varone su Punto Informatico, almeno per questa affermazione:

“Oggi non è pensabile un motore di ricerca (semantica) per tutto il web come Google - prosegue Varone - ma per alcuni settori, quando il problema non è troppo complesso e ci si limita ad un contesto specifico, è possibile implementare soluzioni che consentono di guadagnare tempo e ottenere risultati migliori”

Rispetto alle mirabolanti promesse di alcuni (powerset, hakia, lo stesso Varone in altri interventi) questo approccio ci riporta in un situazione un po’ più realistica.

Chi si occupa di linguistica o di intelligenza artificiale è abituato, infatti, a trovarsi a che fare con situazioni come questa: il problema è interessante ma è davvero molto complicato da risolvere, sarebbe bellissimo avere una soluzione universale che vada bene per tutte le istanze del problema, ci promettiamo che la avremo entro il prossimo anno (o lustro o secolo) e poi non riusciamo a farcela.

Di fronte a questi problemi che resistono alla soluzione, le reazione sono due. La prima è sfidare virilmente la difficoltà, affermando che il problema è risolvibile e basta risolverlo, ci vorrà tempo e denaro ma ce la faremo (addirittura alcuni dcono che è già stato risolto, ma di solito sanno che non è vero). La seconda è indebolire gli obiettivi e accontentarsi di risolvere il problema non nel caso generale, ma in alcuni (possibilmente tanti) casi particolari.

Continua a leggere ‘Marco Varone su “Che cos’è un motore di ricerca semantico”’

Una chiacchierata con Carlo Bruno per parlare di BlogMeter

Qui potete trovare il resoconto di una piacevole “chiacchierata” con Carlo Bruno che ci ha chiesto di raccontargli qualcosa di BlogMeter e dell’ascolto della rete in generale.

 buona lettura!

Il valore del text mining per le aziende: gli esempi di Starwoord e Dove

Il text mining consiste nell’estrazione e nell’interpretazione di informazioni interessanti da dati testuali non strutturati. Le tecniche di text mining trovano sempre maggiore applicazione nell’ambito del marketing per analizzare le grandi quantità di informazioni che le aziende hanno a disposizione sugli utenti. L’uso del text mining, infatti, è cresciuto con l’esplosione dei social media e delle pubblicazioni online, perché per analizzare questa grande quantità di dati, potenzialmente interessante per le aziende, presente online nei social media (social network, blog, forum ecc.) sono necessari strumenti nuovi (ed automatici) a supporto.

Un’azienda che ha avuto ottimi risultati dall’applicazione del text mining è stata la catena di Hotel&Resort Starwoord, che grazie alla collaborazione della Anderson Analytics ha analizzato oltre un milione di feedback dei suoi clienti, un quarto dei quali scritto in 20 lingue diverse, in modo da poter comprendere meglio le loro esigenze e quindi essere in grado di offrire loro un servizio eccellente.

In particolare Starwood, grazie all’utilizzo di tecniche di text mining sul sito web di viaggi Flyer Talk, ha scoperto che i suoi ospiti erano molto più contenti dei loro letti e delle loro docce rispetto a quelli degli altri hotel. Mentre il loro diretto concorrente Hilton’s era apprezzato soprattutto per la qualità del cibo e per i servizi salutistici offerti. Da queste informazioni, Rebecca Gillan, vicepresidente per la ricerca di marketing di Starwood, ha da una parte avuto riscontro della buona scelta di aver investito molto per i letti degli hotel e dall’altra ha avuto delle buone indicazioni per focalizzarsi sui cibi salutari per contrastare i suoi concorrenti. Ottenere queste informazioni è costato all’azienda molto meno di una tipica indagine di customer satisfaction.

Un’altra azienda che ha usato il text mining è stata Unilever per il brand Dove, in particolare per la campagna di lancio del prodotto Pro-Age. La Anderson Analytics ha analizzato il forum di Dove alla ricerca di consumer insight rilevanti, raggruppando il contenuto testuale intorno a 43 attributi psicologici. In questo modo Dove ha potuto conoscere, non solo che il suo target ha apprezzato la verosimiglianza delle donne presentate nello spot per il lancio del prodotto, ma anche alcune opinioni diffuse tra le donne over 50: ad esempio il fatto che non riconoscono il concetto di perfezione nelle immagini di bellezza e che sono molto contrariate per come i pubblicitari rappresentano le donne.

Web semantico e/o semantic web: io sono più semantico di te

Adesso che siamo tutti almeno un po’ semantici (ricerca semantica, motore semantico, tecnologia semantica, web semantico…) dobbiamo iniziare a distinguerci. Infatti, a quanto pare c’e’ semantica e semantica e non tutte le semantiche sono uguali.
In pratica la situazione è:
- ci sono quelli che usano semantica nel senso di semantic web: per costoro la rete deve diventare una gigantesca macchina inferenziale fondata su più o meno arcani sistemi di metadati (e accora più arcani sistemi di rapprsentazione di essi)
- ci sono quelli che usano semantica nel senso di approcci probabilistici (approcci bayesiani, latent semantic analysis e simili). Fino a poco tempo questi erano gli unici a parlare di semantic search; per costoro il significato emerge, in qualche modo, da complicati ragionamenti sulle occorrenze e co-occorenze di elementi linguistici (o anche non linguistici).
- ci sono quelli che usano semantica come sinonimo di “qualunque che cosa che faccia un’analisi del testo che vada oltre i caratteri di cui è composto”. Per costoro anche una semplice normalizzazione morfologica (che consente di trattare cane e cani come la stessa forma)  è semantica.
- ci sono quelli che usano semantica come sinonimo di semantica lessicale. Per costoro vale il seguente ragionamento: i significati e le relazioni tra significati, da che mondo e mondo, stanno nei dizionari; io ho un grosso dizionario, quindi faccio  analisi semantica. Talvolta questi grossi dizionari, magari specifici di dominio, sono chiamati ontologie. L’uso del termine “ontologia” al posto di “dizionario” ha, in molti contesti (non tutti, chiaramente), lo stesso ruolo comunicativo dell’uso del termine “rinite” al posto del termine “raffreddore”.

Indiscutibilemente la parola “semantica” sta subendo un processo di perdita di significato, almeno nel mondo IT (e in certi meandri della stampa tradizionale). Per fortuna i filosofi, i logici  e gli scienziati cognitivi si occupano poco di IT e quindi sui nostri blog e siti web e brochure possiamo dire quello che ci piace senza paura di essere corretti. Tuttavia ci teniamo a ribadire un concetto di una certa importanza (e anche di una certa ovvietà).

Continua a leggere ‘Web semantico e/o semantic web: io sono più semantico di te’

Tripadvisor fa raddoppiare le prenotazioni online?

Segnalo un articolo molto interessante che dimostra come i tour operator che pubblicano le recensioni di Tripadvisor accanto alla descrizione degli hotel raddoppiano i tassi di conversione (e quindi le prenotazioni!).

Qui potete trovare anche la “recensione” italiana fatta da Bookingblog.

BlogMeter entra in politica (2.0)

 Nei giorni scorsi  ho avuto modo di dare una rapida occhiata ai primi risultati di (una versione di) BlogMeter “customizzata” per monitorare le conversazioni che trattano temi legati alla politica italiana e devo dire che sono rimasto cosi piacevolmente impressionato che ho deciso di scriverci sopra un breve post.

Questa versione, ”osserva” ciò che si raccontano gli utenti  sui principali luoghi di aggregazione “politica” online (es: policaonline.net, it.politica, ecc. ecc.)  per poi trarne tutta una serie informazioni relative a: “di cosa si parla”, “chi ne parla”, “quanto se ne parla” e cosi via.

Il risultato ottenuto, oltre a fornirci diverse indicazioni riguardanti la popolarità di personaggi e partiti politici (che di per sé è già abbastanza interessante), consente di identificare molti altri dati estremamente significativi come per esempio:

- i temi e gli argomenti maggiormente citati e quelli più dibattuti in ambito socio-politico

-  le conversazioni (o meglio le discussioni) più animate

- gli autori maggiormente “attivi” oppure quelli ”più autorevoli”

- le fonti più rilevanti (almeno in termini di volumi di scambi di opinioni e messaggi)

- le relazioni che intercorrono tra autori, temi e luoghi di aggregazione (usando tecniche di analisi dei social network)

Perdonate la presunzione, ma dopo aver visto un primo “schizzo” di questo quadro, sono certo che, già dalle prossime elezioni, il mondo delle ricerche, del marketing e della comunicazione politica italiana non potranno più fare a meno di utilizzare questo tipo di strumenti per condurre al meglio il proprio lavoro…cosa che del resto i colleghi americani (ma anche francesi) hanno già capito da diverso tempo.

Il behavioral targeting batte il contextual targeting

Uno studio realizzato dalla Jupiter Research ha dimostrato che i consumatori on line rispondono meglio ai messaggi pubblicitari che definiscono il target su base comportamentale (behavioral targeting) rispetto alle pubblicità basate sul targeting contestuale (contextual targeting).

In particolare secondo questo studio l’approccio comportamentale, in alcune categorie di prodotti, raggiunge risultati del 22% superiori alla pubblicità semplicemente basate sul contesto. Inoltre le pubblicità che usano il targeting comportamentale riescono ad ottenere l’attenzione del consumatore almeno il 10% in più nelle 14 categorie di prodotti più discussi on line, tra i quali i prodotti finanziari, l’elettronica di consumo, i prodotti farmaceutici e la moda.
La maggiore efficacia del targeting comportamentale non deve sorprendere, in quanto rispetto al tradizionale targeting contestuale cerca di comprendere meglio l’utente. Infatti, sfruttando la misurabilità dei contatti on line, il behavioral targeting raccoglie grandi quantità di informazioni sugli utenti (le pagine visitate, il tempo speso su ciascuna pagina, le keyword usate per raggiungerla, i click effettuati, l’orario di connessione etc.), ad esempio grazie agli ad-server. Per l’analisi delle grandi quantità di dati raccolti sono diventate indispensabile le tecniche di web mining. Da tutte le informazioni raccolte si ricostruisce un profilo ampio e dettagliato degli utenti, cercando di risalire alle loro abitudini, interessi e scopi durante la navigazione, in modo da poter rispondere meglio e più velocemente alle loro richieste.
La pubblicità on line viene proposta agli utenti in base a quanto si riesce a ricostruire del loro “stile di navigazione” e non semplicemente in base al contesto, cioè in base al sito in cui stanno navigando. Ad esempio se una pubblicità contestuale inserisce il banner di un hotel nel sito di un’agenzia di viaggi, la behavioral targeting, riconoscendo che un utente è interessato ai viaggi, permette di inserire lo stesso banner di un albergo anche in un sito dedicato alla finanza o alla musica.
Nel Pamphlet IAB 2007 Pino Morra, Business Development Manager di 24/7 Real Media, analizza il behavioral targeting, descrivendono prospettive e punti deboli (qui si può leggere il Pamphlet in slide).

Touchgraph e gli strumenti di information visualization

Nel corso delle mie quotidiane esplorazioni alla ricerca di strumenti in grado di rappresentare al meglio le informazioni e le relazioni che legano i diversi fenomeni che si osservano sul web (es: come si legano i vari temi trattati sui social media, oppure quali sono le relazioni esistenti tra i vari “influenzatori” attivi sui CGM) ho trovato Touchgraph, azienda che propone delle soluzioni molto interessanti che utilizzano grafi e tecniche di clustering per rappresentare in modo intuitivo le relazioni che esistono tra siti web, persone all’interno di un social network oppure articoli commercializzati su siti di ecommerce-

Da provare la demo online che rappresenta le relazioni tra siti presenti nel DB di google, oppure tra persone che hanno un profilo su facebook o anche tra libri, video o autori presenti su Amazon.

Verso la commoditizzazione degli strumenti di marketing intelligence?

Prendo spunto da un post che Claudio Iacovelli ha scritto qualche giorno fà sul suo blog , a commento della mia intervista apparsa su Apogeonline, per puntualizzare un concetto che non è emerso chiaramente durante il “colloquio” avuto con Emanuele Quintarelli.

L’ambizioso obiettivo che “a tendere” ci siamo posti con BlogMeter, e che ci dovrebbe differenziare rispetto alle aziende che attualmente già operano nel campo del web mining, consiste nel cercare di rendere questo strumento di analisi dei CGM accessibile, sia in termini di costi che di tempi di implementazione, a tutte le aziende e non solo a quelle con a disposizione dei grandi budget di spesa, abilitando cosi una diffusione a larga scala della social media analysis nel mercato italiano.

Nel frattempo, mentre noi parliamo (anzi scriviamo!), la blogosfera italiana si sta radicalmente modificando, negli ultimi giorni abbiamo assistito al lancio di Nova100 (-74!), alla nascità della nuova piattaforma di blogging di Alice e, giusto pochi secondi fà, è stata uffcializzata l’entrata del Sole24Ore nel capitale di Blogosfere (forse la più importante piattaforma di nanopublishing in Italia)…e chissà quante altre sorprese ci attendono nei prossimi mesi ;-)

p.s. se le aziende non inizieranno velocemente a spostare “grosse fette” dei loro advertising budget online, prevedo che prossimamente più che  al lancio di nuove piattaforme di blogging assisteremo ad un bel fenomeno di consolidamento e concentrazione  :-)

Blog che trattano il tema della social media analysis

Ieri ho avuto il piacere di chattare con Nathan Gilliatt, che ha redatto “A guide to social media” una delle più complete guide sui fornitori di tecnologie e di servizi di analisi dei social media nel mondo, e che in seguito alla nostra conversazione a deciso di citare BlogMeter sul suo blog The Net-Savvy Executive e di includerci nella lista di blogger che trattano l’argomento della social media analysis ;-)

Pagina Successiva »


Subscribe to MediaMeter

Top Clicks

  • Nessuna

mybloglog

License