Algoritmi per il Web e Data Mining

Direzioni di ricerca:

    * Ricerca dell'informazione sul web
    * Analisi di grafi e collezioni documentali
    * Reti Complesse di grandi dimensioni
    * Reti Sociali dinamiche
    * Algorithmic Mechanism Design e Network Economics

Membri:
Luca Becchetti, Stefano Leonardi (leader).

Dottorandi:
Ilaria Bordino, Ida Mele.

Post Doc:
Aris Anagnostopoulos, Piotr Sankowski.

I nostri interessi vertono su metodi algoritmici per caratterizzare la struttura di reti complesse e sulla loro applicazione all'analisi della struttura del Web e delle interazioni dei suoi utenti. Finora ci siamo concentrati su tecniche per l'identificazione di strutture che rivelano attivita' sociali, relazioni di fiducia o che caratterizzano la qualita' dei contenuti.
In collaborazione con il gruppo di Yahoo! Research a Barcellona, abbiamo in particolare sviluppato e analizzato tecniche efficaci e scalabili per l'individuazione automatica di sottostrutture topologiche del grafo del Web tipiche di fenomeni di Web spamming. Tali tecniche sono poi state estese al fine di ottenere metodi accurati ed efficienti per la stima puntuale della distribuzione di piccole sottostrutture topologiche che contraddistinguono specifici fenomeni di interazione sociale nel Web. Abbiamo inoltre sviluppato algoritmi per l'estrazione di informazione significativa dalla messe di dati disponibile nei query-log, un compito di importanza critica al fine di individuare relazioni semantiche tra utenti, interrogazioni e pagine Web.
Un'altra importante direzione di ricerca riguarda il progetto e l'analisi dei complessi meccanismi economici che emergono in Internet e nel Web e gli aspetti computazionali dell'implementazione di meccanismi economici fondamentali, quali ad esempio aste per pubblicita' on-line. Negli ultimi anni inoltre, abbiamo dedicato parte della nostra attivita' al progetto e all'analisi di meccanismi efficienti per la ripartizione dei costi di realizzazione ed esercizio di reti informatiche.
Il Web e' evoluto da mezzo efficace per la condivisione di informazione a ambiente sociale ricco e utile per la condivisione di contenuti complessi, prodotti e servizi. Rispetto a cio', un'importante direzione di ricerca riguarda l'analisi della mole di dati raccolti nell'esercizio delle reti sociali on-line e il loro uso per migliorare e personalizzare la ricerca dell'informazione nel Web. Lo sviluppo di strategie e strumenti per l'analisi della diffusione di atteggiamenti e tendenze, per il marketing virale e per l'adozione di nuove tecnologie e' di importanzaa fondamentale in molte attivita'. Le applicazioni di commercio elettronico richiedono inoltre l'implementazione di meccanismi economici quali le gia' citate aste per la pubblicita' on-line. Le attivita' commerciali sul Web richiedono inoltre tecniche algoritmiche sofisticate per l'analisi dei dati relativi all'attivita' degli utenti raccolti dai motori di ricerca e da altre applicazioni, al fine di individuare tendenze importanti e implementare cosi' servizi fondamentali per il commercio elettronico, quali quelli di raccomandazione. Infine, la crescita del Web e le applicazioni sopra citate pongono considerevoli problemi di scala per il quale intendiamo proporre soluzioni efficaci, basate ad esempio su tecniche sofisticate di caching.

Progetti:
DELIS - Dynamically Evolving Large Scale Information Systems
Gennaio 2004 - Febbraio 2008 - EU FP6 FET

Progetti di cui e' coordinatore il DI - Sapienza:
WEB RAM - Web Retrieval and Mining
Gennaio 2007 - Dicembre 2008 - MIUR PRIN

(future) link to web page