MasterNewMedia Italia
Scopri i migliori tool per comunicare,
collaborare e fare marketing
   
Curated by: Luigi Canali De Rossi
 


27 febbraio 2008

Database Publishing: Ricerca Federata E Aggregazione Dei Contenuti Sono Il Futuro


Oggigiorno i risultati di ricerca più utili sono come una sorta di crema composta da una moltitudine di contenuti aggregati e filtrati ma provenienti da diversi tipi di database. Guarda per esempio i risultati forniti da Google. I database che funzionano veramente sono quelli dinamici, ossia quelli alimentati in modo continuo da contenuti provenienti da diversi motori di ricerca. Nel mondo del database publishing la frase "the database is now" vale più di mille parole. I database infatti nascono e rinascono ogni qual volta viene effettuata una richiesta e, di conseguenza, viene generata una pagina di risultati.

content-aggregation-federated-search_id668347_size485.jpg

Photo credit: Ansontsui

"The database is now" è una frase coniata da John Blossom, un analista di contenuti per le aziende, e riflette una realtà nella quale il database non è visto più come una collezione statica e rigida dei diversi tipi di dati collezionati da un utente. Il database si genera ogni volta che fai una ricerca oppure ogni volta che sviluppi un canale personalizzato di aggregazione con strumenti come Pipes, Popfly, Intel Mash Maker o Friendfeed.

"Database is now" ha un senso nel momento in cui ci si distacca dal concetto di normalizzazione dei dati per orientarsi verso un tipo di aggregazione contestualizzata e ricerca nei database federati.

Il database publishing e tutto ciò che gli gira intorno, si sta muovendo proprio in questa direzione: uso della ricerca su database federati e aggregazione di quei contenuti che ruotano intorno a specifici contesti, a comunità di interesse e a tematiche di nicchia.

"Mentre i vantaggi economici ottenuti finora dal content publishing tradizionale stanno diminuendo sempre di più in favore dei moderni sistemi di pubblicazione (quelli in grado di offrire contenuti non strutturati, provenienti dalle più disparate fonti, ma che permettono ad ogni singolo utente di creare e di organizzare quei contenuti che prima poteva solo guardare), è vero anche che il database tradizionale sta per essere relegato a diventare uno di quei tanti contenitori, sfruttati dai servizi di gestione avanzata dei contenuti, per sviluppare soluzioni di produzione di contenuti su richiesta."

Qui sotto John Blossom, esperto di contenuti per i media e collaboratore di Master New Media, ti racconta l'intera storia:

 

database-is-now_id190196_size380.jpg








Oltre il Motore di Ricerca: The Database is Now

database-is-now-John_Blossom.gif

di John Blossom






Problemi Dei Database Moderni

Steven Arnold ha scritto, tempo fa, un articolo interessante sul suo blog, ipotizzando che l'inadeguatezza dei database tradizionali e dei motori di ricerca sia dovuta alla difficoltà di reperimento e di organizzazione dei nuovi contenuti in un Web dove molti database privati sono talmente grandi da potersi misurare in petabyte ed exabyte.

Steve suggerisce che le "nuove generazioni" di sistemi di gestione dei database possano iniziare a fare un salto storico nei confronti di queste problematiche, ma la domanda più importante che non ci siamo ancora posti è: visto che le persone utilizzano queste tecnologie di gestione dei contenuti per cercare di risolvere problematiche che diventano ogni giorno più complesse, perché usiamo ancora i database statici?

Forse uno dei motivi è che si sente ancora il forte bisogno di normalizzare i dati. Ma se la normalizzazione potesse essere realizzata "al volo", così come solo i servizi di gestione federata dei dati possono fare, si sentirebbe ancora la necessità di usare un database tradizionale quando esiste qualcosa che ti risolve i problemi meglio e più velocemente?





Normalizzazione Dei Dati o Aggregazione Di Dati Provenienti Da Diversi Database Federati?

Quando la normalizzazione dei dati viene usata per l'ottimizzazione di database di grosse dimensioni che devono essere usati esclusivamente per funzioni molto ripetitive, come la gestione delle buste paga o la pubblicazione di riviste o di directory, allora l'uso di una struttura fissa di database ha ancora un senso.

Il content publishing tradizionale e i vantaggi economici ottenuti finora stanno diminuendo sempre di più a favore dei moderni sistemi di pubblicazione (quelli che permettono di offrire contenuti non strutturati, provenienti dalle fonti più disparate, pronti a essere riorganizzati e non solamente fruiti dagli utenti). Il database tradizionale sta per trasformarsi in un contenitore di dati, che verranno poi sfruttati dai servizi di gestione avanzata dei contenuti per sviluppare soluzioni di produzione di contenuti on-demand.

I motori di ricerca lavorano su un tipo di database che, per poter fornire risposte standard, ha bisogno di avere degli input di ricerca altrettanto standard. Ma così, c'è anche il rischio che diventino come quelle applicazioni specializzate nell'offrire risposte solo a domande ben precise.

Se osservi una tipica pagina di risultati di uno dei qualsiasi motori di ricerca in voga oggi, puoi trovare dei contenuti federati e provenienti da una moltitudine di fonti diverse. Ovviamente sono collegati tra di loro da una tematica comune, ma in realtà risiedono ognuno in un database diverso e confluiscono tutti nella stessa pagina nel momento in cui viene effettuata quella particolare ricerca che richiede l'utilizzo di quei specifici dati.

In breve, quello che una volta chiamavamo database assume oggi un ruolo che va oltre il semplice concetto di sistema di archiviazione e di indicizzazione. La frase "the database is now" si riferisce proprio a un nuovo tipo di database, pensato come un insieme di risorse alle quali ricorrere quando devi risolvere un problema nel più breve tempo possibile.

La struttura di questo insieme è coerente grazie all'utilizzo degli standard XML, dei dizionari di dati e degli strumenti di normalizzazione del dei dati, e può essere anche conservata per essere riutilizzata quando ne abbiamo più bisogno, per esempio se dobbiamo fare una serie di analisi per la nostra società. Questa struttura inoltre può essere condivisa con altri, per tentare di sviluppare servizi di collaborazione o nuove forme di analisi e gestione dei contenuti.

Nei prossimi anni, le nostre priorità potrebbero cambiare, le fonti da cui accingiamo potrebbero cambiare struttura, diventare introvabili o essere rimpiazzate da nuove fonti.






Vantaggi Del Mercato

I vantaggi del mercato stanno crescendo grazie all'aumento del numero di istituzioni che vogliono cogliere tutti i vantaggi che si hanno nel gestire i contenuti in maniera più efficiente ed è proprio nel mondo dei mercati finanziari che questo concetto ha avuto un impatto notevole.

Nei mercati finanziari i profitti si stanno spostando dai tradizionali e sicuri scambi pubblici, dove le transazioni avvengono grazie a database e a formati altamente normalizzati, verso transazioni private basate su strumenti di calcolo molto complessi, ma in grado di valutare il rischio finanziario e il ritorno degli investimenti per ogni singola transazione.

Certo esiste una struttura fissa in queste transazioni e i dati vengono normalizzati, ma l'unicità della struttura dei contenuti, che si ottiene quando si fa una ricerca sul database, è molto più importante dello standard usato dai suoi componenti.

I motori di ricerca come Google hanno capito bene questo paradosso e lavorano duro per fornire interfacce con un valore aggiunto, che permettano di utilizzare il contenuto del motore di ricerca come se fosse un qualsiasi feed prodotto da un "mashup" amatoriale o da un'applicazione aziendale.

Google possiede probabilmente uno dei più grandi database del mondo, ma se un giorno comparissero dei motori di ricerca in grado di rendersi più utili in uno specifico campo di ricerca o se fossero in grado di fornire dei risultati complementari, non credo che ci importerebbe tanto se in quel momento stiamo usando Google o un altro motore di ricerca.






Paradigma Del Nuovo Database e Sue Implicazioni

Questo approccio federato al valore del contenuto diventa importante almeno quanto la qualità delle singole fonti.

Allora la frase "the database is now" assume il significato di "qualità è, quando qualità si fa", ma non è detto che il suo significato cambi da un momento all'altro.

Le implicazioni di questo concetto per chi pubblica contenuti online sono enormi.

La promessa della New Aggregation è stata a lungo usata come scusa per costruire dei database standardizzati, ma ora è sul punto di diventare veramente il concetto di base, sia per le aziende, sia per i media publisher.




a) Ricerca federata on-demand di contenuti aggregati: quello che rende uniche queste soluzioni, per una piccola audience di utilizzatori, sta nel fatto che stanno diventando ormai uno strumento per dare più valore all'aggregazione dei contenuti, a scapito della diffusione di soluzioni standardizzate.




b) Non commettiamo errori: useremo i motori di ricerca che vediamo oggi per molto tempo ancora, prima che vengano integrate soluzioni di ricerca federata dei contenuti. Ma col passare del tempo ci distaccheremo sempre di più dai database tradizionali per orientarci su soluzioni in grado di risolvere i nostri problemi.




c) Si tenterà di cambiare in maniera significativa la struttura di determinazione dei prezzi dei servizi di aggregazione dei contenuti e gli editori tradizionali saranno costretti ad adottare un metodo che preveda l'inserimento di contenuti online al volo, proprio grazie a questi servizi di aggregazione di contenuti provenienti da diverse fonti.




d) Le iscrizioni ai database saranno sostituite, a volte in maniera graduale e altre volte più rapidamente, da sottoscrizioni dirette dei contenuti e da servizi che permetteranno di aggregare in qualsiasi momento i contenuti, offrendo prestazioni più affidabili. Questo darà una bella spinta alla creazione di applicazioni utili sia per il privato, sia per il business.




Conclusioni

La casella email sta diventando sempre più un raccoglitore di feed e di messaggi provenienti dai social media: domani le caselle di posta saranno molto più ricche e complesse dei database che siamo abituati ad usare oggi.

I media sociali e i servizi di intrattenimento che propongono contenuti federati hanno già premuto l'acceleratore per far si che questi cambiamenti arrivino presto, speriamo che il 2008 sia l'anno in cui molte delle compagnie specializzate riconosceranno il vero valore dei database di nuova generazione.

The database is now: ecco l'occasione, per gli editori e per le imprese, di andare al di là delle soluzioni isolate per la gestione di contenuti.

 
 
 
 
 
Commenti    
blog comments powered by Disqus

 

 

 

 

8525
 



 

Risorse Consigliate

 

 

I Toolkit di Robin


 









 

 

 

 

  • RSS Feed

          Mail
    Nome:
    Email:
     



     
     

     

    Web Analytics