EH - Esposizione interattiva di xHTML etc.   Indici:   Pagine   Panoramica   Termini   Problemi   Esempi

Metadati, Dublin Core ed RDF

Nozione di metadato      Dublin Core      RDF

La nozione di metadato

Con il termine metadato si intende un dato che, nell'ambito di un sistema di informazione, consente ai suoi utenti di pervenire ad informazioni che possono contribuire a chiarire le questioni che questi si pongono.

L'esigenza di metadati si è manifestata in tutti i sistemi informativi, anche nelle biblioteche del passato.

Essa si pone con particolare evidenza per il reperimento delle informazioni disponibili nell'enorme complesso di documenti che costituiscono l'attuale Rete globale di computers. In effetti questo complesso di documenti si è sviluppato a ritmi sostenutissimi nel giro di pochi anni, spesso nell'ambito di iniziative di respiro limitato o addirittura personali e in non pochi casi sulla base di attività un po' improvvisate e non seguite dai necessari ripensamenti e riaggiustamenti.

In conseguenza di una ricerca di informazioni in rete, in particolare attraverso uno dei molti poderosi motori di ricerca disponibili (Google, Yahoo, Altavista, Infoseek, Lycos , Deja News,...), in genere si ottiene una quantità molto elevata di indicazioni, gran parte delle quali estranea alle esigenze dell'utente. Questa parte di informazioni non volute, spesso è preponderante e talora, per la sua mole, impedisce di raggiungere in tempi brevi le informazioni utili.

Inoltre molti documenti che potrebbero chiarire la questione che si pone l'utente, spesso non risultano reperibili, in quanto il motore di ricerca o la persona che naviga tra le pagine le prende in considerazione attraverso titoli ed altri elementi lessicali che sono stati scelti dagli autori secondo criteri che non tengono conto delle esigenze dei motori di ricerca e non risultano in grado di richiamare contenuti che possono interessare la ricerca.

Risulta quindi importante che gli autori ed i curatori dei documenti per il Web, ancor più dei loro omologhi del passato, curino di inserire nei documenti stessi dei metadati efficaci. In effetti il problema dei metadati da qualche anno è ben presente a tutti gli organismi interessati ad una corretta evoluzione di Internet.

Attualmente l'iniziativa più efficace e seguita è il cosidetto Dublin Core, schema per metadati sviluppato da alcuni anni nell'ambiente dei bibliotecari che ha avuto un notevole successo. Un altro sistema intereressante sviluppato presso il W3C è stato PICS, Platform for Internet Content Selection, meccanismo per comunicare valutazioni delle pagine Web. Per l'immediato futuro è prevedibile che un ruolo determinante sarà svolto da RDF, Resource Description Franmework, linguaggio che il consorzio W3C intende porre alla base di una architettura robusta e flessibile per il processo di metadati.

Conviene anche ricordare che progetti di ampio respiro come EULER, progetto europeo per il coordinamento della utilizzazione di risorse elettroniche per la matematica, pone al centro delle sue iniziative la promozione dell'utilizzo dei metadati per i documenti ed i sistemi informativi per la matematica.

Dublin Core

Dublin Core è un insieme di metadati originariamente concepito per la descrizione da parte degli autori delle risorse del Web. Nato intorno al 1955, esso ha successivamente attratto l'attenzione di numerose comunità di depositari di risorse: musei, biblioteche, agenzie governative ed organizzazioni commerciali. Queste comunità in genere sono pesantemente impegnate anche nella descrizione dei documenti che conservano.

Dublin Core si è evoluto attraverso una serie di incontri focalizzati su temi specifici e la pubblicazione di documenti nei quali ci sono raccolti i risultati di vaste esperienze e i criteri operativi che raccolgono ampio consenso.

Le principali caratteristiche di Dublin Core sono le seguenti:

Semplicità. I suoi metadati si vuole siano utilizzabili sia dai catalogatori di professione che dai non specialisti: la maggior parte degli elementi che lo compongono hanno un significato ampiamente comprensibile, paragonabile a quello di una scheda di catalogo di una biblioteca.

Interoperatività semantica. La promozione di un insieme di descrittori con una interpretazione comune aiuta ad unificare gli altri standard per il contenuto dei dati ed aumenta l'interoperatività semantica tra le diverse discipline.

Consenso internazionale. Il riconoscimento della visibilità internazionale delle attività di scoperta delle risorse sul Web è determinante per lo sviluppo di una efficace infrastruttura di scoperta. Il Dublin Core beneficia dell'attiva partecipazione di circa 20 Paesi di Nord America, Europa, Australia ed Asia.

Estendibilità. Il Dublin Core costituisce una alternativa economica ai modelli di descrizione più elaborati come il full MARC per la catalogazione nelle biblioteche. Inoltre esso include elementi di flessibilità ed estendibilità che gli consentirebbero di codificare le strutture semantiche più elaborate degli standard di descrizione più ricchi.

Modularità dei metadati sul Web. La varietà di esigenze relative ai metadati per il Web richiede una infrastruttura che sopporti la coesistenza di collezioni di metadati complementari e manutenuti indipendentemente. L'architettura per i metadati RDF che il consorzio W3C ha cominciato ad implementare rispetta la suddetta richiesta, anche in relazione alle esigenze dei produttori di sistemi e degli information providers. In questa iniziativa sono coinvolti attivamente rappresentanti di Dublin Core.

Utilizzo del Simple Dublin Core

In questo paragrafo presentiamo rapidamente, senza entrare nei dettagli della User Guide ufficiale, le modalità d'uso di Dublin Core.

I 15 elementi del Core sono divisi in 3 gruppi.

Elementi per il contenuto: Coverage, Description, Type, Relation, Source, Subject, Title.

Elementi per la proprietà intellettuale: Contributor, Creator, Publisher, Rights.

Elementi di instanziazione: Date, Format, Identifier, Language.


Title: nome dato alla risorsa dal creator o dal publisher

Già previsto da HTML.

Creator o Author: Vug

Subject e keyword: Vug

Description : Vug

Publisher: Vug

Altro Contributor: Vug

Date: Vug

Resource Type: Vug

Type="sound" Type="text"

Format: Vug

Format="image/gif 4kB"

Identifier: Vug

Identifier="038424728" [ISBM]

Source: Vug

Language: Vug

Language=fr Language:=en

Relation: riguarda una seconda risorsa e la sua relazione con la attuale. Le relazioni previste sono le seguenti:

IsPartOf, HasPart, IsVersionOf, HasVersion, IsFormatOf, HasFormat, References, IsReferencesBy, IsBasedOn, IsBasedFor, Requires, IsRequiredBy.

Coverage:Vug

Rights management:

La proposta di RDF

L'iniziativa di RDF, Resource Description Framework, si pone davanti al problema della ricerca delle risorse sul Web in tutti i suoi aspetti. Essa si propone di costituire un meccanismo che consenta una descrizione più precisa delle risorse in modo da rendere il WWW, non più solo machine readable, ma machine understandable; in tal modo dovrebbe essere possibile far scandagliare le risorse sulla rete da agenti automatici che siano in grado di effettuare azioni incisive sulle risorse stesse.

RDF prende spunto da PICS, meccanismo sviluppato nell'ambito di W3C per la comunicazione di caratteristiche valutative delle pagine Web ed utilizzato ad es., per comunicare che una pagina contiene nudità o scene di violenza che potrebbero essere offensive per i giovani, oppure un articolo scientifico che ha superato qualche severa recensione. PICS peraltro costituisce un quadro per metadati limitato, nel quale solo certi elementi riguardanti pagine Web possono essere espressi con precisione,  soprattutto quando tutti gli elementi esprimibili sono fissati in anticipo. 

RDF vuole invece costituire un fondamento per la elaborazione di metadati, provvedendo interoperabilità a programmi applicativi (in particolare ad agenti) che si scambiano sul Web informazioni comprensibili dalle macchine e fornendo facilitazioni per la elaborazione automatica delle risorse in rete. I metadati di RDF si vuole che possano essere utilizzati in una varietà di aree applicative: scoperta delle risorse, catalogazione con descrizione dei contenuti e delle relazioni disponibili in pagine Web, siti e digital libraries; agenti software intelligenti atti a facilitare la condivisione e lo scambio delle conoscenze; valutazione dei contenuti; descrizione di collezioni di pagine atte a costituire una documentazione organica; descrizione dei diritti di proprietà intellettuale delle pagine Web. RDF, insieme ai meccanismi di firma digitale, sarà cruciale per consolidare un ``Web di fiducia''  che sia valido supporto al commercio elettronico, alle collaborazioni e ad altre applicazioni impegnative.

RDF utilizza XML per la definizione della propria sintassi e si rivolge a tutte le risorse che possono essere identificate da un URI, Uniform Resource Identifier. Esso vuole rendere disponibile un meccanismo di descrizione delle risorse indipendente dai particolari domini applicativi ma in grado di descrivere le informazioni concernenti ciascuno di questi domini.

RDF, in astratto, permette di definire grafi orientati etichettati i cui nodi forniscono risorse Web (pagine, siti, servers e qualsiasi oggetto identificabile con un URI, anche istanze di metadati in quanto essi stessi dati). Ai nodi sono associate le coppie: attributo-valore; gli attributi esprimono proprietà dotate di nomi definiti dei nodi; i valori possono essere atomici (stringhe, numeri e simili) o richiamare altre risorse o istanze di metadati, consentendo in tal modo la costituzione di un grafo. Per consentire la registrazione e la comunicazione di questi grafi si avvale di una sintassi di serializzazione definita mediante XML.

RDF non contiene vocabolari predefiniti per la scrittura dei metadati, ma si aspetta che si impongano vocabolari standard come quanto utilizzato da PICS o come quel vocabolario autorevole per le digital libraries che è Dublin Core. Ogni vocabolario proposto su una base di sufficiente autorevolezza può essere utilizzato, purché raggiungibile attraverso un URI che compaia in ogni istanza di metadati che vi fa riferimento. Non è quindi prevista una determinata autorità centrale per i vocabolari, anche se può essere auspicabile. L'emergere di tali autorità dipenderà dall'evolversi della interoperabilità sul Web.


Indice pagine - inizio pagina