A questo punto dobbiamo iniziare a produrre metadati; qualche cosa che potremmochiamare un Semantic Interpreter riporterà gli elementi significativiriscontrati su strutture ontologiche possedute a priori. Si traduce il lavorosvolto dai componenti precedenti in relazioni espresse da ontologie che descrivonoil dominio di nostro interesse.
Questa beve descrizione fa capire molto bene come il tipo di vocabolari edontologie utilizzate dalle applicazioni di estrazione dei metadati influiscanoenormemente sui loro risultati. Il tool cercherà quei termini che avràin una sua lista, riconoscerà le strutture sintattiche che gli sarannostate fatte conoscere, stabilirà vicinanze semantiche in base a vocabolarie tesauri specifici.
Un buon tool funziona bene su documenti per i quali è stato appositamentestudiato, più gli argomenti dei documenti possono variare e piùil nostro tool dovrà ampliarsi e complicarsi. Se si intende utilizzareseriamente un estrattore automatico è indispensabile rendersi conto diquesta cosa e rendersi quindi conto che il lavoro di preparazione dell’applicativonon può essere trascurato. In particolare nel caso ci si trovi a doveranalizzare un dominio in rapida evoluzione, un tool di estrazione automaticarischia di diventare un ostacolo più che una risorsa.
Detto questo, detto quindi in pratica di fidarvi poco delle soluzioni facilie veloci, ecco a voi un elenco di siti dove trovare tool per l’estrazioneautomatica:
Alcuni di questi tool (o forse meglio alcune componenti) possono essere adoperateanche per un altro genere di operazione. Un testo può essere suddivisoin modo da riportarne le parti su una struttura che si possiede. Ma da un corpodi testi si possono anche estrarne tutte le relazioni (Soggetto predicato Oggetto),calcolarne le frequenze, e utilizzare le relazioni più frequenti percostruire una ontologia. E’ esattamente il processo inverso di quellodescritto precedentemente. La logica rimane la stessa di prima.
L’ontologia dedotta da dei dati può essere utile in certi casipoco utile in altri. La cosa di pende da un fattore: siamo noi che stabiliamoun processo al quale si devono adeguare le applicazioni. Oppure non conosciamoche tipo di processo si verifichi effettivamente e abbiamo bisogno di dedurlo.
Guida PodcastingUn percorso in 16 lezioni, per entrare nella filosofia del podcast... |
Guida Smil 2.0Un percorso pratico alla scoperta di SMIL: il linguaggio (XML) per... |
Guida Web serviceCosa sono, a cosa servono e come si creano servizi Web, i sistemi... |
Ogni mese, direttamente nella tua e-mail: articoli, guide, FAQ e approfondimenti sui linguaggi della famiglia XML.
Iscriviti alla newsletter