Estrazione
La parola extractio, dal latino medievale, deriva nella nostra lingua in estrazione. Questo termine allude all'atto e alla conseguenza di estrarre: togliere, estirpare, eliminare.
Per esempio: "Il dentista mi ha detto che, due ore prima dell'estrazione del dente, dovrei prendere un antibiotico per evitare infezioni", "L'estrazione delle vongole è vietata perché è un animale in pericolo", "Gli ambientalisti sostengono che l'estrazione dell'oro distruggerà la montagna e causerà danni irreversibili all'ecosistema".
Possiamo trovare diversi tipi di estrazione in molti settori. Quando una persona va a un bancomat (ATM), può prelevare denaro dal suo conto bancario, prendendo le banconote che la macchina gli porge.
Il prelievo del sangue, invece, è una procedura che avviene nel campo dell'infermieristica. Prelevando il sangue da un paziente, il campione può essere analizzato e si possono ottenere preziose informazioni sulla salute dell'individuo.
Nel contesto dell'odontoiatria, l'estrazione è un intervento chirurgico che comporta la rimozione di un dente o parte di esso. In questo contesto, il dentista utilizza determinati strumenti e applica le sue conoscenze e competenze per raggiungere l'obiettivo.
Nel contesto dell'informatica, l'estrazione di informazioni è un'operazione che viene eseguita per recuperare il contenuto da un database. Il processo può essere fatto automaticamente se l'informazione è strutturata.
L'estrazione dell'informazione strutturata o semi-strutturata fa parte del compito di retrieval, e viene effettuata utilizzando documenti che possono essere letti dal computer. Per esempio, questo processo avviene quando alcuni documenti scritti a mano vengono scannerizzati e i loro dati interpretati in un database digitale; cioè, ci deve essere un'applicazione che riconosce il testo e lo converte in informazioni che possono essere memorizzate e modificate, piuttosto che lasciarlo semplicemente in un formato grafico.
La forma dei testi varia a seconda del progetto e delle intenzioni di chi esegue l'estrazione delle informazioni: in alcuni casi si tratta di moduli strutturati, che di solito sono stati creati dall'azienda stessa che sta cercando di estrarre le informazioni in essi dopo essere stati compilati da terzi; ma possono anche essere testi non strutturati, come articoli di giornale o libri di fantasia.
Qui entra in gioco il concetto di linguaggio naturale, che si riferisce a una varietà linguistica specifica degli esseri umani che è creata per lo scopo di comunicare e che si basa su una sintassi specifica e rispetta i principi di ottimizzazione ed economia del linguaggio. Le fonti di testo che possono essere utilizzate per l'estrazione di informazioni devono contenere messaggi scritti in un tale linguaggio.-- ad -->
I compiti più comuni di estrazione dell'informazione includono i seguenti:
* riconoscimento del nome: che si tratti del nome di una persona, di un'azienda o di un luogo, o anche di valori monetari o di altre espressioni appartenenti a categorie predefinite, l'estrazione dell'informazione è usata per cercarli e classificarli;
* risoluzione di co-riferimenti: si tratta della rilevazione della correlazione tra entità in un dato documento, come quella tra il nome completo di un'azienda e il suo acronimo;
* estrazione terminologica: in questo caso, il processo consiste nell'analizzare un testo per identificare gli argomenti semantici che sono legati ai verbi, al fine di stabilire una classificazione secondo i loro ruoli. Per esempio, nella frase "Marisa ha comprato un PDA da Valeria", "Marisa" è riconosciuta come l'agente compratore, "PDA" è l'oggetto, "comprato" è il verbo e "Valeria", l'agente venditore.
In campo minerario, infine, l'estrazione è l'attività di ottenere minerali da un deposito per poi sfruttarli commercialmente: estrazione del rame, estrazione del litio, ecc.