Data mining

Che cos'è il data mining:

Il data mining è un termine inglese legato all'informatica la cui traduzione è data mining . Consiste in una funzionalità che aggrega e organizza i dati, trovando in essi modelli pertinenti, associazioni, cambiamenti e anomalie .

Il termine data mining è emerso per la prima volta nel 1990 nelle comunità di database. Il data mining è il passo di analisi del processo noto come KDD ( Knowledge Discovery in Databases ), la cui traduzione letterale è "Knowledge Discovery in Databases".

Il data mining può essere suddiviso in pochi passaggi di base: esplorazione, costruzione del modello, definizione del modello, convalida e verifica.

Il data mining è una pratica relativamente recente nel mondo dell'informatica e utilizza il recupero delle informazioni, l'intelligenza artificiale, il riconoscimento dei pattern e le tecniche statistiche per cercare correlazioni tra diversi dati che consentono di acquisire conoscenze utili per un'azienda o un individuo. Per un'azienda, il data mining può essere uno strumento importante che migliora l'innovazione e la redditività.

L'uso del data mining è abbastanza comune nei grandi database e il risultato finale del loro utilizzo può essere visualizzato attraverso regole, ipotesi, alberi decisionali, dendrogrammi, ecc.

Il data mining ben eseguito dovrebbe svolgere compiti quali: rilevamento di anomalie, apprendimento delle regole di associazione (modellazione delle dipendenze), clustering, classificazione, regressione e riepilogo. Il processo di data mining si verifica in genere utilizzando i dati contenuti nel data warehouse .

Esistono diverse società e software dedicati al data mining, in quanto l'identificazione dei modelli nei database è sempre più importante. Tuttavia, l'identificazione di standard rilevanti non è unica nel mondo dei computer. Il cervello umano usa un processo simile per identificare i modelli e acquisire conoscenze.

Negli ultimi anni, il data mining è stato ampiamente utilizzato nelle aree della scienza e dell'ingegneria come la bioinformatica, la genetica, la medicina, l'istruzione e l'ingegneria elettrica.

Il concetto di data mining è spesso associato all'estrazione di informazioni sul comportamento delle persone. Per questo motivo, in alcune situazioni, il data mining solleva problemi legali e problemi legati alla privacy e all'etica. Nonostante questo, molte persone affermano che il data mining è eticamente neutro in quanto non ha implicazioni etiche.

Esempi di data mining reali

Il data mining viene spesso utilizzato da aziende e organizzazioni per acquisire conoscenze sugli utenti / dipendenti / clienti. Ad esempio, nel settore pubblico è possibile effettuare un controllo incrociato tra lo stato civile di un dipendente e lo stipendio che guadagna per vedere se questo ha un'influenza sulla sua vita coniugale.

Aziende come le catene di supermercati possono utilizzare questi dati incrociati per determinare i prodotti acquistati insieme. Se un cliente che compra il prodotto X acquista anche il prodotto Y, potrebbe essere una buona idea posizionare i due prodotti nelle vicinanze per facilitare l'acquisto da parte del cliente.