Data mining
Che cos'è il data mining:
Il data mining è un termine inglese legato all'informatica la cui traduzione è data mining . Consiste in una funzionalità che aggrega e organizza i dati, trovando in essi modelli pertinenti, associazioni, cambiamenti e anomalie .
Il termine data mining è emerso per la prima volta nel 1990 nelle comunità di database. Il data mining è il passo di analisi del processo noto come KDD ( Knowledge Discovery in Databases ), la cui traduzione letterale è "Knowledge Discovery in Databases".
Il data mining può essere suddiviso in pochi passaggi di base: esplorazione, costruzione del modello, definizione del modello, convalida e verifica.
Il data mining è una pratica relativamente recente nel mondo dell'informatica e utilizza il recupero delle informazioni, l'intelligenza artificiale, il riconoscimento dei pattern e le tecniche statistiche per cercare correlazioni tra diversi dati che consentono di acquisire conoscenze utili per un'azienda o un individuo. Per un'azienda, il data mining può essere uno strumento importante che migliora l'innovazione e la redditività.
L'uso del data mining è abbastanza comune nei grandi database e il risultato finale del loro utilizzo può essere visualizzato attraverso regole, ipotesi, alberi decisionali, dendrogrammi, ecc.
Il data mining ben eseguito dovrebbe svolgere compiti quali: rilevamento di anomalie, apprendimento delle regole di associazione (modellazione delle dipendenze), clustering, classificazione, regressione e riepilogo. Il processo di data mining si verifica in genere utilizzando i dati contenuti nel data warehouse .
Esistono diverse società e software dedicati al data mining, in quanto l'identificazione dei modelli nei database è sempre più importante. Tuttavia, l'identificazione di standard rilevanti non è unica nel mondo dei computer. Il cervello umano usa un processo simile per identificare i modelli e acquisire conoscenze.
Negli ultimi anni, il data mining è stato ampiamente utilizzato nelle aree della scienza e dell'ingegneria come la bioinformatica, la genetica, la medicina, l'istruzione e l'ingegneria elettrica.
Il concetto di data mining è spesso associato all'estrazione di informazioni sul comportamento delle persone. Per questo motivo, in alcune situazioni, il data mining solleva problemi legali e problemi legati alla privacy e all'etica. Nonostante questo, molte persone affermano che il data mining è eticamente neutro in quanto non ha implicazioni etiche.
Esempi di data mining reali
Il data mining viene spesso utilizzato da aziende e organizzazioni per acquisire conoscenze sugli utenti / dipendenti / clienti. Ad esempio, nel settore pubblico è possibile effettuare un controllo incrociato tra lo stato civile di un dipendente e lo stipendio che guadagna per vedere se questo ha un'influenza sulla sua vita coniugale.
Aziende come le catene di supermercati possono utilizzare questi dati incrociati per determinare i prodotti acquistati insieme. Se un cliente che compra il prodotto X acquista anche il prodotto Y, potrebbe essere una buona idea posizionare i due prodotti nelle vicinanze per facilitare l'acquisto da parte del cliente.