Che cos'è il data mining? Fondamenti e sue tecniche.

Le fondamenta della quarta rivoluzione industriale dipenderanno in gran parte da Dati(Data) e Connettività(Connectivity) . Analysis Services in grado di sviluppare o creare soluzioni di data mining giocheranno un ruolo chiave in questo senso. Potrebbe aiutare ad analizzare e prevedere i risultati del comportamento di acquisto dei clienti(customer purchasing behavior) per prendere di mira potenziali acquirenti. I dati(Data) diventeranno una nuova risorsa naturale e il processo di estrazione delle informazioni rilevanti da questi dati non ordinati assumerà un'importanza immensa. Pertanto, una corretta comprensione del termine (term –) Data Mining , i suoi processi e l'applicazione potrebbe aiutarci a sviluppare un approccio olistico a questa parola d'ordine.

Nozioni di base sul data mining(Data Mining Basics) e sue tecniche

estrazione dei dati

Il data mining, noto anche come Knowledge Discovery in Data ( KDD ), consiste nella ricerca di grandi archivi di dati per scoprire modelli e tendenze che vanno oltre la semplice analisi. Questa, tuttavia, non è una soluzione in un'unica fase, ma un processo in più fasi e viene completata in varie fasi. Questi includono:

1] Raccolta e Preparazione dei dati

Si inizia con la raccolta dei dati e la sua corretta organizzazione. Questo aiuta a migliorare significativamente le possibilità di trovare le informazioni che possono essere scoperte attraverso il data mining

2] Costruzione e valutazione del modello

Il secondo passaggio nel processo di data mining(mining process) è l'applicazione di varie tecniche di modellazione. Questi vengono utilizzati per calibrare i parametri su valori ottimali. Le tecniche impiegate dipendono in gran parte dalle capacità analitiche richieste per affrontare una gamma di esigenze organizzative e per arrivare a una decisione.

Esaminiamo in breve alcune tecniche di data mining. È stato riscontrato che la maggior parte delle organizzazioni combina due o più tecniche di data mining per formare un processo appropriato che soddisfi i requisiti aziendali.

Leggi(Read) : Che cosa sono i Big Data?

Tecniche di data mining

  1. Associazione:  l' (Association – )associazione(Association) è una delle tecniche di data mining ampiamente conosciute. In base a questo, viene decifrato un modello basato su una relazione tra gli articoli nella stessa transazione. Quindi(Hence) , è anche conosciuta come la tecnica della relazione(relation technique) . I grandi rivenditori di marca si affidano a questa tecnica per ricercare le abitudini/preferenze di acquisto dei clienti. Ad esempio, quando tengono traccia delle abitudini di acquisto delle persone, i rivenditori potrebbero identificare che un cliente acquista sempre la crema quando acquista i cioccolatini e quindi suggerire che la prossima volta che acquistano dei cioccolatini potrebbero voler acquistare anche la crema.
  2. Classificazione(Classification) – Questa tecnica di data mining(data mining technique) differisce da quella sopra in quanto si basa sull'apprendimento automatico(machine learning) e utilizza tecniche matematiche come la programmazione lineare(Linear programming) , gli alberi decisionali , (Decision)la rete neurale(Neural network) . Nella classificazione, le aziende cercano di creare software in grado di imparare a classificare gli elementi di dati in gruppi. Ad esempio, un'azienda può definire una classificazione nell'applicazione che "dato tutti i record dei dipendenti che si sono offerti di dimettersi dall'azienda, prevede il numero di persone che potrebbero dimettersi dall'azienda in futuro". In tale scenario, l'azienda può classificare i record dei dipendenti in due gruppi, ovvero "lasciare" e "rimanere". Può quindi utilizzare i suoi datisoftware di mining(mining software) per classificare i dipendenti in gruppi separati creati in precedenza.
  3. Clustering : oggetti diversi(Different) che presentano caratteristiche simili vengono raggruppati in un unico cluster tramite l'automazione. Molti di questi cluster vengono creati quando classi e oggetti (con caratteristiche simili) vengono inseriti di conseguenza. Per capirlo meglio, consideriamo un esempio di gestione dei libri(book management) in biblioteca. In una biblioteca, la vasta collezione di libri è completamente catalogata. Gli articoli dello stesso tipo sono elencati insieme. Questo ci rende più facile trovare un libro di nostro interesse. Allo stesso modo, usando la tecnica del clustering(clustering technique) , possiamo tenere i libri che hanno alcuni tipi di somiglianze in un cluster e assegnargli un nome appropriato. Quindi, se un lettore sta cercando di prendere un libro rilevante(book relevant)nel suo interesse, deve solo andare su quello scaffale invece di cercare nell'intera biblioteca. Pertanto, la tecnica del clustering(clustering technique) definisce le classi e inserisce gli oggetti in ciascuna classe, mentre nelle tecniche di classificazione gli oggetti vengono assegnati in classi predefinite.
  4. Predizione(Prediction) : la previsione è una tecnica di data mining(data mining technique) che viene spesso utilizzata in combinazione con altre tecniche di data mining(data mining technique) . Implica l'analisi di tendenze, classificazione, corrispondenza di modelli(pattern matching) e relazioni. Analizzando eventi o istanze passati in una sequenza corretta, si(sequence one) può prevedere in sicurezza un evento futuro. Ad esempio, la tecnica dell'analisi di previsione(prediction analysis technique) può essere utilizzata nella vendita per prevedere il profitto futuro se la vendita viene scelta come variabile indipendente e il profitto(variable and profit) come variabile dipendente dalla vendita. Quindi, sulla base dei dati storici di vendita e profitto(sale and profit data) , è possibile tracciare una curva di regressione(regression curve) adattata utilizzata perprevisione del profitto(profit prediction) .
  5. Alberi decisionali(Decision trees) : all'interno dell'albero decisionale(decision tree) , iniziamo con una semplice domanda che ha più risposte. Ogni risposta porta a un'ulteriore domanda per aiutare a classificare o identificare i dati in modo che possano essere classificati o in modo da poter fare una previsione in base a ciascuna risposta. Ad esempio, utilizziamo il seguente albero decisionale(decision tree) per determinare se giocare o meno a cricket ODI : Data Mining Decision Tree : Partendo dal nodo principale(root node) , se le previsioni(weather forecast) del tempo prevedono pioggia, dovremmo evitare la partita per la giornata. In alternativa, se le previsioni(weather forecast) del tempo sono chiare, dovremmo giocare la partita.

Il data mining(Data Mining) è al centro degli sforzi di analisi in una varietà di settori e discipline come comunicazioni, assicurazioni(Insurance) , istruzione(Education) , produzione(Manufacturing) , banche e vendita al dettaglio(Banking and Retail) e altro ancora. Pertanto, avere informazioni corrette al riguardo è essenziale prima di applicare le diverse tecniche.



About the author

Sono uno sviluppatore di software freeware e sostenitore di Windows Vista/7. Ho scritto diverse centinaia di articoli su vari argomenti relativi al sistema operativo, inclusi suggerimenti e trucchi, guide di riparazione e best practice. Offro anche servizi di consulenza in ufficio attraverso la mia azienda, Help Desk Services. Ho una profonda conoscenza del funzionamento di Office 365, delle sue funzionalità e di come utilizzarle nel modo più efficace.



Related posts