|
Analisi della classificazione per dati sbilanciati
|
(Buch) |
Dieser Artikel gilt, aufgrund seiner Grösse, beim Versand als 2 Artikel!
Lieferstatus: |
i.d.R. innert 7-14 Tagen versandfertig |
Veröffentlichung: |
August 2023
|
Genre: |
Wirtschaft / Recht |
ISBN: |
9786206345459 |
EAN-Code:
|
9786206345459 |
Verlag: |
Edizioni Sapienza |
Einband: |
Kartoniert |
Sprache: |
Italienisch
|
Dimensionen: |
H 220 mm / B 150 mm / D 5 mm |
Gewicht: |
119 gr |
Seiten: |
68 |
Zus. Info: |
Paperback |
Bewertung: |
Titel bewerten / Meinung schreiben
|
Inhalt: |
Un'enorme quantità di dati viene raccolta e archiviata nei database di tutto il mondo. Questi dati si accumulano e continuano ad aumentare ogni anno. Estrarre le informazioni nascoste in questi database e classificare le informazioni estratte sono i compiti più importanti del data mining. Se questi insiemi di dati sono sbilanciati, diventa difficile gestirli. La previsione del futuro è uno dei compiti fondamentali del data mining. Lavorare con insiemi di dati sbilanciati per prevedere i possibili risultati è un compito molto noioso. Un set di dati è sbilanciato quando non viene classificato correttamente, quando una classe contiene più istanze di altre. Spesso vengono rappresentate come una classe positiva (minoranza) e una negativa (maggioranza). La classe che ha un numero minore di campioni è chiamata classe minoritaria, mentre quella che ne ha di più è chiamata classe maggioritaria. I dataset sbilanciati causano molti problemi seri nel data mining, per lo più l'algoritmo di classificazione standard considera il dataset come bilanciato, che a sua volta è parziale verso la classe maggioritaria. Per applicazioni come la diagnosi medica, ciò provoca effetti molto gravi. Il bilanciamento del set di dati è quindi fondamentale per molte applicazioni in tempo reale. |
|