Verbesserung von ML-Algorithmen für unausgewogene Datensätze

About The Book

Die große Menge an online generierten Daten hat es Datenwissenschaftlern ermöglicht diese Informationen zu analysieren und daraus Schlussfolgerungen für verschiedene Bereiche abzuleiten. Echtzeitdaten sind jedoch oft anfällig für Ungleichgewichte die die Datenqualität beeinträchtigen können und eine große Herausforderung im Bereich des maschinellen Lernens darstellen. Auf Stichproben basierende Techniken und auf Algorithmen basierende Modelle sind zwei primäre Methoden die verwendet werden um Datenungleichgewichte anzugehen und auszugleichen. In dieser Arbeit werden drei verschiedene Techniken vorgestellt mit denen sich Ungleichgewichte in Echtzeitdaten auf unterschiedlichen Ebenen bewältigen lassen. Der erste Ansatz schlägt eine auf Stichproben basierende Technik vor die mit dem Bagging-Mechanismus integriert ist um Datenungleichgewichte zu behandeln. Das Modell identifiziert ein klassenbasiertes Datenungleichgewicht und führt für jede verfügbare Klasse ein Oversampling durch. Der Bagging-Mechanismus umfasst die Erstellung von Teilmengen der Trainingsdaten und zielt darauf ab die Ungleichgewichtsniveaus in den Trainingsdaten zu variieren um eine effektive Vorhersage zu gewährleisten. Trotzdem bleibt der Effekt des Ungleichgewichts im Vorhersagemechanismus bestehen und führt zu einer falschen Klassifizierung mehrerer Minderheitsklassen.
Piracy-free
Piracy-free
Assured Quality
Assured Quality
Secure Transactions
Secure Transactions
Delivery Options
Please enter pincode to check delivery time.
*COD & Shipping Charges may apply on certain items.
Review final details at checkout.
downArrow

Details


LOOKING TO PLACE A BULK ORDER?CLICK HERE