Data Cleaning
Data Cleaning (Datenbereinigung) bezeichnet den Prozess, fehlerhafte, inkonsistente, doppelte oder unvollständige Daten in einem Datensatz zu identifizieren und zu korrigieren. Ziel ist es, die Datenqualität zu verbessern, bevor Daten für Analysen oder Entscheidungsprozesse genutzt werden. Typische Schritte sind das Entfernen von Duplikaten, das Auffüllen fehlender Werte und die Standardisierung von Formaten. Data Cleaning ist ein wesentlicher Schritt in jedem Data-Science- und Business-Intelligence-Projekt.