Datenbereinigung

Autor: Louise Ward
Erstelldatum: 11 Februar 2021
Aktualisierungsdatum: 1 Juli 2024
Anonim
Datenbereinigung
Video: Datenbereinigung

Inhalt

Definition - Was bedeutet Datenbereinigung?

Datenbereinigung bezieht sich auf das Verfahren zum Ändern oder Entfernen unvollständiger, falscher, ungenau formatierter oder wiederholter Daten in einer Datenbank. Das Hauptziel der Datenbereinigung besteht darin, die Daten genauer und konsistenter zu machen.


Datenbereinigung ist eine wichtige Strategie, um sicherzustellen, dass Datenbanken korrekt bleiben. Dies ist besonders wichtig in datenintensiven Branchen wie Telekommunikation, Versicherung, Bankwesen und Einzelhandel. Data Scrubbing wertet Daten mithilfe von Nachschlagetabellen, Regeln und Algorithmen systematisch auf Fehler aus.

Datenbereinigung wird auch als Datenbereinigung bezeichnet.

Eine Einführung in Microsoft Azure und die Microsoft Cloud | In diesem Handbuch erfahren Sie, worum es beim Cloud-Computing geht und wie Microsoft Azure Sie bei der Migration und Ausführung Ihres Unternehmens aus der Cloud unterstützen kann.

Techopedia erklärt Data Scrubbing

Datenbankfehler sind häufig und können folgende Ursachen haben:
  • Menschliche Fehler bei der Dateneingabe
  • Datenbank wird zusammengeführt
  • Fehlen von branchenweiten oder unternehmensspezifischen Datenstandards
  • Veraltete Systeme, die veraltete Daten enthalten
In der Vergangenheit wurde die Datenbereinigung manuell durchgeführt. Dies erhöhte nicht nur den Zeitaufwand für den Abschluss des Prozesses, sondern verteuerte auch den Prozess erheblich und war fehleranfällig. Dies führte zur Schaffung effektiver Datenbereinigungswerkzeuge, die Daten systematisch auf Fehler auswerten, die in einem manuellen Reinigungsprozess nicht identifiziert werden konnten.

Im Allgemeinen besteht ein Datenbankbereinigungstool aus Lösungen, mit denen sich bestimmte Fehler beheben lassen, z. B. doppelte Datensätze suchen oder fehlende Postleitzahlen ersetzen lassen. Das Zusammenführen fehlerhafter oder beschädigter Daten ist das komplizierteste Problem. Es wird sogar als "Dirty Data" -Problem bezeichnet, da es Unternehmen jedes Jahr Millionen von Dollar kostet. Dieses Phänomen nimmt mit der Einführung komplexerer Geschäftsumgebungen mit mehr Systemen und Daten zu. Datenbereinigung hilft Unternehmen dabei, solche Probleme zu lösen, indem leistungsstarke Datenbereinigungstools zum Erkennen und Beseitigen von Datenfehlern bereitgestellt werden.