Clustering

Autor: Eugene Taylor
Erstelldatum: 10 August 2021
Aktualisierungsdatum: 1 Juli 2024
Anonim
StatQuest: K-means clustering
Video: StatQuest: K-means clustering

Inhalt

Definition - Was bedeutet Clustering?

Clustering im Kontext von Datenbanken bezieht sich auf die Fähigkeit mehrerer Server oder Instanzen, eine Verbindung zu einer einzelnen Datenbank herzustellen. Eine Instanz ist die Sammlung von Speicher und Prozessen, die mit einer Datenbank interagiert. Hierbei handelt es sich um die physischen Dateien, in denen Daten tatsächlich gespeichert werden.


Das Clustering bietet insbesondere in Umgebungen mit umfangreichen Datenbanken zwei wesentliche Vorteile:

  • Fehlertoleranz: Da es für Benutzer mehrere Server oder Instanzen gibt, zu denen eine Verbindung hergestellt werden kann, bietet das Clustering eine Alternative für den Fall, dass ein einzelner Server ausfällt.
  • Lastausgleich: Die Clusterfunktion wird normalerweise so eingerichtet, dass Benutzer automatisch dem Server mit der geringsten Last zugewiesen werden.

Eine Einführung in Microsoft Azure und die Microsoft Cloud | In diesem Handbuch erfahren Sie, worum es beim Cloud-Computing geht und wie Microsoft Azure Sie bei der Migration und Ausführung Ihres Unternehmens aus der Cloud unterstützen kann.

Techopedia erklärt Clustering

Das Clustering nimmt unterschiedliche Formen an, je nachdem, wie die Daten gespeichert und Ressourcen zugewiesen werden. Der erste Typ ist als Shared-Nothing-Architektur bekannt. In diesem Cluster-Modus ist jeder Knoten / Server vollständig unabhängig, sodass es keinen einzigen Streitpunkt gibt. Ein Beispiel hierfür wäre, wenn ein Unternehmen mehrere Rechenzentren für eine einzelne Website hat. Bei vielen Servern auf der ganzen Welt ist kein einzelner Server ein „Master“. Shared-nothing wird auch als „Datenbank-Sharding“ bezeichnet.


Vergleichen Sie dies mit der Shared-Disk-Architektur, bei der alle Daten zentral gespeichert werden und über Instanzen auf verschiedenen Servern oder Knoten zugegriffen wird.

Die Unterscheidung zwischen den beiden Typen hat sich in letzter Zeit mit der Einführung von Grid-Computing oder verteiltem Caching verwischt. In dieser Konfiguration werden die Daten immer noch zentral verwaltet, aber von einem leistungsstarken „virtuellen Server“ gesteuert, der aus mehreren Servern besteht, die als einer zusammenarbeiten.

Diese Definition wurde im con von Databases geschrieben