Open Source Big Data Analytics

Autor: Laura McKinney
Erstelldatum: 1 April 2021
Aktualisierungsdatum: 14 Kann 2024
Anonim
Open source Big data & analytics and Visualization Platform (KAVE) - KPMG
Video: Open source Big data & analytics and Visualization Platform (KAVE) - KPMG

Inhalt

Definition - Was bedeutet Open Source Big Data Analytics?

Open-Source-Big-Data-Analyse bezieht sich auf die Verwendung von Open-Source-Software und -Tools zur Analyse großer Datenmengen, um relevante und umsetzbare Informationen zu sammeln, die ein Unternehmen zur Förderung seiner Geschäftsziele verwenden kann. Der größte Anbieter von Open-Source-Big-Data-Analysen ist Apaches Hadoop - es ist die am häufigsten verwendete Softwarebibliothek für die Verarbeitung von enormen Datenmengen auf einem Computercluster unter Verwendung eines verteilten Prozesses für Parallelität.


Eine Einführung in Microsoft Azure und die Microsoft Cloud | In diesem Handbuch erfahren Sie, worum es beim Cloud-Computing geht und wie Microsoft Azure Sie bei der Migration und Ausführung Ihres Unternehmens aus der Cloud unterstützen kann.

Techopedia erklärt Open Source Big Data Analytics

Open-Source-Big-Source-Analyse nutzt Open-Source-Software und -Tools, um Big-Source-Analysen durchzuführen, indem entweder eine gesamte Softwareplattform oder verschiedene Open-Source-Tools für verschiedene Aufgaben im Rahmen der Datenanalyse verwendet werden. Apache Hadoop ist das bekannteste System für die Big-Data-Analyse. Bevor ein echtes Analysesystem zusammengestellt werden kann, sind jedoch andere Komponenten erforderlich.

Hadoop ist die Open-Source-Implementierung des MapReduce-Algorithmus, der von Google und Yahoo entwickelt wurde. Daher ist es die Basis der meisten heutigen Analysesysteme. Viele Big-Data-Analysetools nutzen Open Source, einschließlich robuster Datenbanksysteme wie der Open-Source-Datenbank MongoDB, einer hoch entwickelten und skalierbaren NoSQL-Datenbank, die sich sowohl für Big-Data-Anwendungen als auch für andere Anwendungen eignet.


Open-Source-Big-Data-Analysedienste umfassen:

  • Datenerfassungssystem
  • Kontrollzentrum zur Verwaltung und Überwachung von Clustern
  • Bibliothek für maschinelles Lernen und Data Mining
  • Anwendungskoordinationsdienst
  • Berechnen Sie die Engine
  • Ausführungsrahmen