Data Science oder maschinelles Lernen? Hier erfahren Sie, wie Sie den Unterschied erkennen

Autor: Laura McKinney
Erstelldatum: 3 April 2021
Aktualisierungsdatum: 1 Juli 2024
Anonim
Was ist Data Science? Und welche Fähigkeiten braucht man?
Video: Was ist Data Science? Und welche Fähigkeiten braucht man?

Inhalt


Quelle: Elnur / Dreamstime.com

Wegbringen:

Datenwissenschaft und maschinelles Lernen unterscheiden sich in wesentlichen Punkten. In gewisser Weise kann eine als Teilmenge der anderen angesehen werden. Beides ist wichtig für den aktuellen IT-Fortschritt.

In dieser neuen Welt der künstlichen Intelligenz und des Datenmanagements sind einige der Begriffe, die in der IT-Welt am häufigsten verwendet werden, leicht zu verwechseln.

Beispielsweise haben Datenwissenschaft und maschinelles Lernen viel miteinander zu tun. Es ist nicht verwunderlich, dass viele Menschen mit nur vorübergehenden Kenntnissen dieser Disziplinen Schwierigkeiten haben, herauszufinden, wie sie sich voneinander unterscheiden.

Hier ist der beste Weg, um Data Science vom maschinellen Lernen als Prinzip und als technologischen Ansatz zu trennen.

Datenwissenschaft und maschinelles Lernen: breite und enge Terminologie

Zunächst einmal ist Data Science wirklich eine breite, übergreifende Kategorie von Technologie, die viele verschiedene Arten von Projekten und Kreationen umfasst. (Weitere Informationen zu Aufgaben im Bereich Data Science finden Sie unter Jobrolle: Data Scientist.)


In der Datenwissenschaft wird im Wesentlichen mit Big Data gearbeitet. Das Gesetz von Moore und die Verbreitung effizienterer Speichergeräte führten dazu, dass Unternehmen und andere Parteien enorme Datenmengen sammelten. Dann begannen Big-Data-Plattformen und -Tools wie Hadoop, das Computing neu zu definieren, indem sie die Funktionsweise des Datenmanagements änderten. Mit Cloud und Containerisierung sowie brandneuen Modellen ist Big Data zu einem wichtigen Treiber für die Art und Weise geworden, wie wir arbeiten und leben.

In seiner einfachsten Form ist Data Science die Art und Weise, wie wir diese Daten verwalten, von der Bereinigung und Verfeinerung bis zur Verwendung in Form von Einsichten.

Die Definition von maschinellem Lernen ist viel enger. Beim maschinellen Lernen nehmen Technologien Daten auf und durchlaufen Algorithmen, um menschliche kognitive Prozesse zu simulieren, die als „Lernen“ bezeichnet werden. Mit anderen Worten, der Computer kann, nachdem er die Daten aufgenommen und darauf trainiert hat, seine eigenen Ergebnisse liefern Hier scheint die Technologie aus den von Programmierern eingeführten Prozessen gelernt zu haben.


Fähigkeiten für Data Science und maschinelles Lernen

Eine andere Möglichkeit, Datenwissenschaft und maschinelles Lernen gegenüberzustellen, besteht darin, die verschiedenen Fähigkeiten zu untersuchen, die für Fachleute in einem dieser Bereiche am wertvollsten sind.

Keine Bugs, kein Stress - Ihre schrittweise Anleitung zur Erstellung lebensverändernder Software, ohne Ihr Leben zu zerstören

Sie können Ihre Programmierkenntnisse nicht verbessern, wenn sich niemand um die Softwarequalität kümmert.

Es besteht allgemeiner Konsens darüber, dass Datenwissenschaftler von umfassenden analytischen und mathematischen Fähigkeiten, praktischen Erfahrungen mit Datenbanktechnologien und Kenntnissen von Programmiersprachen wie Python oder anderen Paketen, die zum Parsen von Big Data verwendet werden, profitieren.

"Jeder, der Interesse an einer starken Karriere in (Data Science) hat, sollte Schlüsselkompetenzen in drei Abteilungen erwerben: Analytik, Programmierung und Domänenkenntnisse", schreibt Srihari Sasikumar bei Simplilearn. „Wenn Sie eine Ebene tiefer gehen, können Sie mit den folgenden Fähigkeiten eine Nische als Datenwissenschaftler ausmachen: fundierte Kenntnisse in Python, SAS, R (und) Scala, praktische Erfahrung in der Codierung von SQL-Datenbanken sowie die Fähigkeit, mit unstrukturierten Daten von zu arbeiten Verschiedene Quellen wie Video und soziale Medien verstehen mehrere analytische Funktionen (und) das Wissen über maschinelles Lernen. “

Auf der Seite des maschinellen Lernens zitieren Experten häufig Datenmodellierungsfähigkeiten, Wahrscheinlichkeits- und Statistikkenntnisse und erweiterte Programmierfähigkeiten als hilfreiche Werkzeuge im Toolkit des maschinellen Lerningenieurs.

Wie man maschinelles Lernen erkennt

Der Schlüssel dabei ist, dass alle möglichen Dinge datenwissenschaftliche Arbeit umfassen, aber es ist kein maschinelles Lernen, es sei denn, Sie haben ein sehr strenges Schema festgelegt, das dem Computer hilft, aus seinen Eingaben zu lernen.

Dies führt zu einigen überraschend leistungsfähigen Systemen, die weitreichende Auswirkungen auf unser Leben haben können.

"Vieles, was wir mit maschinellem Lernen machen, geschieht unter der Oberfläche", sagte Jeff Bezos, Gründer von Amazon, und wies auf einige Anwendungen dieser Art von Systemen hin. „Maschinelles Lernen treibt unsere Algorithmen für Bedarfsprognosen, Ranking der Produktsuche, Produkt- und Geschäftsempfehlungen, Merchandising-Placements, Betrugserkennung, Übersetzungen und vieles mehr voran. Obwohl weniger sichtbar, werden die Auswirkungen des maschinellen Lernens in hohem Maße von dieser Art sein - leise, aber bedeutungsvoll, um die Kernoperationen zu verbessern. “

Eines der hilfreichsten Beispiele hierfür ist die Entstehung des neuronalen Netzwerks - eine verbreitete und beliebte Methode zum Einrichten von maschinellen Lernprozessen.

In seiner grundlegendsten Form besteht das neuronale Netzwerk aus Schichten künstlicher Neuronen. Jedes einzelne künstliche Neuron verfügt über eine Funktionalität, die der eines biologischen Neurons entspricht. Anstelle von Synapsen und Dendriten verfügt es jedoch über Eingaben, eine Aktivierungsfunktion und mögliche Ausgaben.

Das neuronale Netzwerk verhält sich wie ein menschliches Gehirn, und Experten des maschinellen Lernens verwenden dieses Modell häufig, um maschinelle Lernergebnisse zu erzielen.

Dies ist jedoch nicht die einzige Möglichkeit, maschinelles Lernen durchzuführen. Einige rudimentärere Projekte des maschinellen Lernens umfassen lediglich das Anzeigen einer breiten Palette von Fotos (oder das Versorgen eines Computers mit anderen Rohdaten), das Eingeben von Ideen mithilfe von überwachtem maschinellem Lernen und Etikettendaten sowie die Möglichkeit, dass der Computer schließlich unterscheiden kann verschiedene Formen oder Gegenstände in einem Gesichtsfeld. (Informationen zu den Grundlagen des maschinellen Lernens finden Sie unter Maschinelles Lernen 101.)

Zwei hochmoderne Disziplinen

Zusammenfassend ist maschinelles Lernen ein wertvoller Bestandteil der Datenwissenschaft. Aber die Datenwissenschaft repräsentiert die weite Grenze und die Konstellation, in der maschinelles Lernen stattfindet.

In gewisser Weise könnte man sagen, dass maschinelles Lernen ohne Big Data niemals stattfinden würde. Big Data selbst hat jedoch nicht zu maschinellem Lernen geführt - stattdessen, nachdem wir so viele Daten gesammelt hatten, dass wir fast nicht wussten, was wir damit anfangen sollten, kamen die Top-Köpfe auf die Idee, diese Bio-Simulationsprozesse aufzuladen Einblicke zu gewähren.

Ein weiterer wichtiger Aspekt ist, dass Data Science auf zwei Arten angewendet werden kann: Wir können maschinelles Lernen und künstliche Intelligenz einbeziehen, damit Computer für uns denken, oder wir können Data Science zu einem menschenzentrierteren Ansatz zurückführen Der Computer präsentiert einfach Ergebnisse und wir als Menschen treffen die Entscheidungen.

Dies veranlasst einige Experten, darunter auch einige der führenden Innovatoren, zu einer dynamischeren Bilanzierung der Art und Weise, in der wir diese Technologien einsetzen.

"(KI) ist in der Lage, viel mehr zu leisten, als fast jeder weiß, und die Verbesserungsrate ist exponentiell", wurde Elon Musk zitiert, während er warnte, dass maschinelles Lernen und KI-Programme eine Kontrolle erfordern.

In jedem Fall sind sowohl die Datenwissenschaft als auch das maschinelle Lernen Kernbestandteile des Fortschritts, den wir als Gesellschaften heute in der Technologie erzielen.