12 Schlüsseltipps zum Erlernen von Data Science

Autor: Laura McKinney
Erstelldatum: 3 April 2021
Aktualisierungsdatum: 1 Juli 2024
Anonim
12 Schlüsseltipps zum Erlernen von Data Science - Technologie
12 Schlüsseltipps zum Erlernen von Data Science - Technologie

Inhalt


Quelle: Artinspiring / Dreamstime.com

Wegbringen:

Datenwissenschaftler benötigen offensichtlich gute Mathematik- und Codierungskenntnisse, aber auch Kommunikations- und andere Soft Skills sind für den Erfolg von entscheidender Bedeutung.

Data Scientist ist auf Glassdoor der beste Job für 2019 in Amerika. Bei einem durchschnittlichen Grundgehalt von 108.000 US-Dollar und einem Zufriedenheitsgrad von 4,3 von 5 sowie einer angemessenen Anzahl vorhergesagter Stellen ist dies nicht überraschend. Die Frage ist: Was muss man tun, um sich für diesen Job zu qualifizieren?

Um dies herauszufinden, suchten wir nach Ratschlägen für diejenigen, die sich auf diesen Karriereweg begeben möchten. Viel hängt von den harten Fähigkeiten in Codierung und Mathematik ab. Diese starke Berechnung allein reicht jedoch nicht aus. Erfolgreiche Datenwissenschaftler müssen auch in der Lage sein, zu ihren eigenen Bedingungen mit Geschäftsleuten zu sprechen, was die Fähigkeiten erfordert, die mit Soft Skills und Führung verbunden sind. (Weitere Informationen zu den Aufgaben eines Data Scientists finden Sie unter Jobrolle: Data Scientist.)


Aufbau der Bildungsstiftung: Drei grundlegende Tipps

Drace Zhan, ein Datenwissenschaftler an der NYC Data Science Academy, betont die Notwendigkeit einer pädagogischen Grundlage, die die wesentlichen Aspekte der Codierung und der mathematischen Fähigkeiten umfasst:

  1. R / Python + SQL. Wenn Sie nicht über die Codierungsfähigkeiten verfügen, benötigen Sie viel Netzwerkleistung und andere Bereiche, um dieses Defizit zu beheben. Ich habe Datenwissenschaftler mit schwacher Mathematik und wenig Erfahrung in Domänen gesehen, aber sie waren immer von einer starken Codierfähigkeit geprägt. Python ist ideal, aber R ist ein großartiges Fallback-Tool. Es ist am besten, beides in Ihrem Arsenal zu haben. SQL ist auch für einen Data Analyst äußerst wichtig.

  2. Starke mathematische Fähigkeiten. Ein sehr gutes Verständnis einiger häufig verwendeter Methoden: verallgemeinerte lineare Modelle, Entscheidungsbaum, K-Mittelwerte und statistische Tests ist besser als ein umfassendes Bild verschiedener Modelle oder Spezialisierungen wie RNN.

Dies sind zentrale Fähigkeiten, auf denen man aufbauen kann, obwohl einige Experten sie ergänzen. Zum Beispiel enthält eine KDnuggets-Liste die von Zhan erwähnten Codierungskomponenten und einige andere nützliche Dinge, die auf technischer Seite zu wissen sind, darunter die Hadoop-Plattform Apache Spark, Datenvisualisierung, unstrukturierte Daten, maschinelles Lernen und KI.


Wenn wir uns jedoch an einer Umfrage zu den am häufigsten verwendeten Werkzeugen orientieren, die bei einer Kaggle-Umfrage im realen Leben verwendet werden, erhalten wir etwas andere Ergebnisse. Wie Sie aus der Grafik mit den 15 wichtigsten Optionen unten ersehen können, liegen Python, R und SQL leicht unter den ersten drei, aber das vierte sind Jupyter-Notizbücher, gefolgt von TensorFlow, Amazon Web Services, Unix-Shell, Tableau, C / C ++ und NoSQL , MATLAB / Octave und Java, alles vor Hadoop und Spark. Eine weitere Neuerung, die die Leute überraschen könnte, ist das Excel Data Mining von Microsoft.

Mit freundlicher Genehmigung von Kaggle

Die KDnuggets-Liste enthält auch einen Tipp zur formalen Bildung. Die meisten Datenwissenschaftler haben fortgeschrittene Abschlüsse: 46 Prozent haben einen Doktortitel, und 88 Prozent haben mindestens einen Master-Abschluss. Ihre Bachelor-Abschlüsse werden in der Regel auf verwandte Bereiche aufgeteilt. Etwa ein Drittel ist in Mathematik und Statistik tätig, was für diese Laufbahn am beliebtesten ist. Am beliebtesten ist ein Informatik-Abschluss mit 19 Prozent und ein Ingenieur-Abschluss mit 16 Prozent. Natürlich werden die datentechnischen Tools häufig nicht in den Studiengängen, sondern in speziellen Bootcamps oder in Online-Kursen studiert.

Mehr als Kurse: Zwei weitere Tipps

Hank Yun, ein wissenschaftlicher Mitarbeiter in der Lungenabteilung von Weill Cornell Medicine und Student an der NYC Data Science Academy, rät angehenden Datenwissenschaftlern, ihre Arbeit zu planen und einen Mentor zu finden. Er sagte:

Keine Bugs, kein Stress - Ihre schrittweise Anleitung zur Erstellung lebensverändernder Software, ohne Ihr Leben zu zerstören

Sie können Ihre Programmierkenntnisse nicht verbessern, wenn sich niemand um die Softwarequalität kümmert.

Machen Sie nicht den Fehler, den ich gemacht habe, indem Sie sich sagen, dass Sie sich mit Data Science auskennen, weil Sie einen Kurs belegt und ein Zertifikat erhalten haben. Das ist ein guter Anfang, aber wenn Sie anfangen zu studieren, denken Sie an ein Projekt. Dann finden Sie einen Mentor vor Ort und starten Sie gleich ein Leidenschaftsprojekt! Wenn Sie frisch sind, wissen Sie nicht, was Sie nicht wissen. Es ist also hilfreich, wenn jemand da ist, der Sie dahin führt, was für Sie wichtig ist und was nicht. Sie möchten nicht viel Zeit mit Lernen verbringen, ohne etwas zu zeigen!

Wissen, welches Werkzeug Sie aus Ihrem Werkzeugkasten nehmen sollten: Tipp, um der Kurve immer einen Schritt voraus zu sein

Angesichts der Ungleichheit in der Rangfolge der Data-Science-Tools sind einige möglicherweise verwirrt, worauf sie sich konzentrieren sollten. Celeste Fralick, leitende Datenwissenschaftlerin beim Sicherheitssoftware-Unternehmen McAfee, geht auf das Problem in einem CIO-Artikel ein, der sich mit den wesentlichen Fähigkeiten eines Datenwissenschaftlers befasst und erklärt: „Ein Datenwissenschaftler muss auch in der Forschung auf dem Laufenden bleiben Verstehe, welche Technologie wann angewendet werden muss. “Das bedeutet, dass es viel einfacher ist, sich nicht von„ sexy “und„ neu, wenn das eigentliche Problem vorliegt “anlocken zu lassen. „Wenn dem Datenwissenschaftler die Rechenaufwendungen für das Ökosystem, die Interpretierbarkeit, die Latenz, die Bandbreite und andere Systemgrenzbedingungen sowie die Reife des Kunden bekannt sind, kann er selbst nachvollziehen, welche Technologie angewendet werden muss.“

Grundlegende Soft Skills: Weitere sechs Tipps

Der von Fralick angesprochene Punkt bezieht sich auf die nichttechnischen Fähigkeiten, die der Beruf des Datenwissenschaftlers erfordert. Aus diesem Grund umfasst die KDnuggets-Liste die folgenden vier Bereiche: intellektuelle Neugier, Teamwork, Kommunikationsfähigkeiten und Geschäftssinn. Zhan bezog auch wichtige Soft Skills in seine Tipps für Datenwissenschaftler ein, indem er „Kommunikationsfähigkeiten“ wie KDnuggets identifizierte, aber „Fachkenntnisse“ anstelle von „Geschäftssinn“ verwendete. Wie auch immer es heißen mag, es bezieht sich auf die praktische Anwendung von Datenwissenschaft auf die Geschäft. (Weitere Informationen zu Kommunikationsfähigkeiten finden Sie unter Die Bedeutung von Kommunikationsfähigkeiten für technische Fachkräfte.)

Olivia Parr-Rud brachte ihre eigenen Ideen ein und fügte zwei weitere Soft Skills hinzu, wobei der Schwerpunkt auf der Rolle der Kreativität lag. Sie betonte: „Ich betrachte Datenwissenschaft als Kunst ebenso wie als Wissenschaft.“ Darauf muss man zurückgreifen die Stärken beider Gehirnhälften. „Viele Leute sprechen von Data Science als einer Karriere, die in erster Linie die linke Gehirnhälfte nutzt. Ich habe festgestellt, dass Datenwissenschaftler ihr ganzes Gehirn einsetzen müssen, um erfolgreich zu sein. “

Sie erklärte, dass Fortschritte auf diesem Gebiet nicht nur technische Kompetenz, sondern auch Kreativität und die für die Führung erforderliche Vision erfordern:

Die meisten Aufgaben für die linke Gehirnhälfte oder für lineare Aufgaben können automatisiert oder ausgelagert werden. Um als Datenwissenschaftler einen Wettbewerbsvorteil zu erzielen, müssen wir in der Lage sein, Muster zu erkennen und große Informationsmengen auf beiden Seiten unseres Gehirns zu synthetisieren. Und wir müssen innovative Denker sein. Viele der besten Ergebnisse resultieren aus der Integration der linken und rechten Gehirnhälfte.

Sie betonte auch, warum es wichtig ist, eine Vision klar zu kommunizieren:

Als Datenwissenschaftler ist es unser Ziel, Daten zu verwenden, um unseren Kunden zu helfen, ihre Gewinne zu steigern. Die meisten Führungskräfte verstehen nicht, was wir tun oder wie wir es tun. Wir müssen daher wie Führungskräfte denken und unsere Erkenntnisse und Empfehlungen in einer Sprache kommunizieren, die unsere Stakeholder verstehen und der sie vertrauen.

Das Daten-Dutzend

Die wichtigsten Tipps umfassen eine größere Anzahl technischer Tools, Fähigkeiten und Fertigkeiten sowie weniger quantifizierbare Eigenschaften wie Kreativität und Führungsqualitäten. Letztendlich ist es nicht nur ein Zahlenspiel. Da es in der Datenwissenschaft nicht nur darum geht, Modelle im luftleeren Raum zu erstellen, sondern praktische Anwendungen für die Lösung von Problemen im Unternehmensalltag zu finden, müssen diejenigen, die auf diesem Gebiet erfolgreich sein werden, nicht nur die Technologie beherrschen, sondern ihren Geschäftsbereich kennen und die Bedürfnisse von verstehen die verschiedenen Mitglieder des Teams bei der Arbeit.