Wie man einen Data Scientist unterstützt

Autor: Judy Howell
Erstelldatum: 26 Juli 2021
Aktualisierungsdatum: 21 Juni 2024
Anonim
Wie man einen Data Scientist unterstützt - Technologie
Wie man einen Data Scientist unterstützt - Technologie

Inhalt


Wegbringen:

Um Datenwissenschaftler zu fördern, müssen sich Unternehmen stärker auf Kultur und Organisationsstruktur konzentrieren.

Unter Technologie-Startups wird der Begriff "Data Scientist" immer häufiger verwendet, um Daten-Geeks zu bezeichnen, die in der Lage sind, traditionell getrennte Funktionsbereiche der Datenintelligenz zu überbrücken. Ein Data Scientist ist jemand, der mehrere (wenn nicht alle) Aspekte von Data Intelligence-Projekten problemlos ausführen kann:

  1. Datenerfassung: Dies kann das Schreiben von benutzerdefinierten Parsern und Webcrawlern oder Skripten erfordern, die auf bestimmte Webdienste oder APIs für nicht traditionelle Datenquellen abzielen.
  2. Datenverwaltung: ETL, Bearbeiten, Abfragen und Verwalten von Daten in Datenbanken, Schlüsselwertspeichern oder Hadoop.
  3. Informationsvisualisierung: Aufdecken von Mustern mithilfe statischer Visualisierungs-Toolkits und / oder interaktiver Plattformen auf der Basis von Flash, JavaScript oder Processing.
  4. Analytics: Dies kann von einfachen bis hin zu komplexen Techniken in multivariaten Statistiken, maschinellem Lernen und NLP reichen.
  5. Einblick: Extrahieren, fassen und präsentieren Sie die wichtigsten Ergebnisse einem breiten Publikum.

Es gibt viele Werkzeuge, Fähigkeiten und technische Details, und man kann Jahre damit verbringen, jedes der oben aufgelisteten Elemente zu beherrschen. Während ein Datenwissenschaftler in keinem der Bereiche über echtes Expertenwissen verfügt, kann er problemlos hin und her springen und grundlegende Aufgaben in allen Bereichen ausführen. Das Ergebnis ist ein Datenfreak, der schnell genug ein Datenprojekt untersucht und Antworten auf (hochrangige) Fragen des Managements liefert. (Weitere Informationen zu Data Scientists finden Sie in Data Scientists: Die neuen Rockstars der Tech-Welt.)


Um Datenwissenschaftler zu fördern, müssen sich Unternehmen stärker auf Kultur und Organisationsstruktur konzentrieren. Viele Data Worker verfügen über ausreichende Fähigkeiten und Schulungen, um in mehreren Bereichen der Datenintelligenz schnell produktiv zu werden. Das Problem ist, dass die meisten nicht in Umgebungen arbeiten, die sie dazu ermutigen, Datenwissenschaftler zu werden. Sie stecken in Silos und beschränken sich auf einen oder zwei Bereiche der Datenintelligenz. Oft sind sie darauf beschränkt, Tools zu verwenden, die von ihren Managern "genehmigt" wurden.

Nachdem ich in kleinen und großen Unternehmen gearbeitet habe, ist mir klar, dass die strikte Aufgabentrennung das Haupthindernis für Datenwissenschaftler ist. Die häufigste Manifestation ist die Trennung zwischen Datenanalyse und Datenmanagement. In vielen großen Unternehmen müssen die meisten Analysten / Statistiker auf Daten eines bestimmten Data Warehousing-Teams warten, und in vielen Fällen warten sie auf Daten mehrerer Eigentümer verschiedener Data Warehouses.


So fördern Sie Data Science in einer Organisation

Momentan gedeihen Datenwissenschaftler in kleineren Startups, Internetunternehmen und anderen Organisationen, in denen definierte Rollen und Aufgaben weniger im Vordergrund stehen. Aber es gibt wirklich keinen Grund, warum große und reife Unternehmen nicht mitmachen können. (Es gibt keinen Grund, warum Ihre Statistiker nicht lernen können, wie einfache Web-Scraper geschrieben werden, und warum Ihre Datenbank-Mitarbeiter nicht einfache Statistiken und Visualisierungen lernen können.) Hier einige Vorschläge, wie dies geschehen kann:

Sobald Sie sich dazu verpflichtet haben, ein Team von Datenwissenschaftlern zu bilden, können Sie zunächst die aktuellen Mitarbeiter identifizieren, die möglicherweise zum Profil passen. Sie müssen aufgeschlossen und teamorientiert sein und über Programmierkenntnisse in einem der oben beschriebenen Bereiche verfügen. Idealerweise hätten Sie eine Mischung aus Leuten aus Informatik, Statistik / quantitativen oder datenorientierten Hintergründen. Die Teammitglieder müssen bereit sein, einfache Tools, Hacks und Techniken miteinander zu teilen. Eine gegenseitige Befruchtung erfolgt auf natürliche Weise, wenn die Teammitglieder aufgeregt sind, voneinander zu lernen. Mitarbeiter, die sich nur ungern über Techniken, Tools und Ideen austauschen, würden den Fortschritt behindern.

Sie können Ihre Programmierkenntnisse nicht verbessern, wenn sich niemand um die Softwarequalität kümmert.

Sobald Manager eine Ahnung davon bekommen, dass ein Team mit neuen Datenquellen spielt, könnten sie versuchen, Hindernisse auszuräumen ("Was ist mit der Datenintegrität? Sie verwenden nicht die richtigen Techniken für maschinelles Lernen / Statistik! Der Versuchsaufbau ist falsch! Wie können sie." das mit unseren daten kombinieren? "). Ohne politische Unterstützung wird Ihr Team von Datenwissenschaftlern auf (nicht) freundliches Feuer stoßen. Neue Dinge werden in der Regel als Bedrohung wahrgenommen. Daher ist es am besten, den Managern schnell zu versichern, dass die Datenwissenschaftler das ergänzen, was sie tun. Erkenntnisse, die Ihr kleines Team von Datenwissenschaftlern aufgedeckt hat, können verwendet werden, um formellere Daten- / Analyseprojekte zu informieren. Datenwissenschaftler werden den Bedarf an Statistikern nicht beseitigen, sie weisen sie jedoch möglicherweise auf unterschiedliche Datensätze und Fragen hin.

Verwenden Sie Ihr erstes Team von Datenwissenschaftlern als Evangelisten

Wenn Sie Ihr ursprüngliches Team von Datenwissenschaftlern richtig ausgewählt haben, sollten diese ihre Ergebnisse problemlos anderen in Ihrem Unternehmen präsentieren können. Besser noch, sie wären begeistert davon! Verwenden Sie sie, um zu beeinflussen, wie der Rest des Unternehmens Datenintelligenz betrachtet, und um diese Silos langsam abzureißen.

Ich sage nicht, dass irgendwann keine neuen Schulungs- und Unternehmenstools mehr benötigt werden, wenn Sie Ihr internes Team von Datenwissenschaftlern bilden. Ich denke jedoch, dass viele Unternehmen durch die Berücksichtigung kultureller und organisatorischer Strukturen ihre eigenen Mitarbeiter zusammen mit kostenlosen Tools einsetzen können, um ein kleines Team von Datenwissenschaftlern zusammenzustellen. Ich spreche aus Erfahrung, habe für große Unternehmen gearbeitet - das Talent ist da und die Techniken sind nicht so schwer zu erlernen, aber die organisatorischen Silos sind schwer zu überwinden. Zu ihren Reihen gehört bereits ein Pool von Talenten, die bereit sind zu glänzen, wenn nicht die starren Unternehmensstrukturen, die ihre Möglichkeiten einschränken.


Mit Genehmigung von http://practicalquant.blogspot.ca und Ben Lorica erneut veröffentlicht. Der Originalartikel ist hier zu finden: http://practicalquant.blogspot.ca/2010/07/how-to-nurture-data-scientists.html