banner

Blog

Dec 09, 2023

Die Macht von SQL für zukünftige Datenwissenschaftler

Geschichte nur für Mitglieder

Meagan Voulo

Folgen

DataDrivenInvestor

--

Aktie

Mein Übergang in die Welt der Datenwissenschaft war nicht traditionell. Ich studierte Psychologie, begann im Marketing zu arbeiten, schrieb nebenbei etwas und schrieb mich schließlich mit 27 Jahren für ein Data Science BootCamp ein. Allerdings habe ich mein Data Science BootCamp bei Springboard als Vollzeitjob betrachtet.

Ich habe mindestens 40 Stunden pro Woche damit verbracht, meine Kursarbeiten zu absolvieren und zusätzlich selbst zu recherchieren, um die Konzepte besser zu verstehen. Aber auch nach Abschluss dieses Programms hatte ich nicht das Gefühl, dass ich vollständig darauf vorbereitet war, einen Job als Datenwissenschaftler zu bekommen. Stattdessen suchte ich nach Rollen für Datenanalysten und Marketinganalysten. Als ich meine erste Stelle als Datenanalyst bekam, stellte ich fest, dass ich zwar ziemlich kompetent mit Python, explorativer Datenanalyse und Modellierung war, aber keine ausgeprägten Kenntnisse im Abfragen von Daten hatte.

Um diesen Mangel zu beheben, suchte ich nach Ressourcen zum Üben von SQL. Rückblickend ist dies wahrscheinlich das Beste, was ich nach Abschluss meines Python-intensiven Data-Science-Bootcamps hätte tun können. Für diejenigen, die versuchen, als Datenwissenschaftler Fuß zu fassen, gibt es meiner Meinung nach einen sehr guten Grund, SQL zu lernen – damit sind Sie unverzichtbar …

Man könnte meinen, ich übertreibe, aber es ist die Wahrheit. Auf dem heutigen Arbeitsmarkt ist nichts sicher. Entlassungen im technischen Bereich finden überall ohne Sinn und Zweck statt. Als jemand, der sich vor solchen Dingen Sorgen macht, habe ich mir ein Ziel gesetzt, auf das ich hinarbeiten soll. Ich habe beschlossen, dass es meine Eintrittskarte in die Arbeitsplatzsicherheit sein wird: der beste Data-Science-Analyst in meinem Unternehmen zu werden.

Um dies zu erreichen, musste ich nicht nur Python beherrschen, sondern auch SQL beherrschen. Hier ist meine Begründung:

Wenn ich meine eigenen Daten abrufen kann, muss ich mich nicht auf einen Analysten oder Ingenieur verlassen, um die Informationen zu erhalten, die ich für meine passenden Lernmodelle benötige.

Am häufigsten kennen die Leute die Data-Science-80/20-Regel, die besagt, dass 80 % der Data-Science-Mitarbeiter die Daten vorbereiten und 20 % tatsächlich analysieren und berichten. Natürlich kann ein Teil dieser Datenbereinigung mit Python durchgeführt werden, aber durch gute SQL-Kenntnisse konnte ich sicherstellen, dass ich die Daten verwalten, auf Inkonsistenzen und Fehler prüfen und bereinigen konnte, bevor ich sie in mein Notebook zog.

AKTIE