Interview mit Dr. Alexander Engelhardt (IT Freelancer & Data Scientist)

Dr. Alexander Engelhardt ist 30 Jahre alt und hat an der LMU in München Statistik studiert. Seit 2011 ist er als Data Scientist tätig, seit 2014 dann als IT Freelancer (seine Freelancer-Website). Seine Kernkompetenz ist das Programmieren mit R. Damit trainiert er Machine Learning-Modelle, und entwickelt zudem kundenspezifische Algorithmen, die er bei Bedarf auf Speicherverbrauch und Laufzeit optimieren kann. Außerdem bietet er Schulungen an, sowohl in Programmiersprachen (R, SPSS), als auch in reinen Methodenkursen (z.B. Data Science). Dieses Jahr nimmt Herr Dr. Engelhardt am Wettbewerb zum IT Freelancer des Jahres 2017 teil.

 

Hallo Alexander, wieso bist Du IT Freelancer geworden?

Die Entscheidung für‘s Freelancen kam hauptsächlich aus der flexibleren Zeitgestaltung und der höheren Unabhängigkeit heraus. Ich habe während meiner Promotion begonnen, kleine Nebenprojekte zu übernehmen, z.B. Beratungen zur statistischen Auswertung in Doktorarbeiten. Mit der Zeit hat sich das dann weiterentwickelt, sodass ich bald für ca. 2 Tage die Woche in Unternehmen saß, und dort bei Datenanalysen unterstützt habe. Das hat mir so gut gefallen, dass ich nach meinem Abschluss dann einfach damit weitergemacht habe. Diese Phase des nebenberuflichen „Herantastens“ fand ich sehr wichtig, da ich einen sofortigen Sprung ins kalte Wasser wohl nicht gewagt hätte.

 

Was sind die größten Hürden für einen IT Freelancer und wie kann er diese meistern?

Das größte Problem für mich zu Beginn war die Kundenakquise. Da ich das Freelancen ganz zu Beginn nur als „Hobby“ angesehen habe, weil ich ja von der Uni ein Festgehalt bekommen habe, war es nicht so schlimm, wenn ich mal für eine Weile keine Aufträge hatte. Inzwischen ist das natürlich anders. Im Bereich Data Science ist die Auftragslage derzeit glücklicherweise sehr gut, so dass ich mit einem gepflegten XING- und LinkedIn-Profil häufig von Vermittlern kontaktiert werde. Langfristig ziele ich natürlich darauf, ein eigenes Kundennetzwerk aufzubauen.

Den ganzen organisatorischen Aufwand (Anmeldung, Finanzamt, Steuern, etc.) habe ich schlimmer eingeschätzt als er am Ende war. Das ging alles relativ einfach.

 

Du hast Dich auf Data Science spezialisiert – wie bist Du zu diesem Thema gekommen?

Ich habe mich während meines Statistikstudiums entschieden, Data Scientist zu werden. Die Statistikgrundlagen und die Möglichkeit, auch den Informatikteil (Machine Learning, Datenbanken, Programmieren, etc.) zu lernen, ergaben an meiner Uni eine schöne Kombination und eine gute Vorbereitung auf das Arbeitsumfeld als Data Scientist. Ich habe im Studium auch als Werkstudent in der statistischen Beratung gearbeitet, was mir da schon gefallen hat.

Zum Statistikstudium habe ich mich 2008 ziemlich impulsiv entschieden, weil ich zu dieser Zeit ausgiebig Online-Poker gespielt habe und mich dort das Rechnen mit Mengen und Wahrscheinlichkeiten sehr fasziniert hat. Ich wusste nicht, was im Studium noch alles auf mich zukommen würde, aber im Nachhinein hat sich meine Entscheidung doch als gute Wahl herausgestellt 🙂

 

Wenn ich in den Bereich Künstliche Intelligenz einsteigen wollte, mit welchem Tool würdest Du mir raten anzufangen?

Oh, das gesamte Gebiet der KI ist sehr breit. Ich kenne mich eigentlich hauptsächlich im Machine Learning aus, also dem Mustererkennen in Daten und dem Erstellen von Regeln, z.B. zur Klassifikation.

Dafür ist es für einen Einsteiger momentan wohl am besten mit Python und dem Machine-Learning-Paket scikit-learn zu beginnen. Die Sprache ist recht intuitiv, und das Paket hat quasi alle relevanten Algorithmen in sich vereint.

Ich selbst habe statt Python damals R gelernt, da dies an der Uni (speziell im Statistikstudium) einfach das Standardwerkzeug war. Es ist jedoch schwieriger zu erlernen, und hat inzwischen keine großen Vorteile mehr gegenüber Python. Momentan versuche ich auch, die Zeit zu finden, mir Python und scikit-learn beizubringen, aber wie üblich, fehlt die Zeit dafür 🙂

 

Du betreibst einen Blog zum Thema Data Science, welche Schwerpunkte hat der?

Mein Blog ( http://www.alpha-epsilon.de/blog/ ) dient mir selbst genauso wie den Lesern. Ich speichere dort z.B. Lösungen für Probleme, die ich in Zukunft vielleicht nochmal haben werde (z.B. gewisse Tricks auf der Linux-Kommandozeile, die ich mir partout nicht merken kann). Außerdem strukturiere und sammle ich dort meine Notizen für größere Projekte. Derzeit möchte ich z.B. in den Bereich Big Data mit Hadoop einsteigen, und bereite mich dafür auf eine Zertifikatsprüfung vor. Das Wissen der dafür verlangten Themen sammle und organisiere ich dann dort in einer Kategorie, so dass ich meine Vorbereitung immer gut im Blick habe.

Der Blog trägt den Untertitel „All things Data Science“, da er eigentlich eher breit gehalten ist, statt sich auf ein Spezialgebiet zu beschränken. Der Schwerpunkt liegt aber momentan im Big Data Bereich, speziell bei Spark mit Python und Scala, da ich mich auf dieses Zertifikat vorbereite. Er kann sich aber natürlich je nach meiner derzeitigen Projekttätigkeit oder Weiterbildung verschieben.

 

Du hast vor kurzem deine Promotion abgeschlossen; herzlichen Glückwunsch! Zu welchem Thema hast Du in Deiner Doktorarbeit geforscht und wie kannst Du die Forschungsergebnisse in Deiner Arbeit als IT Freelancer nutzen?

In meiner Dissertation ging es darum, zwei Algorithmen aus der Statistik so zu verbessern, dass sie mit großen und komplexen Datensätzen zurechtkommen. In meinem ersten Projekt haben wir ein statistisches Modell mit einem MapReduce-Ansatz auf eine sehr lange x-Achse (die menschliche DNA) losgelassen. Das zweite Projekt ging um einen Belief Propagation-Algorithmus für Stammbäume, um Darmkrebs-Risikofaktoren zu modellieren. Die domänenspezifischen Ergebnisse sind für meine jetzige Tätigkeit weniger wichtig, aber die allgemeinen Fähigkeiten in der Entwicklung effizienter Algorithmen und der Programmierung sind schon eher relevant.

 

Was planst Du für Deine Zukunft? Wo stehst Du in 5 Jahren?

Ich bin mit meinem derzeitigen Weg eigentlich ganz zufrieden. Wenn alles so weitergeht wie bisher, kann ich mich nicht beschweren 🙂

Ich möchte aber gerne eine breitere Branchenerfahrung sammeln. Gerade im Bereich Data Science finde ich, dass es einfacher ist, sich in neue Branchen auszudehnen, da die Struktur der anfallenden Daten doch häufig branchenübergreifend ähnlich ist.

Das Freelancen gefällt mir sehr gut, das wird sich demnächst wohl nicht ändern. Ich möchte allerdings auch mein Skillset erweitern, z.B. auf Python und das Hadoop-Ökosystem, insbesondere Spark.

 

Alexander, herzlichen Dank für dieses Interview!

Wenn Ihr noch Fragen an Alexander Engelhardt habt, hinterlasst einfach einen Kommentar!

 

Schreibe einen Kommentar

Nachrichten und Ratgeber für IT Freelancer  

   + kostenlos

   + kompakt

   + monatlich

   + spamfrei

Das Neueste zum Wettbewerb 'IT Freelancer des Jahres'

Newsletter des IT Freelancer Magazins