Stephan Baier

Freiberuflicher Data Scientist

Stephan Baier
München, Deutschland

Erfahrungen

Okt. 2025 - Bis heute
4 Monaten

Freiberuflicher Data Scientist

Baier Data & AI Consulting

März 2024 - Sept. 2025
1 Jahr 7 Monaten
München, Deutschland
Hybrid

Team Lead Data Science

Check24 GmbH

  • Aufbau einer hybriden ML-Architektur auf AWS und On-Premise

  • Entwicklung kundenspezifischer Machine-Learning-Modelle für Computer Vision und Informationsextraktion

  • Evaluierung und Prototyping mit verschiedenen agentenbasierten KI-Tools, LLMs und MCP

  • Zusammenarbeit mit Product Ownern zur Definition von funktionalen Anforderungen und Sicherheitsaspekten

  • Führung eines Teams aus Data Scientists und Data Engineers

  • OCR-Pipeline: Training eines EasyOCR-Modells auf domänenspezifischen und synthetischen Datensätzen (Ausweise, Pässe, Führerscheine)

  • Segmentierungsmodell: Implementierung eines Segmentierungsmodells in PyTorch zur genauen Zuschneidung von Dokumenten und Perspektivkorrektur

  • Ausweisklassifikator: Entwicklung eines CNN-basierten Modells in PyTorch zur Klassifizierung von Dokumenttypen

  • Hologramm-Erkennung: Entwicklung eines spezialisierten Klassifikationsmodells in PyTorch zur Überprüfung von Hologrammen

  • Konvertierung der Modelle nach ONNX und TensorFlow Lite, inklusive Quantisierung und Pruning von Modellgewichten zur Erfüllung von Echtzeitanforderungen

  • Erreichen durchschnittlicher Inferenzzeiten von unter 200 ms auf mobilen Endgeräten

  • Über eine Million erfolgreiche Echtzeit-Identifikationen

  • Reduzierung des manuellen Verifikationsaufwands um mehr als 90 %

  • Tech-Stack: AWS SageMaker, Bedrock, Rekognition; multimodale LLMs, Pydantic, FastMCP, Prompt-Engineering; PyTorch, PyTorch Lightning, TensorFlow Lite, ONNX; TorchVision, OpenCV, EasyOCR

Juni 2021 - Feb. 2024
2 Jahren 9 Monaten
Berlin, Deutschland

Lead Machine Learning Engineer

RS Alpha Capital GmbH

  • Einrichtung eines On-Premise-Kubernetes-Clusters mit Apache Ranger

  • Automatisierte GPU-basierte Trainingsjobs

  • Aufbau von CI/CD-Pipelines mit ArgoCD und GitLab für automatisierten Modelldeployment

  • Implementierung von MLOps-Pipelines mit Dagster und ClearML

  • Tech-Stack: Kubernetes, Apache Ranger, PyTorch, ArgoCD, GitLab CI/CD, Docker, Grafana, Prometheus, On-Premise-GPU-Cluster

  • Entgegenwirken von Modellverschlechterung durch automatisiertes Retraining und Deployment mit minimalem manuellem Aufwand

  • Sicherstellung der Einhaltung regulatorischer Anforderungen durch detailliertes Monitoring und eine hochverfügbare Infrastruktur mit 99,99 % Verfügbarkeit

Mai 2018 - Mai 2021
3 Jahren 1 Monate
München, Deutschland

Senior Data Science Consultant

Data Reply GmbH

  • Streaming-ML für die Verarbeitung von Kundenmitteilungen (Okt. 2019 – Mai 2021)**

  • Aufbau einer Echtzeit-ML-Pipeline zur Klassifizierung von Kundenkommunikation

  • Erstellung von Live-Dashboards für Nachrichtenfluss, Vorhersagen und Systemüberwachung

  • Gestaltung eines VAIT-konformen ML-Lifecycles mit Audit-Trails, Jenkins CI und Deployment auf Kubernetes

  • Tech-Stack: Kafka, OpenShift, Jenkins, MLflow, Python, scikit-learn, XGBoost, Universal Sentence Encoder

  • Ermöglichung der Echtzeitverarbeitung von über 20.000 Nachrichten pro Tag

  • Bereitstellung vollständig nachvollziehbarer und regulatorisch konformer ML-Workflows

  • NLP-Pipeline für semantische Suche und Entity Linking (Aug. 2018 – Sept. 2019)**

  • Entwicklung und Implementierung einer NLP-Pipeline mit BERT-basierten Modellen für NER und Entity-Disambiguierung

  • Aufbau einer semantischen Suchmaschine mit Elasticsearch und Kibana-Dashboards zur Abfrageanalyse

  • Verknüpfung extrahierter Entitäten und Beziehungen in einem Neo4j-Wissensgraph, was graphbasierte Suche und interaktive Exploration über Neo4j Bloom ermöglicht

  • Tech-Stack: PyTorch, BERT, Elasticsearch, Kibana, Neo4j, Bloom, Azure

  • Ermöglichung zeitnaherer Risikobewertung für Kreditversicherungen durch Einbeziehung aktueller Nachrichtenereignisse

  • Steigerung der Effizienz von Schadensregulierern durch schnellere Identifikation relevanter historischer Fälle

  • Sales-Funnel-Optimierung für Kreditprodukte (Mai 2018 – Juli 2018)**

  • Einsatz von Clustering- und Klassifikationsmodellen zur Segmentierung des Nutzerverhaltens und Erkennung von Absprungsmustern im Sales Funnel

  • Durchführung von Datenanalyse, Feature Engineering und Modellentwicklung

  • Entwicklung einer interaktiven Webanwendung zur Visualisierung von Conversion-Pfaden, Kundensegmenten und Modelergebnissen für Stakeholder im Business

  • Tech-Stack: Python, PySpark, Pandas, NumPy, scikit-learn, SQL, Plotly, Dash

Okt. 2013 - Apr. 2018
4 Jahren 7 Monaten
München, Deutschland

Industrieforschungsstipendiat

Siemens AG

Sept. 2012 - Juni 2013
10 Monaten
Berlin, Deutschland

Softwareentwickler

Steria Mummert AG

Zusammenfassung

Ich bin ein erfahrener Data Scientist und Machine Learning Engineer mit einem starken akademischen Hintergrund in Informatik und künstlicher Intelligenz. Mein Fokus liegt auf Beratung, Implementierung und Operationalisierung von hochmodernen Machine-Learning-Lösungen.

Fähigkeiten

  • Programmierung & Frameworks: Python (Pandas, Scikit-learn, Pyspark, Fastapi), Java
  • Machine Learning & Deep Learning: Pytorch, Tensorflow, Keras, Mlflow, Azureml, Aws Sagemaker
  • Natural Language Processing: Llm, Rag, Wissensgraph, Feinabstimmung Kleiner Sprachmodelle
  • Computer Vision: Ocr, Opencv, Torchvision, Bildklassifizierung, Objekterkennung, Segmentierung
  • Data Engineering & Orchestrierung: Sql, Apache Kafka, Elasticsearch, Dagster
  • Cloud & Virtualisierung: Aws, Azure, Docker, Kubernetes, Jenkins, Ci/cd

Sprachen

Deutsch
Muttersprache
Englisch
Verhandlungssicher

Ausbildung

Okt. 2014 - März 2019

Ludwig-Maximilians-Universität

Promotion · Informatik · München, Deutschland · summa cum laude (mit höchster Auszeichnung)

Okt. 2012 - Sept. 2014

Ludwig-Maximilians-Universität

M.Sc. · Informatik · München, Deutschland

Sept. 2009 - Sept. 2012

Ludwig-Maximilians-Universität

B.Sc. · Informatik · München, Deutschland

Zertifikate & Bescheinigungen

AWS Cloud Practitioner

Certified Kubernetes Application Developer

Chartered Financial Analyst (CFA) Level 1

Confluent Certified Developer For Apache Kafka

Professional Scrum Master (PSM 1)

Sie suchen Freelancer?Passende Kandidaten in Sekunden!
FRATCH GPT testen
Weitere Aktionen

Ähnliche Freelancer

Entdecken Sie andere Experten mit ähnlichen Qualifikationen und Erfahrungen.

Max Ritter
Max Ritter

Cloud (AWS) | KI | DevOps | Daten

Profil ansehen
Martin Musiol
Martin Musiol

Product Owner für AI-Lernplattform

Profil ansehen
Jürgen Fey
Jürgen Fey

AR/VR/XR-Architekt

Profil ansehen
Christian Schulz
Christian Schulz

Data Scientist/AI-Ingenieur

Profil ansehen
Stephan Sahm
Stephan Sahm

Senior Data/ML-Berater & Technischer Leiter

Profil ansehen
Himanshu Negi
Himanshu Negi

Principal (Datenwissenschaftler/Dateningenieur/Gen-AI-Ingenieur)

Profil ansehen
Serge Kalinin
Serge Kalinin

MLOps (Machine-Learning-Betrieb)

Profil ansehen
Mathias Wilhelm
Mathias Wilhelm

Entwicklung einer KI-gesteuerten Social Media Automatisierung zur Identifikation von Themen, Textgenerierung und Ausspielung

Profil ansehen
Marcel Meyer
Marcel Meyer

Cloud-Architekt, Senior Solution Architekt, Senior Software Engineer

Profil ansehen
Mirza Klimenta
Mirza Klimenta

Agentische KI für ein DeepResearch-Projekt

Profil ansehen
Thomas Hoefkens
Thomas Hoefkens

Senior MLOps- und DevOps-Engineer

Profil ansehen
Manuel Pasieka
Manuel Pasieka

KI-Ingenieur

Profil ansehen
Jennifer Kiunke
Jennifer Kiunke

KI-Produktmanager und Ingenieur

Profil ansehen
André Howe
André Howe

Linux-IT-Administrator

Profil ansehen
Matthias Isler
Matthias Isler

Teilzeit-CTO (Leitender Ingenieur / Technischer Architekt)

Profil ansehen
Ulf Schiebener
Ulf Schiebener

Innovationsmanager

Profil ansehen
Anton Klonov
Anton Klonov

Leiter der technischen Gesamtintegration NSC / Entwicklung von Hadoop Cloud

Profil ansehen
Philipp Grunert
Philipp Grunert

Data Scientist und Data Engineer

Profil ansehen
Yannick Schuchmann
Yannick Schuchmann

Freiberuflicher IT-Berater

Profil ansehen
Markus Binder
Markus Binder

Technischer Mitgründer

Profil ansehen
Ursula Maria mayer
Ursula Maria mayer

Business-Mentor

Profil ansehen
Dancho Panovski
Dancho Panovski

IT-Projektmanager

Profil ansehen
Patrick Döring
Patrick Döring

C-Level-Berater | Engineering- und QA-Leiter

Profil ansehen
Mohamed Saleh
Mohamed Saleh

Machine Learning Engineer (Teilzeit)

Profil ansehen
Martin Mauch
Martin Mauch

Freiberuflicher Datenarchitekt

Profil ansehen
Mathew Divine
Mathew Divine

Data-Science-Experte und KI-Stratege

Profil ansehen
Michael Fecher
Michael Fecher

Freelancer, Solution-Architekt

Profil ansehen
Ivaylo Sieme
Ivaylo Sieme

Cloud-Architekt & KI-Ingenieur

Profil ansehen
Tobias Reinerth
Tobias Reinerth

Senior Data Scientist

Profil ansehen
Eduard Van kleef
Eduard Van kleef

Leiter Workshop „Einführung von KI Entwicklungstools“

Profil ansehen