Thomas Hoefkens
Senior MLOps- und DevOps-Engineer
Erfahrungen
Senior MLOps- und DevOps-Engineer
Trianel Energy
- Aufbau und Betrieb einer End-to-End-MLOps-Plattform auf Azure ML und Kubernetes (Kubeflow) zur automatisierten Bereitstellung, Überwachung und Skalierung von Forecasting-Modellen (u. a. Temporal Fusion Transformer, Informer, Autoformer).
- Implementierung von CI/CD-Pipelines in Azure DevOps für den vollständigen ML-Lifecycle – von Resourcenbereitstellung (Terraform), Datentransformation (Hugging Face Datasets, Pandas, PyTorch, CUDA cluster) über Training und Evaluation bis hin zu Model Registry und Endpoint Deployment.
- Integration von MLflow für experiment tracking, Modellversionierung, Performance-Monitoring und automatisierte Registrierung im Azure Model Registry.
- Entwicklung und Containerisierung von PyTorch-Trainingsjobs (Azure Notebook, Jupyter Notebooks) für Preis- und Zeitreihenprognosen (PFC-Modelle) mit automatischem Rollout über Azure ML Endpoints und REST/gRPC-Schnittstellen, Docker-Containerisierung, Absicherung über OAuth 2.0.
- Einrichtung von Monitoring- und Alerting-Mechanismen (Prometheus, MLflow Metrics), Log Zentralisierung und Kostenüberwachung.
- Automatisierung der Infrastruktur-Provisionierung und Modellbereitstellung mittels Terraform, Helm und Azure CLI; Anbindung an bestehende Marktdatensysteme und Event-Pipelines.
- Migration bestehender Workloads und Datenbanken (IONOS → Azure, MongoDB) mit Integration in zentrale MLOps-Workflows und interne Netzwerke.
- Erweiterung der Plattform um LLM-basierte Tools (LangChain, LangServe) zur Integration von GPT-basierten Analysemodulen in bestehende Spring-Boot-Dienste für Marktanomalie-Erkennung und automatisierte Reports.
- Analyse, Architektur einer Softwarelösung um effizient Massendaten (>3000 Nachrichten/Sek.) zu verarbeiten (market data store).
- Spring Boot / Java 21 Container-Entwicklung mit RabbitMQ zur Verteilung von Börsendaten über die MongoDB (Kubernetes) mit Schnellspeicherung von Daten in Redis RMaps, Deduplizierung Forwarding von Nachrichten an Read Model Queues Aufbau von Read Models für UI Anzeige in MongoDB.
- Einbindung von RESTHeart zur Erzeugung einer REST API gegen MongoDB.
- Aufbau eines Angular Frontends zur Vereinfachung der Datenabfrage und Stammdatenpflege.
- Agentic coding mit remote und local LLM (Claude Sonnet, Ollama Qwen) und MCP-Servern.
- Entwicklung von Python-Skripten zur Transformation und Bereinigung eingehender Börsendaten (Pandas, scikit-learn).
Senior DevOps Engineer und Plattform-Architekt
Mynaric Laser Communications AG
- Architektur und Design einer DevOps / Deployment Plattform.
- Aufbau einer DevOps und Software Deployment Platform basierend auf Azure AKS und AWS ECS/EKS, Gitlab Enterprise, Ansible.
- Migration von VMWare Workloads zu Azure AKS und AWS EKS.
- Konfiguration und Deployment von Anwendungen mit Microsoft Entra (Entra App registrations, app roles, published Web APIs mit OAuth authentication und authorization).
- Entwicklung von Typescript Backend Services (Serverless).
- GraphQL-API-Entwicklung gegen Neo4J Datenbank.
- Scripting von Ansible Playbooks und Inventory-Einrichtung für VMWare-managed virtuelle Maschinen.
- Automatisiertes Deployment von Playbooks über Ansible Control Tower (OpenSource Variante AWX) für Unix Instanzen.
- Einrichtung von GitOps über GitLab, Entwicklung von GitLab Pipelines.
- Infrastrukturdeployment auf Azure mittels Pulumi und Terraform.
- Agile team work, SCRUM.
Senior MLOps- und DevOps-Engineer und Plattform-Architekt
Dyrisk GmbH / MunichRE
- Aufbau und Betrieb einer unternehmensweiten MLOps-Infrastruktur auf Azure Databricks zur Automatisierung des gesamten ML-Lifecycles von Datenverarbeitung bis Modellbereitstellung.
- Implementierung skalierbarer ETL-/ELT-Pipelines mit Airflow und Databricks zur kontinuierlichen Versorgung von Trainings- und Inferenzpipelines mit bereinigten Risikodaten.
- Automatisierung von Trainings-, Evaluations- und Deployment-Pipelines mit MLflow, Azure DevOps und Databricks Workflows inklusive automatischer Modellregistrierung, Versionierung und Promotion zwischen Stages.
- Containerisierung und Bereitstellung trainierter Modelle als skalierbare REST-/gRPC-Services über Azure ML Endpoints und Kubernetes; Integration in produktive Risiko- und Sicherheitsplattformen.
- Einrichtung von Infrastructure-as-Code-Provisionierung mit Terraform, Helm und Kustomize für reproduzierbare Deployments, inklusive Monitoring-, Logging- und Security-Komponenten.
- Implementierung von End-to-End-Monitoring mit Prometheus, Grafana und Elastic Stack (Beats, Logstash) zur Nachverfolgung von Pipeline-Performance, Modellmetriken und Systemstatus.
- Aufbau einer sicheren Authentifizierungs- und Zugriffsinfrastruktur (Keycloak, OAuth 2.0, OIDC, JWT) für APIs und interne MLOps-Services.
- Entwicklung und Integration von .NET Core Microservices zur Bereitstellung von Modell-APIs und Service-Orchestrierung im Produktivbetrieb.
- Konzeption und Umsetzung von CI/CD-Pipelines (Azure DevOps, GitLab CI) für automatisiertes Testing, Container-Builds, Release-Management und Deployment auf Multi-Cloud-Umgebungen.
- Monitoring, Logging und Incident-Handling für produktive Machine-Learning-Workloads in On-Premises- und Cloud-Umgebungen.
- Zentrale SSH- und Zugriffsverwaltung über Teleport zur Sicherstellung von Compliance und Auditfähigkeit.
- Agile Teamarbeit im SCRUM-Prozess mit enger Abstimmung zwischen Data Engineering, MLOps und DevOps.
Senior AWS Cloud-Experte und Digital Transformation-Architekt
EnBW Energie Baden-Württemberg
- Einrichtung, Konfiguration Red Hat OpenShift, Deployment Monitoring, Alerting, DB Operator, Nginx-Ingress Controller.
- Entwicklung von Java (Spring Boot / Spring Cloud) AWS Lambda Mikroservices, OpenAPI API First Entwicklung.
- Docker-Containerisierung von Mikroservices, Docker-Compose- Definitionen für lokale Entwicklung und Tests.
- Erstellung automatisierter Unit-Tests unter Verwendung von AWS LocalStack.
- Entwicklung eines Angular 12 / Typescript Frontends zur Anzeige automatisierter Energiehandel und manueller Intervention, Korrektur.
- Entwicklung von Streaming-Connectoren für AWS MSK (managed Kafka), Automatisierung der Verarbeitung von Marktplatz- Handels-Streaming-Nachrichten.
- Einrichtung einer AWS-Basisressourcenpipeline und pro- Mikroservice-Pipeline zur Automatisierung der Infrastrukturerstellung mit AWS CDK, EKS-Cluster-Einrichtung mit externer DNS, AWS Load Balancer Controller für automatische Lastenausgleichs- und Route53-Einrichtung.
- Einrichtung von EC2 Instanzen per Terraform, Zugriff per AWS SSM.
- Integration mit AWS IAM und Cognito (Single Sign-On), Erfahrung mit AWS Control Tower und VPC-Vernetzung über Transit Gateway Attachments.
- Helm Chart-Entwicklung für automatisierte OpenShift-Bereitstellung.
- OpenAPI-First-Ansatz für Backend-Services und Swagger UI- Integration an Backend-Endpunkten.
- Agile team work, SCRUM Zeremonien, bi-weekly sprints.
Senior Cloud-Architekt und Fullstack-Ingenieur
Bayer AG, Digital Farming
- Entwicklung einer Feld- und Pflanzenmanagementlösung für große landwirtschaftliche Unternehmen, bestehend aus auf AWS Lambda basierenden .NET Core (C#) Mikroservices, unterstützt von domänengesteuertem Design und Ereignisquellen, sowie 2 Frontend-Lösungen (Angular für das Web, Xamarin (jetzt MAUI) als plattformübergreifende mobile Managementlösung.).
- Frontend Typescript Entwicklung (Angular), Frontend .NET Standard Entwicklung (Xamarin) Teil eines vollständig interdisziplinären Teams, verantwortlich für die Umsetzung aller technischen Komponenten einer Anforderung (z. B. Frontend-Änderungen, Backend-Entwicklung einschließlich Terraforming und CI/CD-Einrichtung, automatisierte Unit-Tests und Sonar-Qualitätskontrollen).
- Vollständig entkoppelte Architektur unter Verwendung von SQS, DynamoDB, API Gateway, Route53, AWS Lambda, .NET IDP mit Azure AD-Föderation und Authentication / Autorisation JWT.
- GraphQL-API-Entwicklung (Stitching) über mehrere Backend- Farming-Datenquellen (Wetterprognosen, Spraying-Empfehlungen, Befallsdaten).
- Entwicklung eines .NET Core CLI zur technischen Verwaltung der digitalen Landwirtschaftsplattform.
- iOS / Android plattformübergreifende Entwicklung (Xamarin), Push- Integration, Kartografie unter Verwendung von Carto-Karten, inkl. Entwicklung eines Anpassungsplugins für VS Code, das JavaScript mit C# über den V8-Engine verbindet.
- GitLab CI-Pipeline-Entwicklung.
- Raygun-Integration für zentrales Logging.
- Agile team work, SCRUM Zeremonien, bi-weekly sprints.
Senior Cloud-Entwickler
Otis France
- Entwicklung von Anwendungen für den Außendienst (Kony-Plattform iOS und Android) und Backend-Endpunkten (Java Spring Boot, Spring Cloud).
- Integration interner APIs (Asset Management, Field Service Management).
- Entwicklung von Azure Functions, Function Apps (C#).
- ASP.NET MVC-Administrationsoberflächenentwicklung.
- Azure DevOps (Team Foundation Server) Pipeline-Entwicklung.
- Oracle 12 PL/SQL-Entwicklung, Datenbankdesign und -wartung.
Technischer Projektleiter
Mobility Media-Saturn E-Business GmbH
- Technischer Leiter für die Bewertung, Auswahl und Implementierung einer Mobilitätsplattform (MDM und MAM), Einrichtung eines unternehmensinternen App Stores und BYOD-Richtlinien.
- Kony Plattform Entwicklung verschiedenster Apps auf Basis der Kony Plattform / Cross-Plattform Entwicklung in JavaScript für Android, iOS und Windows Tablet.
- MC@POS → Kony App zur Benutzung in den Märkten, Artikelvergleich, Artikelbestand, Preise, Online-Bestellungen im Store.
Technischer Teamleiter, Senior-Entwickler, Enterprise-Architekt für den CRM-Bereich
Telefonica 02 Germany GmbH & Co KG
- CRM- und Auftragsmanagement-Anwendungsteamleiter, CRM Domain Enterprise Architect, Entwickler und Schnittstelle zu Geschäfts- und Betriebsinteressengruppen sowie leitendem Management.
- Entwicklung von Serviceanfragen, Integration von über 40 Systemen in der gesamten Bereitstellungs- und Abrechnungslandschaft.
- Middleware Anbindungen via Tuxedo, MQSeries, WebLogic und WebSphere.
- UI-Entwicklung, Backend-Entwicklung (auf Oracle basierend und Java-Server-basiert) Integration mit Middleware-Systemen wie RabbitMQ und Tibco sowie Tuxedo (REST-, SOAP-basierte Systeme und Datenbank- Connectoren).
- Leitung eines komplexen Fat-Client-Upgrades, das VBA-Anpassungen Anpassungen ermöglichte, aber auf 32-Bit-Beschränkungen stieß; Aktualisierung auf den Microsoft VSTA-Motor (einzigartiges Projekt weltweit!).
Technischer Teamleiter, Senior-Entwickler
Deutsche Bahn AG
- Entwicklung einer HR-Plattform und eines E-Recruiting-Spiegels auf der "Internet"-Seite basierend auf PeopleSoft HCMS.
- Entwicklung eines Ticketing-Systems auf Basis von JBoss (Backend), Apache MyFaces UI.
- Entwicklung des Deutsche Bahn Enterprise Portals (mitarbeiterorientiert).
- Broker-Messaging-Entwicklung, asynchrone Nachrichtenübermittlung.
- Entwicklung von Anwendungsläufen im Batchmodus.
Anwendungsentwickler
Telefonica 02 Germany GmbH & Co KG
- WebLogic 5.1 Java Entwicklung, EJB Entwicklung.
- Entwicklung eines JSP-based frontends.
- PoC Setup des Oracle 8i jServer.
- Migration von Webanwendungen auf WebLogic 6.0.
- Win32 API Entwicklung.
- Vantive 8.2 frontend-Entwicklungsunterstützung.
Zusammenfassung
Leidenschaftlicher Senior MLOps-, DevOps- und Cloud/Platform Engineer mit umfassender Erfahrung in der Entwicklung und dem Betrieb skalierbarer Plattformen sowie KI-gestützter Lösungen. Expertise im Aufbau von End-to-End-MLOps-Workflows: Datenaufbereitung (ETL/ELT-Pipelines), Entwicklung von ETL-/ELT-Pipelines in Python (Pandas, PySpark, Airflow, Dask), Experiment-Tracking und Modellversionierung mit MLflow, Nutzung von Azure Databricks Data Lake für Data Engineering und Training, Feature Stores (Feast) und automatisiertes Deployment trainierter Modelle als Services.
Erfahren in der Umsetzung von Continuous Training- und Delivery-Pipelines (CI/CD) für ML- und Softwarekomponenten unter Einsatz von GitLab CI/CD, Azure DevOps, KubeFlow.
Fundierte Kenntnisse in Virtualisierung und Container-Orchestrierung (Kubernetes: OpenShift, EKS, AKS, OVH Kubernetes, Docker) und Infrastructure as Code mit Terraform und Ansible. Stark in Observability, klassiches und Model Monitoring mit Prometheus, Grafana sowie klassischen Logging-Stacks (Loki, ELK, DataDog). Routiniert in der Backend-Entwicklung mit C#, Java, Typescript, Python und Bash-Scripting sowie SQL und nicht SQL Datenbanken.
Fähigkeiten
- Programmierung & Frameworks: C# .Net Core, Java (Spring Boot, Spring Cloud, J2ee), Golang, Python (Pandas, Numpy, Scikit-learn, Tensorflow, Pytorch), Bash-scripting
- Frontend & Plattformübergreifend: Typescript, Angular, React, Macos, Xamarin, Maui
- Cloud- & Container-plattformen: Aws, Azure, Ovh, Gcp, Docker, Kubernetes, Aks, Eks, Red Hat Openshift, Vmware Tanzu, Cluster Controller, Cluster Operator
- Infrastruktur Als Code & Ci/cd: Terraform, Ansible, Pulumi, Kustomize, Helm Charts, Github Actions, Gitlab Ci, Azure Devops, Argocd, Flux, Jenkins-pipelines
- Messaging, Daten & Datenbanken: Rabbitmq, Redis, Mongodb, Neo4j, Sql, Oracle, Aws Msk (Managed Kafka)
- Observability & Logging: Prometheus, Grafana, Elasticsearch, Kibana, Beats, Loki, Datadog
- Mlops & Data Engineering: Mlflow, Azure Databricks, Apache Spark, Feast, Dvc
- Machine Learning & Ki: Xgboost, Scikit-learn, Hugging Face Transformers
Sprachen
Ähnliche Freelancer
Entdecken Sie andere Experten mit ähnlichen Qualifikationen und Erfahrungen.