Serge K. - Senior DevOps (extern)

Zur Website

München, Deutschland

Erfahrungen

Apr. 2022 - Bis heute

3 Jahren 7 Monaten

Karlsruhe, Deutschland

Senior DevOps (extern)

Atrvivia AG

Entwicklung der Data Integration Hub Plattform (DIH) im Rahmen eines Data Governance Projekts. DIH ist das zentrale Architektur-Element zum Austausch von Daten zwischen Mandanten. Es basiert hauptsächlich auf Beschreibungen der Datenprodukte (Spezifikationen), Data-Katalogen und Services, um gemeinsame Daten darzustellen.
Ein typischer Workflow hat folgende Schritte:
Einspeisung der Datenproduktbeschreibung über REST API oder Swagger UI.
Metadaten werden in Kafka Topics geschrieben.
Kafka-Consumer lesen die Daten und führen Aktionen aus, wie z.B. Anlegen von Metadaten in Datahub, Erstellen von Tabellen in Trino, Anlegen vordefinierter Verzeichnisstrukturen auf S3, Anlegen von Policies usw.
Mein Schwerpunkt war:
Implementierung von Single Sign-On in Services basierend auf JWT Tokens.
Entwicklung von REST APIs.
Entwicklung von Integrationswerkzeugen zwischen Softwarekomponenten (SelfService, Trino, S3, Datahub, Great Expectations usw.).
Entwicklung von Data Quality Validierungsdiensten.
Entwicklung von ETL-Pipelines.
Onboarding neuer Kunden.
Entwicklung von Monitoring-Systemen.
Fehlersuche und Support von Services und Kunden.
Folgende Software-Stack wurde verwendet:
CI/CD: OpenShift (Kubernetes), Helm, Docker, Git, Tekton, ArgoCD.
Data-Kataloge und Data Lineage: Datahub, OpenLineage; mit Integrationen zu Spark, Pandas. Services wurden in Python umgesetzt.
SQL-Engines: Trino mit Starburst Web UI, PostgreSQL, Hadoop, DB2, Delta Lake.
Data Quality: Great Expectations.
REST API: Java, Swagger, Springboot.
Authentifizierung: JWT, OAuth2, Single Sign-On.
Apache Ranger für Access-Policy-Management.
Prometheus und Grafana für Monitoring.
Zertifizierung: AWS Certified Data Engineer - Associate.

Okt. 2021 - Apr. 2023

1 Jahr 7 Monaten

Hamburg, Deutschland

Senior DevOps (extern)

Otto GmbH & Co KG

Konzeption und Implementierung datengetriebener Microservices zur Optimierung der Suchmaschine (Google) mit AWS Services. Die Services folgen meist ETL-Mustern. Ein typischer Service bezieht Daten aus einer Quelle (REST API, SQS, DynamoDB etc.), transformiert sie (z.B. Berechnung von Änderungen in einer Liste gegenüber den Vortagen) und lädt Ergebnisse in ein Backend (S3, Datenbank).
Service I (MLOps). Bewertung von OTTO-Seiten durch Extraktion relevanter Keywords, die den Seiteninhalt beschreiben, und Abgleich mit Google-Suchen. Migration der Datenverarbeitung, Modelltraining und -retraining sowie des Modells in Produktion von GCP zu AWS. Design und Implementierung von Workflows.
Einsatz von GitHub Actions als CI/CD-Pipelines.
Einsatz von Terraform zur Verwaltung von Cloud-Ressourcen (Erstellung von Containern, Load Balancing für Modellinstanzen etc.).
Implementierung von Model Validations und Testing mit Python.
Implementierung von Modell-Monitoring mit Grafana.
Service S
Millionen von REST API-Aufrufen pro Stunde mit AsyncIO.
Parsing verschachtelter JSON-Daten und Filterung.
Speicherung der Ergebnisse auf S3.
Sprachen: Python, Java, TypeScript, Kotlin.
Monitoring: CloudWatch, Grafana, Tableau.
Datenbanken: MongoDB, DynamoDB, PostgreSQL, Exasol.
Message Processing: SNS, SQS.
Provisioning: Terraform, Pulumi, Serverless (CloudFoundation).
Container: Docker, ECR, ECS.
Unit Tests: PyTest.

Juli 2018 - Sept. 2021

3 Jahren 3 Monaten

Köln, Deutschland

Hybrid

Senior Big Data Consultant (extern)

REWE Systems GmbH

Konzeption und Umsetzung hybrider Umgebungen auf Google Cloud Platform.
Bereitstellung der GCP-Infrastruktur mit Terraform und später mit Ansible.
Redundante Anbindung und Verschlüsselung der Daten zwischen GCP und On-Premise-Systemen.
Provisionierung von MapR- und Spark-Umgebungen auf GCP.
Einrichtung der Echtzeit-Datenreplikation von On-Premise-Tabellen zu GCP.
Integration mit REWE-Diensten (ActiveDirectory, DNS, Instana etc.).
Entwicklung von REST APIs für Machine-Learning-Modelle mit Flask.
Implementierung von persistentem Storage auf MapR für Kubernetes-Cluster.
Betrieb von MapR-Clustern: Updates, Erweiterungen, Fehlerbehebung von Services und Anwendungen.
Synchronisierung eines Kafka-Clusters mit MapR Streams über Kafka Connect.
Design und Implementierung von ETL-Pipelines, Synchronisation und Integration von MapR-Clustern mit verschiedenen Datenquellen (z.B. DB2 und Teradata Data Warehouses).
Onboarding neuer interner REWE-Kunden auf MapR-Plattformen.
Beratung des Managements zu technischen Themen und Zukunftsentwicklungen im Big-Data-Bereich.
Vorschläge für Sicherheitslösungen (z.B. eingeschränkte Delegierung auf F5 oder Authentifizierung für OpenTSDB) und PoCs.
Entwicklung in Data-Science-Projekten.
Entwicklung von Modellen zur Marktkategorisierung.
Visualisierung von Daten und Vorhersagen mit Jupyter und Grafana.
Integration mit JIRA.
3rd-Level-Support.

Sept. 2016 - Mai 2018

1 Jahr 9 Monaten

München, Deutschland

Senior Big Data Architect

Allianz Technology SE

Management einer großskaligen, mandantenfähigen, sicheren und hochverfügbaren Hadoop-Infrastruktur zur schnellen Datenverarbeitung für eine Vielzahl innovativer Kunden.
Pre-Sales: Onboarding neuer Kunden.
Architekturberatung, Planung, Kapazitätsschätzung und Roadmap-Erstellung für Hadoop-Cluster-Deployments.
Design, Implementierung und Wartung von unternehmensweiten Sicherheitsumgebungen für Hadoop (Kerberos, LDAP/AD, Sentry, Verschlüsselung in Transit, Verschlüsselung at Rest).
Installation und Konfiguration von Hadoop-Mandantenumgebungen, Updates, Patches, Versions-Upgrades.
Erstellung von Runbooks für Fehlersuche, Cluster-Wiederherstellung und Routinewartung.
Fehlerbehebung bei Hadoop-Anwendungen, Komponenten und Infrastrukturproblemen in großem Maßstab.
3rd-Level-Support (DevOps) für geschäftskritische Anwendungen und Use Cases.
Evaluierung und Vorschlag neuer Tools und Technologien zur Unterstützung der globalen Allianz-Organisation.
Enge Zusammenarbeit mit Infrastruktur-, Netzwerk-, DB-, Applikations-, BI- und Data-Science-Teams.
Entwicklung in Fraud-Detection-Projekten einschließlich Machine Learning.
Design und Aufbau einer Microsoft Revolution (Microsoft R Open) Data-Science-Plattform für Modelltraining auf Microsoft Azure und On-Premise für Fraud Detection mit Docker und Terraform.
Entwicklung in Supply-Chain-Analytics-Projekten (z.B. GraphServer für Graph-Queries auf in HDFS gespeicherten Daten).
Umstellung interner Teamprozesse auf Agile/SCRUM.
Entwicklung von Kafka-basierten Use Cases.
ClickStream:
Producer: Aggregator für gestreamte URLs von Webseiten über REST API oder andere Quellen (z.B. Oracle).
Consumer: Flink-Job, der nach Pre-Processing (Sanity Check, Extraktion von Zeitinformationen) Daten als XML-Dateien in HDFS speichert.
Verwendeter Stack für ClickStream: Java, Kafka, Cloudera, SASL, TLS/SSL, Sentry, YARN, Flink, Cassandra.
Dokumentenklassifikation:
Producer: Custom Producer, der Dokumente aus einem Shared File System liest und in Kafka schreibt.
Consumer: Spark Streaming-Job, der nach Pre-Processing Dokumente an die UIMA-Plattform zur Klassifizierung sendet. Nach der Klassifizierung werden die Daten in HDFS für weitere Batch-Verarbeitung gespeichert.
Verwendeter Stack für Dokumentenklassifikation: Java, Kafka, Spark (Streaming), Cloudera, SASL, TLS/SSL, Sentry, YARN, UIMA.
Graph-Datenbank (PoC): Verwaltung von Graphen über eine Kafka-Schnittstelle.
Producer: Twitter, News-Agenturen-Seiten usw.
Consumer: Wandelt Artikel und Nachrichten in Graph-Queries um und führt sie mit Gremlin auf Graphen aus.
Verwendeter Stack für Graph-Datenbank (PoC): Java, Python, Kafka, Cassandra, Gremlin, Keylines (für Graph-Visualisierung; JavaScript), Google Cloud.

Juni 2014 - Juli 2016

2 Jahren 2 Monaten

Berlin, Deutschland

Systemarchitekt

WebThe Unbelievable Machine Company GmbH

Sept. 2012 - Juni 2014

1 Jahr 10 Monaten

Köln, Deutschland

Systembetrieb

Werkenntwen GmbH

Jan. 2009 - Sept. 2012

3 Jahren 9 Monaten

Wuppertal, Deutschland

Postdoc

Bergische Universität Wuppertal

Okt. 2006 - Dez. 2008

2 Jahren 3 Monaten

Aachen, Deutschland

Postdoc

Rheinisch-Westfälische Technische Hochschule

Sprachen

Russisch

Muttersprache

Deutsch

Verhandlungssicher

Englisch

Verhandlungssicher

Französisch

Verhandlungssicher

Ausbildung

Jan. 2001 - Sept. 2006

Université catholique de Louvain-la-Neuve

Doktor · Ottignies-Louvain-la-Neuve, Belgien

Sept. 1998 - Juni 2000

Moscow Institute of Physics and Technology

Hochenergiephysik · Dolgoprudny, Russische Föderation

Sept. 1994 - Juni 1998

Moscow Institute of Physics and Technology

Hochenergiephysik · Dolgoprudny, Russische Föderation

Zertifikate & Bescheinigungen

AWS Certified Data Engineer - Associate

AWS

Sie suchen Freelancer?Passende Kandidaten in Sekunden!

FRATCH GPT testen

Erfahrungen

Senior DevOps (extern)

Atrvivia AG

Senior DevOps (extern)

Otto GmbH & Co KG

Senior Big Data Consultant (extern)

REWE Systems GmbH

Senior Big Data Architect

Allianz Technology SE

Systemarchitekt

WebThe Unbelievable Machine Company GmbH

Systembetrieb

Werkenntwen GmbH

Postdoc

Bergische Universität Wuppertal

Postdoc

Rheinisch-Westfälische Technische Hochschule

Sprachen

Ausbildung

Université catholique de Louvain-la-Neuve

Doktor · Ottignies-Louvain-la-Neuve, Belgien

Moscow Institute of Physics and Technology

Hochenergiephysik · Dolgoprudny, Russische Föderation

Moscow Institute of Physics and Technology

Hochenergiephysik · Dolgoprudny, Russische Föderation

Zertifikate & Bescheinigungen

AWS Certified Data Engineer - Associate

AWS

Ähnliche Freelancer

Senior Data/ML-Berater & Technischer Leiter

Data Scientist & KI Ingenieur & KI Architekt

Cloud-Architekt & DevOps, Leiter Architektur

Senior Data Engineer

Cloud-Software-Ingenieur

Freiberuflicher Datenarchitekt

Produktverantwortlicher für Cloud-Datenplattform & Projektmanager

Technischer Product Owner – KI- & Datenplattform auf AWS

Dateningenieur

Freiberuflicher Senior Backend-Entwickler

Einstellungsanforderung

Entwicklung einer umfassenden Datenstrategie und eines Governance-Frameworks für eine Datenmanagementplattform auf Databricks

Geschäftsführer

AR/VR/XR-Architekt

Cloud Analytics-Entwickler