End-to-end MLOps-Entwicklung: Orchestrierung des Modelltrainings und der Bereitstellung mit Databricks, CI/CD und Azure ML, einschließlich Drift-/Bias-Monitoring, Batch- und Online-Inferenz mit Azure DF, MLflow, FastAPI und Azure ML
KI-Engineering-Framework: Konzeption und Pflege modularer Python-Bibliotheken zur Standardisierung von KI-Workflows, was die Entwicklung erleichtert, konsistente Best Practices sicherstellt und Data Scientists unterstützt
Azure-Daten-Engineering: Aufbau und Pflege skalierbarer ETL- und Batch-Processing-Pipelines in Databricks und Azure; Verbesserung der Zuverlässigkeit durch Partitionierung, Katalogstrukturen und automatisierte Workflows mit CI/CD
Azure-Cloud-Infrastruktur & Sicherheit: Verwaltung von Databricks-Clustern und Azure ML Compute, Konfiguration von Data Factory & Linked Services, Verwaltung von Key Vault-Geheimnissen und Aktivierung von CI/CD
Juni 2024 - Jan. 2025
8 Monaten
Madrid, Spanien
Machine-Learning-Ingenieur
BNP Paribas
Tool zur Modell- und Datensatzüberwachung: Leitung des Projekts für ein Drift-Monitoring-Tool für ML-Modelle und Datensätze, Implementierung der Drift-Erkennung, Automatisierung von Tests mit PyTest, Optimierung von Metrik-Schwellenwerten und Entwicklung eines Dashboards zur Echtzeit-Überwachung
Modell zum Schutz vor Datenlecks: Mitwirkung am Training und an der Industrialisierung eines Soft-Classification-Modells zur Erkennung und Verhinderung unbefugter Datenexfiltration, zur Stärkung der Datensicherheit und Compliance
Kubernetes ML-Lifecycle: Containerisierung und Bereitstellung von Machine-Learning-Modellen auf Kubernetes-Clustern, Orchestrierung von Training, Batch-Scoring und Online-Inferenz mit Kubeflow
Entwicklung eines Git-Monitoring-Tools: Konzeption und Implementierung einer Lösung zur automatischen Extraktion und Verarbeitung von Projekt-, Branch- und Pipeline-Daten aus GitLab mit asyncio und aiohttp, erreicht eine 80%-Beschleunigung
Apr. 2023 - Jan. 2024
10 Monaten
Madrid, Spanien
KI- und Data Engineer
Telefónica
Entwicklung von Large Language Models: Bereitstellung eines Open-Source-LLM auf AWS SageMaker, Aufbau einer RAG-App mit LangChain und Feinabstimmung mit QLora, um LLM-Antworten auf unternehmensspezifische Aufgaben abzustimmen
LLM-Integration mit AWS-Services: Entwicklung serverloser Lösungen mit AWS Lambda und Integration des Open-Source-LLM in Amazon Lex zur Optimierung der Interaktionen und Bereitstellung kuratierter Antworten
Elasticsearch und Kibana: Integration von Elasticsearch in eine Microservices-Architektur über REST-APIs und Erstellung interaktiver Dashboards für Großkunden (Lanxess, Aldi) zur Unterstützung strategischer Entscheidungen