Jens Daube

Produktverantwortlicher und Senior Data Scientist

Frankfurt, Deutschland
Erfahrungen
Juni 2023 - Bis heute
2 Jahren 2 Monaten
Frankfurt, Deutschland

Product Owner & Senior Data Scientist

Legal Tech

  • Leitung eines internationalen sechsköpfigen Entwickler-Teams im Scrum-Umfeld
  • Festlegung der strategischen Ziele für das Projekt in Abstimmung mit den Stakeholdern und dem Entwicklungsteam
  • Prompt Engineering für Sprachmodelle zur Verbesserung der Genauigkeit und Relevanz der generierten Antworten
  • Implementierung von LangChain Komponenten eines RAG Chatbots zur Beantwortung rechtlicher Fragen
  • Technologien: GPT-4, LangChain, Python (Pandas, sklearn, streamlit), Docker, GitLab, ChromaDB
Mai 2023 - Apr. 2024
1 Jahr
Frankfurt, Deutschland

Senior Data Scientist

Zentralbank

  • Entwicklung einer skalierbaren und leistungsfähigen Enterprise-Search Lösung
  • Implementierung eines Retrieval-Augmented Generation (RAG) Modells, um valide und kontextbezogene Antworten auf Benutzeranfragen zu Dokumenten zu liefern
  • Implementierung und Verwaltung von Messaging Queues zur Gewährleistung der zuverlässigen und skalierbaren Datenverarbeitung und -übertragung zwischen verschiedenen Systemkomponenten
  • Erstellung von RESTful APIs zur Bereitstellung der Suchfunktionalitäten und Integration der Enterprise-Search Lösung in bestehende Anwendungen und Systeme, einschließlich Sicherheits- und Authentifizierungsmechanismen
  • Technologien: ElasticSearch, Kibana, LLaMA, SQL, FastAPI, Docker, Python (Pandas, sklearn, PyTorch), HuggingFace
Sept. 2022 - Apr. 2023
8 Monaten
GG

Senior Data Scientist

Finanzaufsichtsbehörde

  • Entwicklung und Implementierung eines Frühwarnsystems basierend auf strukturierten und unstrukturierten Daten zur Überwachung des Ausfallrisikos von Fonds
  • Entwicklung eines Chatbots für die Aufsichtsbehörde auf der Grundlage von GPT-4 zur Beantwortung von Fragen zu Jahres- und Quartalsberichten
  • Implementierung und Konfiguration automatisierter CI/CD-Pipelines zur Automatisierung von Build-, Test- und Deploy-Prozessen
  • Enge Zusammenarbeit mit Fachexperten, um die Anforderungen an das Frühwarnsystem zu verstehen
  • Technologien: GPT-4, LangChain, Python (Pandas, NumPy, PyTorch, sklearn), SQL, GitLab, Docker, Kubernetes, Apache Spark, ChromaDB
Dez. 2021 - Aug. 2022
9 Monaten
Berlin, Deutschland

Senior Data Scientist

Öffentliche Behörde

  • Leitung des Projekts, regelmäßige Abstimmungen mit dem Kunden und Sicherstellung der Erfüllung aller Anforderungen und Erwartungen
  • Entwicklung und Training von Modellen zur Analyse von Wirtschafts- und Finanzmarktberichten
  • Optimierung der Modellleistung durch Hyperparameter-Tuning und Implementierung von Feature Engineering und Regularisierung
  • Zusammenarbeit mit Experten zur Validierung der Modellergebnisse und zur Anpassung an spezifische Anforderungen der Behörde
  • Technologien: Python (Pandas, Numpy, SpaCy, sklearn, Keras), HuggingFace, GitLab, Docker
März 2021 - Nov. 2021
9 Monaten
Salzburg, Österreich

Senior Data Scientist

Getränkehersteller

  • Tiefgehende Untersuchung historischer Verkaufsdaten, um Muster, Trends und saisonale Schwankungen zu identifizieren, die die Absatzzahlen beeinflussen könnten
  • Nutzung von Zeitreihenanalyse-Techniken wie ARIMA, Exponential Smoothing sowie fortschrittlicher ML-Modelle wie Random Forests oder LSTM zur Verbesserung der Vorhersagegenauigkeit der Absatzzahlen
  • Einbindung zusätzlicher Daten wie Wetterdaten oder Marketingkampagnen, um die Genauigkeit der Absatzprognosen weiter zu verbessern
  • Durchführung von Sensitivitätsanalysen und Szenario-Modellierungen, um potenzielle Risiken und Chancen frühzeitig zu identifizieren und entsprechende Strategien zu entwickeln
  • Technologien: Python (Pandas, NumPy, seaborn, sklearn), GCP (Dataproc, BigQuery, Cloud Functions, Vertex AI), SQL, GitLab
Mai 2020 - Feb. 2021
10 Monaten
Zürich, Schweiz

Senior Machine Learning Engineer

Universalbank

  • Entwicklung und Implementierung von Preprocessing-Pipelines zur Standardisierung und Strukturierung der Kommunikationsdaten von Tradern
  • Nutzung des vortrainierten FinBERT-Modells zur Generierung von Word-Embeddings aus finanzbezogenen Texten
  • Entwicklung und Implementierung von Modellen zur Netzwerkanalyse, Anomalieerkennung und zum Clustering
  • Entwicklung und Automatisierung von End-to-End-Workflows für das Training, die Validierung und das Deployment der Modelle
  • Technologien: Python (SpaCy, sklearn, TensorFlow), Hugging Face, SQL, ElasticSearch, Docker, Kubernetes, GitHub, Jenkins, MLflow
Okt. 2019 - Apr. 2020
7 Monaten
Utrecht, Niederlande

Data Scientist

Behörde für Verkehrsdaten

  • Entwurf und Implementierung von Cloud-basierten Systemarchitekturen mit Azure
  • Einrichtung und Konfiguration von Kubeflow und MLflow zur Verwaltung und Automatisierung von Machine Learning Workflows
  • Erstellung und Training von Machine Learning Modellen zur Identifikation ungewöhnlicher Verkehrsmuster und -situationen
  • Entwicklung und Durchführung von Tests zur Sicherstellung der Funktionalität, Zuverlässigkeit und Sicherheit der entwickelten Lösungen
  • Technologien: Python (TensorFlow, PyTorch, Pandas, NumPy), Azure (Kubernetes Service, DevOps, Storage), Kubeflow, MLflow, Helm
März 2019 - Sept. 2019
7 Monaten
Stuttgart, Deutschland

Machine Learning Engineer

Automobilkonzern

  • Sammlung und Bereinigung historischer Verkaufsdaten sowie externer Faktoren wie Markttrends, Wirtschaftsdaten und saisonale Einflüsse
  • Identifikation und Erstellung relevanter Features zur Verbesserung der Vorhersagegenauigkeit der Modelle
  • Entwicklung und Training verschiedener Machine Learning Modelle zur Vorhersage der Absatzzahlen, einschließlich spezifischer Forecasting-Modelle wie Prophet und ARIMA
  • Implementierung eines Explainable AI Moduls basierend auf SHAP zur Verbesserung der Transparenz und Nachvollziehbarkeit der Modellergebnisse
  • Technologien: Python (Prophet, statsmodels, Keras, Pandas, NumPy, SHAP), SQL, GitLab
Aug. 2018 - Feb. 2019
7 Monaten
Düsseldorf, Deutschland

Data Scientist

Asset Manager

  • Entwicklung dockerisierter Microservices, einschließlich APIs und Testspezifikation zur Erkennung von Named Entities, unter Verwendung und Anpassung von vor- und nachtrainierten KI-Modellen
  • Entwicklung und Implementierung von Modellen zur Berechnung eines Scores für das Sentiment von Fondsberichten
  • Identifikation und Erstellung relevanter Merkmale (Features) aus den Textdaten, die zur Verbesserung der Modellleistung beitragen, sowie Auswahl der wichtigsten Features für das Training der Modelle
  • Optimierung der Hyperparameter durch systematische Suche bzw. durch fortgeschrittene Methoden wie Bayesian Optimization
  • Technologien: Python (Pandas, Numpy, NLTK, SpaCy, Tensorflow), Flask, Azure (Databricks, Cognitive Services, Machine Learning, DevOps)
Jan. 2018 - Juli 2018
7 Monaten
Wien, Österreich

Data Scientist

Universalbank

  • Erstellung eines Workflows zur Verarbeitung von Dokumentendaten, einschließlich nahtloser Integration von OCR- und NLP-Modulen
  • Implementierung von OCR-Algorithmen zur automatischen Texterkennung in verschiedenen Bilddateiformaten (tif, jpg, png), inkl. Containerisierung der OCR-Microservices mittels Docker
  • Implementierung von NLP-Modellen zur Informationsextraktion aus den erkannten Texten
  • Extraktion relevanter Merkmale aus den OCR- und NLP-Daten, die zur Verbesserung der Modellleistung und zur besseren Informationsextraktion beitragen können
  • Technologien: Python (Tesseract, SpaCy, NLTK, Pandas, NumPy), Docker, Kubernetes, GitLab
Juni 2017 - Dez. 2017
7 Monaten
Berlin, Deutschland

Data Analyst

Kreditbank

  • Entwicklung und Validierung von Kreditrisikomodellen in Python, inkl. Implementierung von Monte-Carlo-Simulationen zur Analyse verschiedener Risikoszenarien
  • Verwendung von SQL zur Verwaltung und Abfrage großer Datenmengen, gefolgt von Datenaufbereitung, Bereinigung und explorativer Datenanalyse in Python zur Identifizierung wichtiger Merkmale und Muster
  • Validierung der Modelle durch Backtesting und historische Datenanalyse, gefolgt von Feinabstimmung der Modelle basierend auf den Validierungsergebnissen
  • Integration der entwickelten Modelle in das IT-System der Bank und Bereitstellung für den produktiven Einsatz, inklusive kontinuierlicher Überwachung und Optimierung
  • Technologien: Microsoft SQL, Python (Pandas, NumPy, SciPy, sklearn, Seaborn), GitLab, Docker
Sprachen
Deutsch
Muttersprache
Englisch
Verhandlungssicher
Ausbildung
Feb. 2018 - Nov. 2020

Universität Mannheim

Master in Data Science · Data Science · Mannheim, Deutschland · 1.3

Sept. 2013 - März 2017

Universität Mannheim

Bachelor of Science · Wirtschaftsmathematik · Mannheim, Deutschland · 1.7

Zertifikate & Bescheinigungen

Professional SCRUM Master 1

Sie suchen Freelancer?Passende Kandidaten in Sekunden!
FRATCH GPT testen
Weitere Aktionen