Recommended expert
Jens Daube
Product Owner und Senior Data Scientist
Erfahrungen
Juni 2023 - Bis heute
2 Jahren 8 MonatenFrankfurt, Deutschland
Product Owner und Senior Data Scientist
Legal Tech
- Leitung eines internationalen sechsköpfigen Entwickler-Teams im Scrum-Umfeld
- Festlegung der strategischen Ziele für das Projekt in Abstimmung mit den Stakeholdern und dem Entwicklungsteam
- Prompt Engineering für Sprachmodelle zur Verbesserung der Genauigkeit und Relevanz der generierten Antworten
- Implementierung von LangChain Komponenten eines RAG Chatbots zur Beantwortung rechtlicher Fragen
- Technologien: GPT-4, LangChain, Python (Pandas, sklearn, streamlit), Docker, GitLab, ChromaDB
Mai 2023 - Apr. 2024
1 JahrFrankfurt, Deutschland
Senior Data Scientist
Zentralbank
- Entwicklung einer skalierbaren und leistungsfähigen Enterprise-Search Lösung
- Implementierung eines Retrieval-Augmented Generation (RAG) Modells, um valide und kontextbezogene Antworten auf Benutzeranfragen zu Dokumenten zu liefern
- Implementierung und Verwaltung von Messaging Queues zur Gewährleistung der zuverlässigen und skalierbaren Datenverarbeitung und -übertragung zwischen verschiedenen Systemkomponenten
- Erstellung von RESTful APIs zur Bereitstellung der Suchfunktionalitäten und Integration der Enterprise-Search Lösung in bestehende Anwendungen und Systeme, einschließlich Sicherheits- und Authentifizierungsmechanismen
- Technologien: ElasticSearch, Kibana, LLaMA, SQL, FastAPI, Docker, Python (Pandas, sklearn, PyTorch), HuggingFace
Sept. 2022 - Apr. 2023
8 MonatenSenior Data Scientist
Finanzaufsichtsbehörde
- Entwicklung und Implementierung eines Frühwarnsystems basierend auf strukturierten und unstrukturierten Daten zur Überwachung des Ausfallrisikos von Fonds
- Entwicklung eines Chatbots für die Aufsichtsbehörde auf der Grundlage von GPT-4 zur Beantwortung von Fragen zu Jahres- und Quartalsberichten
- Implementierung und Konfiguration automatisierter CI/CD-Pipelines zur Automatisierung von Build-, Test- und Deploy-Prozessen
- Enge Zusammenarbeit mit Fachexperten, um die Anforderungen an das Frühwarnsystem zu verstehen
- Technologien: GPT-4, LangChain, Python (Pandas, NumPy, PyTorch, sklearn), SQL, GitLab, Docker, Kubernetes, Apache Spark, ChromaDB
Dez. 2021 - Aug. 2022
9 MonatenBerlin, Deutschland
Senior Data Scientist
Öffentliche Behörde
- Leitung des Projekts, regelmäßige Abstimmungen mit dem Kunden und Sicherstellung der Erfüllung aller Anforderungen und Erwartungen
- Entwicklung und Training von Modellen zur Analyse von Wirtschafts- und Finanzmarktberichten
- Optimierung der Modellleistung durch Hyperparameter-Tuning und Implementierung von Feature Engineering und Regularisierung
- Zusammenarbeit mit Experten zur Validierung der Modellergebnisse und zur Anpassung an spezifische Anforderungen der Behörde
- Technologien: Python (Pandas, Numpy, SpaCy, sklearn, Keras), HuggingFace, GitLab, Docker
März 2021 - Nov. 2021
9 MonatenSalzburg, Österreich
Senior Data Scientist
Getränkehersteller
- Tiefgehende Untersuchung historischer Verkaufsdaten, um Muster, Trends und saisonale Schwankungen zu identifizieren, die die Absatzzahlen beeinflussen könnten
- Nutzung von Zeitreihenanalyse-Techniken wie ARIMA, Exponential Smoothing sowie fortschrittlicher ML-Modelle wie Random Forests oder LSTM zur Verbesserung der Vorhersagegenauigkeit der Absatzzahlen
- Einbindung zusätzlicher Daten wie Wetterdaten oder Marketingkampagnen, um die Genauigkeit der Absatzprognosen weiter zu verbessern
- Durchführung von Sensitivitätsanalysen und Szenario-Modellierungen, um potenzielle Risiken und Chancen frühzeitig zu identifizieren und entsprechende Strategien zu entwickeln
- Technologien: Python (Pandas, NumPy, seaborn, sklearn), GCP (Dataproc, BigQuery, Cloud Functions, Vertex AI), SQL, GitLab
Mai 2020 - Feb. 2021
10 MonatenZürich, Schweiz
Senior Machine-Learning-Ingenieur
Universalbank
- Entwicklung und Implementierung von Preprocessing-Pipelines zur Standardisierung und Strukturierung der Kommunikationsdaten von Tradern
- Nutzung des vortrainierten FinBERT-Modells zur Generierung von Word-Embeddings aus finanzbezogenen Texten
- Entwicklung und Implementierung von Modellen zur Netzwerkanalyse, Anomalieerkennung und zum Clustering
- Entwicklung und Automatisierung von End-to-End-Workflows für das Training, die Validierung und das Deployment der Modelle
- Technologien: Python (SpaCy, sklearn, TensorFlow), Hugging Face, SQL, ElasticSearch, Docker, Kubernetes, GitHub, Jenkins, MLflow
Okt. 2019 - Apr. 2020
7 MonatenUtrecht, Niederlande
Datenwissenschaftler
Behörde für Verkehrsdaten
- Entwurf und Implementierung von Cloud-basierten Systemarchitekturen mit Azure
- Einrichtung und Konfiguration von Kubeflow und MLflow zur Verwaltung und Automatisierung von Machine Learning Workflows
- Erstellung und Training von Machine Learning Modellen zur Identifikation ungewöhnlicher Verkehrsmuster und -situationen
- Entwicklung und Durchführung von Tests zur Sicherstellung der Funktionalität, Zuverlässigkeit und Sicherheit der entwickelten Lösungen
- Technologien: Python (TensorFlow, PyTorch, Pandas, NumPy), Azure (Kubernetes Service, DevOps, Storage), Kubeflow, MLflow, Helm
März 2019 - Sept. 2019
7 MonatenStuttgart, Deutschland
Machine-Learning-Ingenieur
Automobilkonzern
- Sammlung und Bereinigung historischer Verkaufsdaten sowie externer Faktoren wie Markttrends, Wirtschaftsdaten und saisonale Einflüsse
- Identifikation und Erstellung relevanter Features zur Verbesserung der Vorhersagegenauigkeit der Modelle
- Entwicklung und Training verschiedener Machine Learning Modelle zur Vorhersage der Absatzzahlen, einschließlich spezifischer Forecasting-Modelle wie Prophet und ARIMA
- Implementierung eines Explainable AI Moduls basierend auf SHAP zur Verbesserung der Transparenz und Nachvollziehbarkeit der Modellergebnisse
- Technologien: Python (Prophet, statsmodels, Keras, Pandas, NumPy, SHAP), SQL, GitLab
Aug. 2018 - Feb. 2019
7 MonatenDüsseldorf, Deutschland
Datenwissenschaftler
Asset Manager
- Entwicklung dockerisierter Microservices, einschließlich APIs und Testspezifikation zur Erkennung von Named Entities, unter Verwendung und Anpassung von vor- und nachtrainierten KI-Modellen
- Entwicklung und Implementierung von Modellen zur Berechnung eines Scores für das Sentiment von Fondsberichten
- Identifikation und Erstellung relevanter Merkmale (Features) aus den Textdaten, die zur Verbesserung der Modellleistung beitragen, sowie Auswahl der wichtigsten Features für das Training der Modelle
- Optimierung der Hyperparameter durch systematische Suche bzw. durch fortgeschrittene Methoden wie Bayesian Optimization
- Technologien: Python (Pandas, Numpy, NLTK, SpaCy, Tensorflow), Flask, Azure (Databricks, Cognitive Services, Machine Learning, DevOps)
Jan. 2018 - Juli 2018
7 MonatenWien, Österreich
Datenwissenschaftler
Universalbank
- Erstellung eines Workflows zur Verarbeitung von Dokumentendaten, einschließlich nahtloser Integration von OCR- und NLP-Modulen
- Implementierung von OCR-Algorithmen zur automatischen Texterkennung in verschiedenen Bilddateiformaten (tif, jpg, png), inkl. Containerisierung der OCR-Microservices mittels Docker
- Entwicklung und Implementierung von NLP-Modellen zur Informationsextraktion aus den erkannten Texten
- Extraktion relevanter Merkmale aus den OCR- und NLP-Daten, die zur Verbesserung der Modellleistung und zur besseren Informationsextraktion beitragen können
- Technologien: Python (Tesseract, SpaCy, NLTK, Pandas, NumPy), Docker, Kubernetes, GitLab
Juni 2017 - Dez. 2017
7 MonatenBerlin, Deutschland
Datenanalyst
Kreditbank
- Entwicklung und Validierung von Kreditrisikomodellen in Python, inkl. Implementierung von Monte-Carlo-Simulationen zur Analyse verschiedener Risikoszenarien
- Verwendung von SQL zur Verwaltung und Abfrage großer Datenmengen, gefolgt von Datenaufbereitung, Bereinigung und explorativer Datenanalyse in Python zur Identifizierung wichtiger Merkmale und Muster
- Validierung der Modelle durch Backtesting und historische Datenanalyse, gefolgt von Feinabstimmung der Modelle basierend auf den Validierungsergebnissen
- Integration der entwickelten Modelle in das IT-System der Bank und Bereitstellung für den produktiven Einsatz, inklusive kontinuierlicher Überwachung und Optimierung
- Technologien: Microsoft SQL, Python (Pandas, NumPy, SciPy, sklearn, Seaborn), GitLab, Docker
Sprachen
Deutsch
MutterspracheEnglisch
VerhandlungssicherAusbildung
Feb. 2018 - Nov. 2020
Universität Mannheim
Master in Data Science · Data Science · Mannheim, Deutschland · 1,3
Sept. 2013 - März 2017
Universität Mannheim
Bachelor of Science Wirtschaftsmathematik · Wirtschaftsmathematik · Mannheim, Deutschland · 1,7
Zertifikate & Bescheinigungen
Professional SCRUM Master 1
Sie suchen Freelancer?Passende Kandidaten in Sekunden!
FRATCH GPT testenWeitere Aktionen
Ähnliche Freelancer
Entdecken Sie andere Experten mit ähnlichen Qualifikationen und Erfahrungen.