Dany D.

Data Scientist/ Statistiker

Witten, Deutschland

Erfahrungen

Feb. 2025 - Bis heute
8 Monaten

Senior Statistiker (Freiberuflich)

Africon GmbH

  • Fahrzeugparkprognose in afrikanischen Ländern (2024–2050)
  • Prognosen zu Entwicklungen des Fahrzeugparks mit detaillierten Visualisierungen und Zusammenfassungen
  • Raum-zeitliche und mehrstufige Rahmenmodelle
Nov. 2024 - Jan. 2025
3 Monaten

Senior Statistiker (Freiberuflich)

3d-statistical-learning.com

  • Statistische Analyse und Beratung für biomedizinische und akademische Forschungsprojekte geleistet
  • Untersuchung von Varianz, Autokorrelation und Schiefe der Abweichungen von Laktationskurven als Resilienzindikatoren in der Zucht
  • Ergebnisauswertung der Schulter- und Ellbogenfunktion bei Plexus-brachialis-Läsionen: Einfluss der Läsionslokalisation, chirurgischer Eingriffe und Zeit auf die postoperative Erholung
  • Entwicklung und Implementierung eines Vorhersagemodells zur Prognose des nächsten Ganzzahlwerts in einer komplexen Datenstruktur sowie Erstellung einer benutzerfreundlichen Webanwendung für den Modelleinsatz
Mai 2024 - Okt. 2024
6 Monaten

Senior Statistiker (Auftragnehmer)

Randstad Professional GmbH bei Roche Diagnostics

  • Statistische Beratung und Unterstützung beim Versuchsdesign für Produktentwicklungsprozesse in Biostatistik und Data Science
  • Entwicklung und Implementierung robuster mathematischer Modelle zur Datenanalyse zur Unterstützung datenbasierter Entscheidungsfindung
  • Anpassung von Algorithmen für präzise und zuverlässige Analyse physikalischer Messdaten
  • Integration biometrischer Methoden in behördliche Zulassungsdokumente unter Berücksichtigung der Anforderungen für Produktzulassungen
  • Erstellung statistischer Begründungen zur Unterstützung von Produktzulassungen und Entscheidungsprozessen
Sept. 2023 - Apr. 2024
8 Monaten

Biostatistiker (Freiberuflich)

Medical Haensler GmbH

  • Ein-Proben-Anteilstest vs. exakter Binomialtest für den Unterschied im Anteil der Patienten mit einer Verbesserung der bestkorrigierten Sehschärfe („BCVA“)
  • Bereitstellung statistischer Expertise
  • Datenanalyse
  • Erstellung des Statistical Analysis Plan (SAP)
Mai 2023 - Juli 2023
3 Monaten

SAS-Trainer (Freiberuflich)

DAK-Gesundheit KdöR

  • SAS-Schulung zu statistischen Methoden für Mustererkennung und Modellierung
  • SAS-Schulung zu automatisierten Berichten für Versicherungs- und Abrechnungsdaten
  • SAS-Schulung zur Datenbereinigung mit Validierungstechniken
  • SAS-Schulung zu Datenanalyse, -verwaltung und Visualisierung
Sept. 2022 - Mai 2023
9 Monaten

Senior Data Scientist (Vertrag)

AOK-Bundesverband eGbR

  • Entwicklung und Optimierung von Modellen des maschinellen Lernens zur Vorhersage von Krankengeld, Deckungsbeiträgen und Kundensegmenten
  • Modellierung von Risikoprofilen und Leistungsdaten zur Verbesserung der Vorhersagegenauigkeit
  • Implementierung von Prognosemodellen zur Verringerung der Kundenabwanderung und Steigerung der Zufriedenheit
  • Quantifizierung von Risiken anhand von Daten zur Unterstützung strategischer Entscheidungen
Mai 2021 - Aug. 2022
1 Jahr 4 Monaten

Statistiker (Freiberufler)

3d-statistical-learning.com

  • Durchführung statistischer Analysen und Beratung für biomedizinische und akademische Forschungsprojekte
  • Einfluss der Ernährung auf Albumin und BMI
  • Wirkung einer übermäßigen intraoperativen Flüssigkeitszufuhr auf klinische Ergebnisse bei orthopädischen Patienten
  • Einfluss von Gerinnung auf relevante Gesundheitsergebnisse
  • Einfluss der Volumengabe auf die Sterblichkeit
  • Effekt des Cement Team Time-Out: Vergleich von vor und nach Einführung hinsichtlich Sterblichkeit, Volumen, Katecholaminen und Verkabelung
  • Durchführung von Schulungen in maschinellem Lernen und Statistik mit R, SAS und Python
  • Durchführung einer umfangreichen Meta-Analyse zum »Effekt von Ranibizumab bei diabetischem Makulaödem im Vergleich zu Kontrollgruppen ohne Ranibizumab«
  • Unterstützung von Bachelor-, Master- und Promotionsarbeiten mit datenintensiven Methoden
Apr. 2016 - Aug. 2022
6 Jahren 5 Monaten
Dortmund, Deutschland

Wissenschaftliche Assistenz/Wissenschaftlicher Mitarbeiter

Technische Universität Dortmund KdöR

  • Durchführung von Kursen in Bayesscher Statistik, statistischem Lernen und Big-Data-Methoden
  • Betreuung von Abschlussarbeiten in Statistik und maschinellem Lernen mit Schwerpunkt auf Big-Data-Anwendungen
  • Beratung von Studierenden bei datenintensiven Projekten zur Unterstützung ihres Studienerfolgs
  • Mentoring internationaler Studierender zur Förderung ihrer Leistungen in datenorientierten Fachgebieten
Apr. 2016 - Apr. 2021
5 Jahren 1 Monate
Essen, Deutschland

Biostatistiker

Universitätsklinikum Essen

  • Durchführung statistischer Datenanalysen und Berichterstattung
  • Erstellung von Statistischen Analyseplänen für klinische Forschung
  • Bewertung der Datenqualität und Identifikation von Fehlerquellen in großen Datensätzen
  • Durchführung von Power-Analysen und Sensitivitätstests zur Sicherstellung robuster Modelle
  • Entwicklung statistischer und mathematischer Modelle zur Analyse großer Datenmengen
Mai 2015 - März 2016
11 Monaten
Berlin, Deutschland

Data-Science-Praktikant

GKV-Spitzenverband Berlin

  • Operationalisierung und Messung der Persistenz ärztlich codierter Diagnosen als Prävalenztrend unter Verwendung eines Persistenzindikators und eines unüberwachten Klassifikationsansatzes
  • Analyse der Auswirkungen von Veränderungen der Prävalenz ICD-codierter Diagnosen in einem stark eingeschränkten Regressionsmodell zur Berechnung der sogenannten „diagnosebasierten“ Morbiditätsänderungsrate in der gesetzlichen Krankenversicherung

Zusammenfassung

Ich bin ein hoch erfahrener Data Scientist und leitender Statistiker mit über acht Jahren praktischer Erfahrung in statistischer Analyse, Prognosen und fortgeschrittener Data Science in verschiedenen Branchen, darunter biomedizinische Forschung, Gesundheitswesen, Versicherungen, Verkehr und klinische Studien. Meine akademische Grundlage ist solide und umfasst einen Doktortitel (Ph.D.) in Statistik, einen Master in Statistik und einen Master in Mathematik, ergänzt durch mehrere berufliche Zertifizierungen in KI, Machine Learning und klinischer Forschung.

Im Laufe meiner Karriere habe ich mich auf die Konzeption und Implementierung von Machine-Learning- und KI-Lösungen spezialisiert, die komplexe Datensätze in umsetzbare Erkenntnisse verwandeln. Ich bin versiert darin, verschiedene analytische Ansätze zu verbinden – von klassischer Statistik und Bayesschen Methoden bis hin zu Deep Learning und Reinforcement Learning – um Kunden präzise, datenbasierte Entscheidungsunterstützung zu bieten.

Ich verfüge über umfangreiche Erfahrung in der Entwicklung von Vorhersage- und Optimierungsmodellen, einschließlich:

  • Machine Learning & KI: Deep Learning, Reinforcement Learning und Predictive Modeling.

  • Big Data & Cloud-Plattformen: Expertise im Umgang mit großen Datenmengen mit Spark und Hadoop sowie Microsoft Azure Services wie Azure Databricks, Azure Data Factory, Azure Synapse Analytics, Azure SQL Database, Azure Apache Spark Pools und Azure ML Studio.

  • Programmierung & Daten-Tools: Python, R, SAS, SQL und verwandte Analyse-Frameworks.

  • Natural Language Processing (NLP): Analyse und Gewinnung von Erkenntnissen aus Text- und unstrukturierten Daten.

  • Klinische Forschung & Epidemiologie: Statistische Analyse und Modellierung für klinische Studien, Gesundheitsergebnisse und behördliche Berichte.

  • Prognosen & Entscheidungsunterstützung: Aufbau robuster mathematischer Modelle und Vorhersagerahmen zur Unterstützung operativer, strategischer und regulatorischer Entscheidungen.

Neben meiner analytischen Arbeit habe ich fortgeschrittene statistische Methoden gelehrt und Fachleute in Bayesscher Statistik, Machine Learning und Big-Data-Analytics betreut und Teams dabei geholfen, komplexe Analysen in praktische, umsetzbare Empfehlungen zu übersetzen.

Ich habe erfolgreich KI- und ML-Lösungen geliefert, die Entscheidungsprozesse für Kunden aus der Krankenversicherung, der Biopharma-Branche und anderen datenintensiven Industrien optimieren. Mein Ansatz verbindet statistische Strenge mit technologischer Innovation, sodass analytische Lösungen sowohl wissenschaftlich fundiert als auch praktisch wirksam sind.

Ich liebe es, komplexe Daten in klare, verlässliche Erkenntnisse zu verwandeln, die fundierte Entscheidungen, Produktentwicklung und operative Effizienz vorantreiben. Ich stehe für die Zusammenarbeit an Projekten in den Bereichen Datenanalyse, Machine Learning, KI oder jeder datengetriebenen strategischen Initiative zur Verfügung und engagiere mich dafür, hochwertige, kundenorientierte Lösungen zu liefern.

Sprachen

Französisch
Muttersprache
Deutsch
Verhandlungssicher
Englisch
Verhandlungssicher

Ausbildung

Apr. 2017 - März 2022

Technische Universität Dortmund

Dr. rer. nat. · Statistik · Dortmund, Deutschland · Ausgezeichnet

Regressionsmodelle eignen sich, um den Zusammenhang zwischen Gesundheitsoutcomes und Umweltbelastungen zu untersuchen. In städtischen Gesundheitsstudien, in denen räumliche und zeitliche Veränderungen wichtig sind, werden räumliche und spatiotemporale Variationen jedoch oft vernachlässigt. Diese Dissertation entwickelt und wendet Regressionsmethoden an, die latente Zufallseffekte mit Conditional Autoregressive (CAR)-Strukturen in klassischen Regressionsmodellen integrieren, um räumliche Effekte in Querschnittsanalysen sowie spatiotemporale Effekte in Längsschnittanalysen zu berücksichtigen. Die Arbeit ist in zwei Hauptteile gegliedert. Im ersten Teil werden Methoden zur Analyse von Daten betrachtet, bei denen alle Variablen auf Flächenebene vorliegen. Die longitudinale Heinz Nixdorf Recall Study dient hier als Anwendungsbeispiel. Untersucht wird der Zusammenhang zwischen Depressionsrisiko und Grünflächenanteil auf Bezirksebene. Für ausgewählte Zeitpunkte wird ein räumliches Poisson-Modell mit einem latenten, CAR-strukturierten Zufallseffekt eingesetzt. Anschließend zeigt eine ausgefeilte spatiotemporale Erweiterung des Poisson-Modells eine negative Assoziation zwischen Grünflächenanteil und Depression. Die Ergebnisse deuten zudem auf starke zeitliche Autokorrelation und schwache räumliche Effekte hin. Auch wenn diese schwachen räumlichen Effekte suggerieren könnten, sie zu vernachlässigen, sollten räumliche und spatiotemporale Zufallseffekte für zuverlässige Schlussfolgerungen in städtischen Gesundheitsstudien berücksichtigt werden. Im zweiten Teil wird gezeigt, dass zur Vermeidung ökologischer und atomarer Fehlschlüsse durch Datenaggregation und -disaggregation alle Daten auf ihrer feinsten räumlichen Ebene genutzt werden sollten. Multilevel Conditional Autoregressive (CAR)-Modelle ermöglichen es, alle Variablen auf ihrer ursprünglichen räumlichen Auflösung gleichzeitig zu verwenden und so räumliche Effekte in epidemiologischen Studien zu erklären. Dies ist besonders wichtig, wenn Probanden in geografischen Einheiten verschachtelt sind. Dieser zweite Teil der Arbeit verfolgt zwei Ziele: Erweitert wird das multilevel Modell für Längsschnittdaten, indem bestehende Zufallseffekte mit zeitlich variierenden CAR-Strukturen ergänzt werden. Diese neuen Modelle werden als MLM tCARs bezeichnet. Beim Vergleich der MLM tCARs mit dem klassischen multilevel Growth Model in Simulationsstudien zeigt sich, dass MLM tCARs die wahren Regressionskoeffizienten besser wiedererfassen und insgesamt bessere Modellanpassungen bieten. Die Modelle werden im Rahmen eines Vergleichs auf die Analyse des Zusammenhangs zwischen Grünflächenanteil und Depressionssymptomen auf Individualebene in der longitudinalen Heinz Nixdorf Recall Study angewandt. Die Ergebnisse bestätigen erneut eine negative Assoziation zwischen Grünflächenanteil und Depression sowie einen abnehmenden linearen individuellen Zeittrend in allen Modellen. Es zeigt sich erneut sehr geringe räumliche Variation und moderate zeitliche Autokorrelation. Darüber hinaus bietet die Arbeit umfassende Entscheidungsbäume für die Analyse epidemiologischer Daten mit räumlichem Hintergrund.

Okt. 2013 - März 2016

Technische Universität Dortmund

M. Sc. · Statistik · Dortmund, Deutschland · Gut

Mein Master in Statistik hat mir eine umfassende und fundierte Ausbildung in theoretischen Grundlagen und angewandten Methoden der modernen Statistik vermittelt. Das Programm vereinte Wahrscheinlichkeitstheorie, statistische Inferenz und Entscheidungstheorie mit fortgeschrittenen rechnerischen und datengetriebenen Ansätzen und sorgte so für ein ausgewogenes Verhältnis von mathematischer Strenge und praktischer Anwendung.

Der Lehrplan umfasste ein breites Spektrum an Bereichen, darunter:

  • Theoretische Grundlagen: Wahrscheinlichkeitstheorie, Entscheidungstheorie, Schätzung und Hypothesentests, Bayessche Statistik, stochastische Prozesse.

  • Angewandte statistische Methoden: Deskriptive und Inferenzstatistik, lineare Modelle, multivariate Analysen, Stichprobentechniken, fortgeschrittenes Versuchsdesign, nichtlineare Optimierung.

  • Spezialgebiete: Ökonometrie, Risiko-Theorie in der Versicherungsmathematik, statistische Methoden in Epidemiologie und Genetik, Meta-Analyse, räumliche Statistik, Splineregession.

  • Data Science & Machine Learning: Klassifikationsverfahren und Big-Data-Analytik, fortgeschrittenes statistisches Lernen, Einführung in Data Science, Zeitreihenanalyse.

Diese vielfältige Ausbildung befähigte mich dazu:

  • Robuste statistische Modelle zu erstellen und zu validieren.

  • Fortgeschrittene Machine-Learning- und Data-Mining-Techniken auf große und komplexe Datensätze anzuwenden.

  • Experimente nach rigoroser Methodik zu entwerfen und durchzuführen.

  • Komplexe statistische Ergebnisse in klare, umsetzbare Erkenntnisse für Entscheidungsprozesse zu übersetzen.

Insgesamt hat das Programm sowohl mein theoretisches Fachwissen als auch meine Praxisfähigkeiten gestärkt und mich darauf vorbereitet, ein breites Spektrum datenzentrierter Herausforderungen in Branchen wie Gesundheitswesen, Versicherungen, Finanzen und wissenschaftlicher Forschung anzugehen.

Okt. 2008 - Dez. 2010

University Of Yaoundé I

M. Sc. · Mathematik · Yaoundé, Kamerun · Gut

Mein Master in Mathematik hat mir eine tiefgehende und fundierte Ausbildung in reiner und angewandter Mathematik geboten und mich mit fortgeschrittenen Problemlösungsfähigkeiten, abstraktem Denken und der Fähigkeit ausgestattet, komplexe mathematische Konzepte in praktische Lösungen zu überführen. Das Programm umfasste sowohl grundlegende Mathematik als auch hochspezialisierte Bereiche, die für moderne Anwendungen in Data Science, Optimierung und wissenschaftlichem Rechnen relevant sind.

Der Lehrplan beinhaltete:

  • Analysis & Funktionale Räume: Maßtheorie und Integration, Sobolev-Räume, Distributionstheorie, Fourier-Transformation, Funktionalanalysis, Topologie und komplexe Analyse.

  • Geometrie & Algebra: Differentielle Geometrie, Kähler- und Riemannsche Geometrie, Ringe und Moduln, allgemeine Algebra und topologische Vektorräume.

  • Differentialgleichungen & Dynamische Systeme: Gewöhnliche und partielle Differentialgleichungen, numerische Methoden für PDEs, kontinuierliche und diskrete dynamische Systeme, inverse Probleme.

  • Optimierung & Numerische Methoden: Nichtlineare Optimierung, fortgeschrittene numerische Analyse, angewandte Statistik, Daten- und Korrespondenzanalyse.

  • Grundlagen & Logik: Mengenlehre, mathematische Logik, Grundlagen der Analysis und Algebra, Informatik für Mathematiker.

  • Wahrscheinlichkeit & Statistik: Wahrscheinlichkeitstheorie, angewandte Statistik und Verbindungen zur realen Modellierung.

Durch dieses Programm habe ich starke analytische Fähigkeiten und die Fähigkeit entwickelt:

  • Hochkomplexe mathematische Probleme mit theoretischen und numerischen Ansätzen zu lösen.

  • Optimierungsverfahren und Differentialgleichungen zur Modellierung realer Phänomene anzuwenden.

  • In abstrakten mathematischen Strukturen (Algebra, Geometrie, Topologie) zu arbeiten und diese in angewandte Kontexte zu übertragen.

  • Fortgeschrittene statistische und rechnerische Methoden zur Datenanalyse und Entscheidungsunterstützung zu nutzen.

Dieser vielfältige mathematische Hintergrund ermöglicht es mir, Kundenprojekte mit Präzision, Kreativität und der Flexibilität anzugehen, strenge Methoden an praktische Geschäfts- und Forschungsherausforderungen anzupassen.

...und 1 Weitere

Zertifikate & Bescheinigungen

Spezialisierung Künstliche Intelligenz im Gesundheitswesen

Stanford University, Coursera

Spezialisierung Biostatistik im öffentlichen Gesundheitswesen

Johns Hopkins University, Coursera

Zertifizierter Anwender für Künstliche Intelligenz

CertNexus, Coursera

Spezialisierung Klinische Studien-Operationen

Johns Hopkins University, Coursera

Entwurf und Interpretation klinischer Studien

Johns Hopkins University, Coursera

Spezialisierung Produktmanagement in der Arzneimittelentwicklung

University of California San Diego, Coursera

Google Professional-Zertifikat Machine Learning Engineer

Google Cloud, Coursera

IBM Professional-Zertifikat Angewandte KI

IBM Developer Skills Network

IBM Professional-Zertifikat Full-Stack Softwareentwicklung

IBM Developer Skills Network

IBM Professional-Zertifikat Machine Learning

IBM Developer Skills Network

Einführung in Good Clinical Practice

Novartis, Coursera

Microsoft Professional-Zertifikat Azure Data Engineering Associate (DP-203)

Microsoft, Coursera

Microsoft Azure Data Fundamentals (DP-900) Prüfungsvorbereitung

Microsoft, Coursera

Python und Statistik für Finanzanalysen

The Hong Kong University of Science and Technology, Coursera

Python für Data Science, KI & Entwicklung

IBM Developer Skills Network

Klinische Forschung verstehen: Hinter den Statistiken

University of Cape Town, Coursera

Sie suchen Freelancer?Passende Kandidaten in Sekunden!
FRATCH GPT testen
Weitere Aktionen