Dany D.

Data Scientist/Statistiker

Witten, Deutschland

Erfahrungen

Feb. 2025 - Bis heute
11 Monaten

Leitender Statistiker (Freiberuflich)

Africon GmbH

  • Vorhersage des Fahrzeugbestands in afrikanischen Ländern (2024–2050)
  • Prognosen zu Fahrzeugbestandsentwicklungen mit detaillierten Visualisierungen und Zusammenfassungen
  • Raumzeitliche und mehrstufige Rahmenwerke
Nov. 2024 - Jan. 2025
3 Monaten

Leitender Statistiker (Freiberuflich)

3d-statistical-learning.com

  • Statistische Analyse und Beratung für biomedizinische und akademische Forschungsprojekte bereitgestellt
  • Untersuchung von Varianz, Autokorrelation und Schiefe von Abweichungen von Laktationskurven als Resilienzindikatoren in der Zucht
  • Ergebnisanalyse der Schulter- und Ellbogenfunktion bei Plexus-Brachialis-Läsionen: Einfluss der Läsionslokalisation, chirurgischer Eingriffe und Zeit auf die postoperative Genesung
  • Entwurf und Implementierung eines Vorhersagemodells zur Prognose der nächsten Zahl in einer komplexen Datenstruktur sowie Entwicklung einer benutzerfreundlichen Webanwendung für den Einsatz des Modells
Mai 2024 - Okt. 2024
6 Monaten

Leitender Statistiker (Auftragnehmer)

Randstad Professional GmbH bei Roche Diagnostics

  • Statistische Beratung und Unterstützung im Versuchsdesign für Produktentwicklungsprozesse in Biostatistik und Data Science bereitgestellt
  • Robuste mathematische Modelle für Datenanalysen entwickelt und implementiert, um datengestützte Entscheidungen zu ermöglichen
  • Algorithmen angepasst für präzise und zuverlässige Analyse physikalischer Messdaten
  • Biometrische Methoden in regulatorische Compliance-Dokumente integriert unter Berücksichtigung der Anforderungen für Produktzulassungen
  • Statistische Begründungen erstellt, um Produktzulassungen und Entscheidungsprozesse zu unterstützen
Sept. 2023 - Apr. 2024
8 Monaten

Biostatistiker (Freiberuflich)

Medical Haensler GmbH

  • Ein-Proportions-Test vs. exakter Binomialtest für den Unterschied im Anteil der Patienten mit Verbesserung der bestkorrigierten Sehschärfe („BCVA“)
  • Statistischen Input geliefert
  • Daten analysiert
  • Statistischen Analyseplan (SAP) geschrieben
Mai 2023 - Juli 2023
3 Monaten

SAS-Trainer (Freiberuflich)

DAK-Gesundheit KdöR

  • SAS-Schulung zu statistischen Methoden für Mustererkennung und Modellierung angeboten
  • SAS-Schulung für automatisierte Berichterstattung zu Versicherungs- und Abrechnungsdaten angeboten
  • SAS-Schulung zur Datenbereinigung mit Validierungstechniken angeboten
  • SAS-Schulung für Datenanalyse, -verwaltung und -visualisierung angeboten
Sept. 2022 - Mai 2023
9 Monaten

Senior Data Scientist (Vertrag)

AOK-Bundesverband eGbR

  • Entwicklung und Optimierung von Machine-Learning-Modellen für die Vorhersage von Krankengeld, Beitragsmargen und Kundensegmenten
  • Modellierung von Risikoprofilen und Leistungsdaten zur Verbesserung der Prognosegenauigkeit
  • Implementierung prädiktiver Modelle zur Reduzierung der Kundenabwanderung und Steigerung der Zufriedenheit
  • Quantifizierung von Risiken mithilfe von Daten zur Unterstützung strategischer Entscheidungen
Mai 2021 - Aug. 2022
1 Jahr 4 Monaten

Statistiker (Freiberuflich)

3d-statistical-learning.com

  • Durchführung statistischer Analysen und Beratung für biomedizinische und akademische Forschungsprojekte
  • Auswirkung der Ernährung auf Albumin und BMI
  • Einfluss übermäßiger intraoperativer Flüssigkeitszufuhr auf klinische Ergebnisse bei orthopädischen Patienten
  • Einfluss von Gerinnung auf relevante gesundheitliche Endpunkte
  • Auswirkungen der Volumenverabreichung auf die Sterblichkeit
  • Effekt eines Cement-Team-Time-Outs: Vergleich vor und nach Einführung bezüglich Sterblichkeit, Volumen, Katecholaminen, Verkabelung
  • Durchführung von Schulungen in Machine Learning und Statistik mit R, SAS und Python
  • Durchführung einer umfassenden Metaanalyse zur ”Wirksamkeit von Ranibizumab bei diabetischem Makulaödem im Vergleich zu Kontrollgruppen ohne Ranibizumab”
  • Unterstützung von Bachelor-, Master- und Promotionsarbeiten mit datenintensiven Methoden
Apr. 2016 - Aug. 2022
6 Jahren 5 Monaten
Dortmund, Deutschland

Wissenschaftliche Hilfskraft/Forschungsmitarbeiter

Technische Universität Dortmund KdöR

  • Lehre von Kursen in Bayesscher Statistik, Statistical Learning und Big-Data-Methoden
  • Betreuung von Abschlussarbeiten in Statistik und Machine Learning mit Schwerpunkt Big-Data-Anwendungen
  • Beratung von Studierenden bei datenintensiven Projekten zur akademischen Erfolgssicherung
  • Betreuung internationaler Studierender und Unterstützung beim Erfolg in datengetriebenen Disziplinen
Apr. 2016 - Apr. 2021
5 Jahren 1 Monate
Essen, Deutschland

Biostatistiker

University Hospital Essen

  • Durchführung statistischer Datenanalysen und Berichterstattung
  • Erstellung von statistischen Analyseplänen für klinische Studien
  • Bewertung der Datenqualität und Identifikation von Fehlerquellen in großen Datensätzen
  • Durchführung von Power-Analysen und Sensitivitätstests zur Sicherstellung robuster Modelle
  • Entwicklung statistischer und mathematischer Modelle zur Analyse großer Datenmengen
Mai 2015 - März 2016
11 Monaten
Berlin, Deutschland

Praktikant im Bereich Data Science

GKV-Spitzenverband Berlin

  • Operationalisierung und Bereitstellung von Messungen zur Persistenz ärztlich kodierter Diagnosen als Prävalenztrend mithilfe eines Persistenzindikators und eines unüberwachten Klassifikationsverfahrens
  • Analyse der Auswirkungen von Veränderungen in der Prävalenz ICD-kodierter Diagnosen in einem stark eingeschränkten Regressionsmodell zur Berechnung der sogenannten ’diagnosebasierten’ Morbiditätsänderungsrate in der gesetzlichen Krankenversicherung

Zusammenfassung

Ich bin ein hoch erfahrener Data Scientist und leitender Statistiker mit über acht Jahren praktischer Erfahrung in statistischer Analyse, Prognose und fortgeschrittener Datenwissenschaft in verschiedenen Bereichen, darunter biomedizinische Forschung, Gesundheitswesen, Versicherung, Transport und klinische Studien. Mein akademischer Hintergrund ist solide: Ich habe einen Doktortitel in Statistik, einen Master in Statistik und einen Master in Mathematik sowie mehrere professionelle Zertifizierungen in KI, maschinellem Lernen und klinischer Forschung. Im Laufe meiner Karriere habe ich mich darauf spezialisiert, Lösungen im Bereich maschinelles Lernen und KI zu entwerfen und umzusetzen, die komplexe Datensätze in umsetzbare Erkenntnisse übersetzen. Ich überbrücke verschiedenste analytische Ansätze, von klassischer Statistik und Bayes-Methoden bis hin zu Deep Learning und Reinforcement Learning, um Kunden präzise, datenbasierte Entscheidungshilfen zu bieten. Ich verfüge über umfangreiche Erfahrung in der Entwicklung von Vorhersage- und Optimierungsmodellen, darunter:

  • Machine Learning & KI: Deep Learning, Reinforcement Learning und Predictive Modellierung.
  • Big Data & Cloud-Plattformen: Erfahrung im Umgang mit großskaligen Daten unter Nutzung von Spark und Hadoop sowie Microsoft Azure-Diensten wie Azure Databricks, Azure Data Factory, Azure Synapse Analytics, Azure SQL Database, Azure Apache Spark Pools und Azure ML Studio.
  • Programmierung & Datentools: Python, R, SAS, SQL und zugehörige Analyse-Frameworks.
  • Verarbeitung natürlicher Sprache (NLP): Analyse und Gewinnung von Erkenntnissen aus textuellen und unstrukturierten Daten.
  • Klinische Forschung & Epidemiologie: Statistische Analyse und Modellierung für klinische Studien, Gesundheitsergebnisse und regulatorische Berichte.
  • Prognose & Entscheidungshilfe: Aufbau robuster mathematischer Modelle und Vorhersagerahmen, um operative, strategische und regulatorische Entscheidungen zu unterstützen. Zusätzlich zur praktischen analytischen Arbeit habe ich fortgeschrittene statistische Methoden unterrichtet und Fachleute in Bayesscher Statistik, maschinellem Lernen und Big Data Analytics gecoacht, um Teams dabei zu helfen, komplexe Analysen in praktische, umsetzbare Empfehlungen zu übersetzen. Ich habe erfolgreich KI- und ML-Lösungen geliefert, die Entscheidungsprozesse für Kunden in der privaten Krankenversicherung, Biopharma und anderen datenintensiven Branchen optimieren. Mein Ansatz verbindet statistische Strenge mit technologischer Innovation, sodass analytische Lösungen sowohl wissenschaftlich fundiert als auch praktisch relevant sind. Ich habe Freude daran, komplexe Daten in klare, verlässliche Erkenntnisse zu verwandeln, die informierte Entscheidungen, Produktentwicklung und operative Effizienz vorantreiben. Ich stehe für Projekte im Bereich Datenanalyse, maschinelles Lernen, KI oder jede datengetriebene Strategieinitiative zur Verfügung und verpflichte mich, qualitativ hochwertige, kundenorientierte Lösungen zu liefern.

Sprachen

Französisch
Muttersprache
Deutsch
Verhandlungssicher
Englisch
Verhandlungssicher

Ausbildung

Apr. 2017 - März 2022

Technische Universität Dortmund

Dr. rer. nat. · Statistik · Dortmund, Deutschland · Ausgezeichnet

Regressionsmodelle eignen sich, um den Zusammenhang zwischen Gesundheitsergebnissen und Umweltbelastungen zu untersuchen. In Stadtgesundheitsstudien, bei denen räumliche und zeitliche Veränderungen wichtig sind, werden räumliche und raum-zeitliche Variationen jedoch häufig vernachlässigt. Diese Dissertation entwickelt und wendet Regressionsmethoden mit latenten Zufallseffekten und Conditional Autoregressive (CAR)-Strukturen in klassischen Regressionsmodellen an, um räumliche Effekte in Querschnittsanalysen und raum-zeitliche Effekte in Längsschnittanalysen zu berücksichtigen. Die Arbeit ist in zwei Hauptteile gegliedert. Im ersten Teil werden Methoden für Daten untersucht, bei denen alle Variablen auf Flächenniveau vorliegen. Die longitudinale Heinz Nixdorf Recall Studie dient als Anwendungsbeispiel. Der Zusammenhang zwischen Depressionsrisiko und Grünflächenanteil auf Bezirksebene wird analysiert. Für ausgewählte Zeitpunkte wird ein räumliches Poisson-Modell mit latentem CAR-Residualeffekt angewandt. Anschließend zeigt eine ausgefeilte raum-zeitliche Erweiterung des Poisson-Modells einen negativen Zusammenhang zwischen Grünflächen und Depression. Die Ergebnisse deuten auch auf starke zeitliche Autokorrelation und nur schwache räumliche Effekte hin. Selbst wenn schwache räumliche Effekte zum Verzicht darauf verleiten könnten, sollten räumliche und raum-zeitliche Zufallseffekte einbezogen werden, um verlässliche Inferenz in Stadtgesundheitsstudien zu ermöglichen. Im zweiten Teil wird gezeigt, dass zur Vermeidung ökologischer und atomarer Fehlschlüsse alle Daten möglichst auf ihrem feinsten räumlichen Niveau verwendet werden sollten. Mehrstufige Conditional Autoregressive (CAR)-Modelle ermöglichen es, alle Variablen gleichzeitig in ihrer ursprünglichen räumlichen Auflösung zu nutzen und den räumlichen Effekt in epidemiologischen Studien zu erklären. Dies ist besonders wichtig, wenn Probanden in geografischen Einheiten verschachtelt sind. Der zweite Teil verfolgt zwei Ziele: Er entwickelt die multilevel Modelle für Längsschnittdaten weiter, indem bestehende Zufallseffekte mit zeitlich variierenden CAR-Strukturen ergänzt werden. Diese neuen Modelle werden MLM tCARs genannt. Durch Simulationen und Vergleiche mit dem klassischen multilevel Growth Model zeigen die MLM tCARs eine bessere Rekonstruktion der wahren Regressionskoeffizienten und insgesamt bessere Modellgüte. Die Modelle werden vergleichend auf die Analyse des Zusammenhangs zwischen Grünflächen und Depressionssymptomen auf Individualebene in der longitudinalen Heinz Nixdorf Recall Studie angewandt. Die Ergebnisse bestätigen erneut den negativen Zusammenhang zwischen Grünflächen und Depression und zeigen für alle Modelle einen abnehmenden linearen individuellen Zeittrend. Es zeigt sich wieder sehr geringe räumliche Variation und mäßige zeitliche Autokorrelation. Zudem bietet die Dissertation umfassende Entscheidungsbäume für die Analyse epidemiologischer Daten mit räumlichem Hintergrund.

Okt. 2013 - März 2016

Technische Universität Dortmund

M. Sc. · Statistik · Dortmund, Deutschland · Gut

Mein Master in Statistik hat mir eine umfassende und strenge Ausbildung in den theoretischen Grundlagen und angewandten Methoden der modernen Statistik geboten. Das Programm verband Wahrscheinlichkeitstheorie, statistische Inferenz und Entscheidungstheorie mit fortgeschrittenen rechnerischen und datengetriebenen Ansätzen und sorgte so für eine starke Balance zwischen mathematischer Strenge und praktischer Anwendung. Der Lehrplan umfasste ein breites Spektrum an Themen, darunter:

  • Theoretische Grundlagen: Wahrscheinlichkeitstheorie, Entscheidungstheorie, Schätz- und Hypothesentests, Bayessche Statistik, stochastische Prozesse.
  • Angewandte statistische Methoden: deskriptive und schließende Statistik, lineare Modelle, multivariate Analyse, Stichprobentechniken, fortgeschrittenes Versuchsdesign, nichtlineare Optimierung.
  • Spezialisierte Bereiche: Ökonometrie, Risikotheorie in der Versicherungsmathematik, statistische Methoden in Epidemiologie und Genetik, Meta-Analyse, räumliche Statistik, Splineregression.
  • Data Science & Machine Learning: Klassifikationsverfahren und Big Data Analytics, fortgeschrittenes statistisches Lernen, Einführung in Data Science, Zeitreihenanalyse. Diese vielfältige Ausbildung hat mich befähigt,
  • robuste statistische Modelle zu entwickeln und zu validieren.
  • fortgeschrittene Machine-Learning- und Data-Mining-Techniken auf große und komplexe Datensätze anzuwenden.
  • Experimente mit strenger Methodik zu entwerfen und durchzuführen.
  • komplexe statistische Ergebnisse in klare, umsetzbare Erkenntnisse für Entscheidungen zu übersetzen. Insgesamt hat das Programm sowohl meine theoretische Expertise als auch meine praktischen Fähigkeiten gestärkt und mich darauf vorbereitet, eine breite Palette datengetriebener Herausforderungen in Branchen wie Gesundheitswesen, Versicherung, Finanzwesen und wissenschaftlicher Forschung zu meistern.
Okt. 2008 - Dez. 2010

University Of Yaoundé I

M. Sc. · Mathematik · Yaoundé, Kamerun · Gut

Mein Master in Mathematik hat mir eine umfassende und gründliche Ausbildung in reiner und angewandter Mathematik geboten und mich mit fortgeschrittenen Problemlösungsfähigkeiten, abstraktem Denken und der Fähigkeit ausgestattet, komplexe mathematische Konzepte in praktische Lösungen zu übertragen. Das Programm umfasste sowohl grundlegende Mathematik als auch hochspezialisierte Bereiche, die für moderne Anwendungen in Data Science, Optimierung und wissenschaftlichem Rechnen relevant sind. Der Lehrplan beinhaltete:

  • Analysis & Funktionale Räume: Maßtheorie und Integration, Sobolev-Räume, Distributionstheorie, Fourier-Analysis, Funktionalanalysis, Topologie und komplexe Analysis.
  • Geometrie & Algebra: Differentielle Geometrie, Kähler- und Riemannsche Geometrie, Ringe und Moduln, allgemeine Algebra und topologische Vektorräume.
  • Differentialgleichungen & Dynamische Systeme: Gewöhnliche und partielle Differentialgleichungen, numerische Methoden für PDE, kontinuierliche und diskrete dynamische Systeme, inverse Probleme.
  • Optimierung & Numerische Methoden: nichtlineare Optimierung, fortgeschrittene numerische Analyse, angewandte Statistik, Daten- und Korrespondenzanalyse.
  • Grundlagen & Logik: Mengenlehre, mathematische Logik, Grundlagen von Analysis und Algebra, Informatik für Mathematik.
  • Wahrscheinlichkeit & Statistik: Wahrscheinlichkeitstheorie, angewandte Statistik und Verbindungen zur praktischen Modellierung. Durch dieses Programm habe ich starke analytische Fähigkeiten entwickelt und bin in der Lage:
  • hochkomplexe mathematische Probleme mit theoretischen und numerischen Ansätzen zu lösen.
  • Optimierung und Differentialgleichungen einzusetzen, um reale Phänomene zu modellieren.
  • abstrakte mathematische Strukturen (Algebra, Geometrie, Topologie) anzuwenden und in praktische Kontexte zu übertragen.
  • fortgeschrittene statistische und rechnerische Methoden zu nutzen, um Daten zu analysieren und Entscheidungen zu unterstützen. Dieser vielfältige mathematische Hintergrund ermöglicht es mir, Kundenprojekte mit Präzision, Kreativität und der Flexibilität anzugehen, strenge Methoden an praktische Geschäfts- und Forschungsfragen anzupassen.
...und 1 Weitere

Zertifikate & Bescheinigungen

Spezialisierung KI im Gesundheitswesen

Stanford University, Coursera

Spezialisierung Biostatistik in der öffentlichen Gesundheit

Johns Hopkins University, Coursera

Zertifizierter KI-Praktiker

CertNexus, Coursera

Spezialisierung in klinischen Studienoperationen

Johns Hopkins University, Coursera

Entwurf und Interpretation klinischer Studien

Johns Hopkins University, Coursera

Spezialisierung Produktmanagement in der Arzneimittelentwicklung

University of California San Diego, Coursera

Google Professional-Zertifikat Machine Learning Engineer

Google Cloud, Coursera

IBM Professional-Zertifikat Angewandte KI

IBM Developer Skills Network

IBM Professional-Zertifikat Full-Stack-Softwareentwickler

IBM Developer Skills Network

IBM Professional-Zertifikat Machine Learning

IBM Developer Skills Network

Einführung in Good Clinical Practice

Novartis, Coursera

Microsoft Professional-Zertifikat Azure Data Engineering Associate (DP-203)

Microsoft, Coursera

Microsoft Exam Prep Azure Data Fundamentals DP-900

Microsoft, Coursera

Python und Statistik für Finanzanalysen

The Hong Kong University of Science and Technology, Coursera

Python für Data Science, KI & Entwicklung

IBM Developer Skills Network

Verstehen klinischer Forschung: Hinter den Statistiken

University of Cape Town, Coursera

Sie suchen Freelancer?Passende Kandidaten in Sekunden!
FRATCH GPT testen
Weitere Aktionen