Dany D.

Data Scientist / Statistiker

Witten, Deutschland

Erfahrungen

Feb. 2025 - Bis heute
9 Monaten

Senior-Statistiker (Freiberufler)

Africon GmbH

  • Fahrzeugpark-Prognosen für afrikanische Länder (2024–2050)
  • Prognosen zu Fahrzeugpark-Trends mit detaillierten Visualisierungen und Zusammenfassungen
  • Raum-zeitliche und mehrstufige Modelle
Nov. 2024 - Jan. 2025
3 Monaten

Senior-Statistiker (Freiberufler)

3d-statistical-learning.com

  • Durchführung statistischer Analysen und Beratung für biomedizinische und akademische Forschungsprojekte
  • Untersuchung von Varianz, Autokorrelation und Schiefe der Abweichungen von Laktationskurven als Resilienzindikatoren in der Zucht
  • Ergebnisanalyse der Schulter- und Ellenbogenfunktion bei Plexus-brachialis-Läsionen: Einfluss der Läsionslokalisation, chirurgischer Eingriffe und Zeit auf die postoperative Erholung
  • Entwurf und Umsetzung eines prädiktiven Modells zur Vorhersage der nächsten Ganzzahl in einer komplexen Datenstruktur sowie Entwicklung einer benutzerfreundlichen Webanwendung für den Modelleinsatz und die Anwendung
Mai 2024 - Okt. 2024
6 Monaten

Senior-Statistiker (Auftragnehmer)

Randstad Professional GmbH bei Roche Diagnostics

  • Statistische Beratung und Unterstützung im Versuchsdesign für Produktentwicklungsprozesse in Biostatistik und Data Science
  • Entwicklung und Implementierung robuster mathematischer Modelle zur Datenanalyse zur Unterstützung datengetriebener Entscheidungen
  • Anpassung von Algorithmen für eine präzise und zuverlässige Analyse physikalischer Messdaten
  • Integration biometrischer Methoden in regulatorische Dokumente unter Berücksichtigung von Zulassungsanforderungen
  • Erstellung statistischer Begründungen zur Unterstützung von Produktzulassungen und Entscheidungsprozessen
Sept. 2023 - Apr. 2024
8 Monaten

Biostatistiker (Freiberufler)

Medical Haensler GmbH

  • One-Proportion-Test vs. exakter Binomialtest für den Unterschied im Anteil von Patienten mit Verbesserung der bestkorrigierten Sehschärfe ("BCVA")
  • Statistische Beiträge
  • Datenanalyse
  • Verfassen eines Statistical Analysis Plans (SAP)
Mai 2023 - Juli 2023
3 Monaten

SAS-Trainer (Freiberufler)

DAK-Gesundheit KdöR

  • Durchführung von SAS-Schulungen zu statistischen Methoden für Mustererkennung und Modellierung
  • SAS-Schulung für automatisiertes Reporting von Versicherungs- und Abrechnungsdaten
  • SAS-Schulung zur Datenbereinigung mit Validierungstechniken
  • SAS-Schulung für Datenanalyse, Datenmanagement und Visualisierung
Sept. 2022 - Mai 2023
9 Monaten

Senior Data Scientist (Vertrag)

AOK-Bundesverband eGbR

  • Modelle für maschinelles Lernen zur Vorhersage von Krankengeld, Deckungsbeiträgen und Kundensegmenten entwickelt und optimiert
  • Risikoprofile und Leistungsdaten modelliert, um die Vorhersagegenauigkeit zu verbessern
  • Prädiktive Modelle implementiert, um Kundenabwanderung zu reduzieren und die Zufriedenheit zu steigern
  • Risiken quantifiziert, um datenbasierte Entscheidungsfindung zu unterstützen
Mai 2021 - Aug. 2022
1 Jahr 4 Monaten

Statistiker (Freiberuflich)

3d-statistical-learning.com

  • Statistische Analysen und Beratung für biomedizinische und akademische Forschungsprojekte
  • Auswirkungen der Ernährung auf Albumin und BMI
  • Effekt übermäßiger intraoperativer Flüssigkeitsgabe auf klinische Ergebnisse bei orthopädischen Patienten
  • Einfluss der Blutgerinnung auf relevante Gesundheitsparameter
  • Einfluss der Volumengabe auf die Sterblichkeit
  • Effekt eines Cement-Team Time-Outs: Vergleich vor und nach Einführung bezüglich Mortalität, Volumen, Katecholamine und Drähten
  • Schulungen in Machine Learning und Statistik mit R, SAS und Python durchgeführt
  • Eine umfassende Metaanalyse zur „Wirksamkeit von Ranibizumab bei diabetischem Makulaödem im Vergleich zu Kontrollgruppen ohne Ranibizumab“ durchgeführt
  • Bachelor-, Master- und Doktorarbeiten mit datenintensiven Methoden unterstützt
Apr. 2016 - Aug. 2022
6 Jahren 5 Monaten
Dortmund, Deutschland

Wissenschaftliche Hilfskraft/Wissenschaftlicher Mitarbeiter

Technische Universität Dortmund KdöR

  • Kurse in Bayesscher Statistik, statistischem Lernen und Big-Data-Methoden unterrichtet
  • Abschlussarbeiten in Statistik und Machine Learning betreut, mit Schwerpunkt auf Big-Data-Anwendungen
  • Studierende bei datenintensiven Projekten beraten und zum akademischen Erfolg geführt
  • Internationale Studierende betreut und ihnen zum Erfolg in datengetriebenen Disziplinen verholfen
Apr. 2016 - Apr. 2021
5 Jahren 1 Monate
Essen, Deutschland

Biostatistiker

Universitätsklinikum Essen

  • Statistische Datenanalyse und Berichterstattung durchgeführt
  • Statistische Analysepläne für klinische Forschung erstellt
  • Datenqualität bewertet und Fehlerquellen in großen Datensätzen identifiziert
  • Power-Analysen und Sensitivitätstests durchgeführt, um robuste Modelle zu gewährleisten
  • Statistische und mathematische Modelle entwickelt, um große Datenmengen zu analysieren
Mai 2015 - März 2016
11 Monaten
Berlin, Deutschland

Data Scientist-Praktikant

GKV-Spitzenverband Berlin

  • Beständigkeit ärztlich codierter Diagnosen als Prävalenztrend operationalisiert und gemessen, mit einem Persistenzindikator und unüberwachtem Klassifikationsverfahren
  • Effekte von Veränderungen der Prävalenz ICD-codierter Diagnosen in einem stark eingeschränkten Regressionsmodell zur Berechnung der sogenannten ‚diagnosebasierten‘ Morbiditätsänderungsrate in der gesetzlichen Krankenversicherung analysiert

Zusammenfassung

Ich bin ein sehr erfahrener Data Scientist und Senior-Statistiker mit über acht Jahren praktischer Erfahrung in statistischer Analyse, Prognosen und fortgeschrittener Data Science in unterschiedlichen Bereichen, darunter biomedizinische Forschung, Gesundheitswesen, Versicherungen, Verkehr und klinische Studien. Meine akademische Grundlage ist stark und umfasst eine Promotion (Ph.D.) in Statistik, einen Masterabschluss in Statistik und einen Masterabschluss in Mathematik, ergänzt durch mehrere professionelle Zertifizierungen in KI, Machine Learning und klinischer Forschung. Im Laufe meiner Karriere habe ich mich darauf spezialisiert, Machine-Learning- und KI-Lösungen zu entwerfen und umzusetzen, die komplexe Datensätze in umsetzbare Erkenntnisse überführen. Ich bin versiert darin, verschiedene Analyseansätze – von klassischer Statistik und Bayesschen Methoden bis hin zu Deep Learning und Reinforcement Learning – zu verbinden, um Kunden präzise, datenbasierte Entscheidungsunterstützung zu bieten. Ich verfüge über umfangreiche Erfahrung in der Entwicklung von Prognose- und Optimierungsmodellen, unter anderem in den Bereichen:

  • Machine Learning & KI: Deep Learning, Reinforcement Learning und prädiktive Modellierung.
  • Big Data & Cloud-Plattformen: Erfahrung im Umgang mit großen Datenmengen mit Spark und Hadoop sowie Microsoft Azure-Diensten wie Azure Databricks, Azure Data Factory, Azure Synapse Analytics, Azure SQL Database, Azure Apache Spark Pools und Azure ML Studio.
  • Programmierung & Data Tools: Python, R, SAS, SQL und zugehörige Analyse-Frameworks.
  • Natural Language Processing (NLP): Analyse und Gewinnung von Erkenntnissen aus textuellen und unstrukturierten Daten.
  • Klinische Forschung & Epidemiologie: Statistische Analyse und Modellierung für klinische Studien, Behandlungsergebnisse und regulatorische Berichterstattung.
  • Prognosen & Entscheidungsunterstützung: Erstellung robuster mathematischer Modelle und prädiktiver Frameworks zur Unterstützung operativer, strategischer und regulatorischer Entscheidungen. Zusätzlich zur praktischen Analytik habe ich fortgeschrittene statistische Methoden gelehrt und Fachkräfte in Bayesscher Statistik, Machine Learning und Big Data Analytics betreut, um Teams dabei zu unterstützen, komplexe Analysen in umsetzbare Empfehlungen zu übersetzen. Ich habe erfolgreich KI- und ML-Lösungen geliefert, die Entscheidungsprozesse für Kunden aus der Krankenversicherung, Biopharma und anderen datenintensiven Branchen optimieren. Mein Ansatz verbindet statistische Strenge mit technischer Innovation und stellt sicher, dass analytische Lösungen sowohl wissenschaftlich fundiert als auch praktisch wirksam sind. Ich blühe auf, wenn es darum geht, komplexe Daten in klare, verlässliche Erkenntnisse zu verwandeln, die fundierte Entscheidungen, Produktentwicklung und operative Effizienz vorantreiben. Ich stehe für Zusammenarbeit an Projekten rund um Datenanalyse, Machine Learning, KI oder jede datengetriebene Strategieinitiative zur Verfügung und verpflichte mich dazu, hochwertige, kundenorientierte Lösungen zu liefern.

Sprachen

Französisch
Muttersprache
Deutsch
Verhandlungssicher
Englisch
Verhandlungssicher

Ausbildung

Apr. 2017 - März 2022

Technische Universität Dortmund

Dr. rer. nat. · Statistics · Dortmund, Deutschland · Excellent

Regressionsmodelle eignen sich zur Analyse des Zusammenhangs zwischen Gesundheitsergebnissen und Umweltbelastungen. In städtischen Gesundheitsstudien, in denen räumliche und zeitliche Veränderungen wichtig sind, werden räumliche und raum-zeitliche Variationen jedoch meist vernachlässigt. In dieser Arbeit werden Regressionsmethoden entwickelt und angewendet, die latente Zufallseffekte mit Conditional Autoregressive (CAR)-Strukturen in klassische Regressionsmodelle integrieren, um räumliche Effekte für Querschnittsanalysen und raum-zeitliche Effekte für Längsschnittanalysen zu berücksichtigen. Die Arbeit ist in zwei Hauptteile gegliedert. Im ersten Teil werden Methoden zur Analyse von Daten betrachtet, bei denen alle Variablen auf Gebietsebene vorliegen. Für die Anwendung wird durchgängig die longitudinal angelegte Heinz-Nixdorf-Recall-Studie herangezogen. Der Zusammenhang zwischen Depressionsrisiko und Grünflächen auf Bezirksebene wird untersucht. Für ausgewählte Zeitpunkte kommt ein räumliches Poisson-Modell mit latentem CAR-strukturierten Zufallseffekt zum Einsatz. Anschließend führt eine ausgefeilte raum-zeitliche Erweiterung des Poisson-Modells zu einer negativen Assoziation zwischen Grünflächen und Depression. Die Ergebnisse deuten zudem auf starke zeitliche Autokorrelation und schwache räumliche Effekte hin. Auch wenn die schwachen räumlichen Effekte darauf hindeuten, sie zu vernachlässigen, sollten räumliche und raum-zeitliche Zufallseffekte berücksichtigt werden, um in städtischen Gesundheitsstudien verlässliche Aussagen zu ermöglichen. Im zweiten Teil wird gezeigt, dass zur Vermeidung ökologischer und atomarer Trugschlüsse durch Datenaggregation und -disaggregation alle Daten auf der feinsten verfügbaren räumlichen Ebene genutzt werden sollten. Multilevel Conditional Autoregressive (CAR)-Modelle ermöglichen es, alle Variablen gleichzeitig auf ihrer ursprünglichen räumlichen Auflösung zu verwenden und den räumlichen Effekt in epidemiologischen Studien zu erklären. Dies ist besonders wichtig, wenn Untersuchungseinheiten in geografische Einheiten eingebettet sind. Dieser zweite Teil der Arbeit verfolgt zwei Ziele. Konkret werden die Multilevel-Modelle für Längsschnitterhebungen weiterentwickelt, indem bestehende Zufallseffekte mit CAR-Strukturen ergänzt werden, die sich im Zeitverlauf ändern. Diese neuen Modelle werden als MLM tCARs bezeichnet. Durch den Vergleich der MLM tCARs mit dem klassischen Multilevel-Wachstumsmodell mittels Simulationen zeigt sich eine bessere Performance der MLM tCARs bei der Ermittlung der tatsächlichen Regressionskoeffizienten und in der Modellanpassung. Die Modelle werden vergleichend auf die Analyse des Zusammenhangs zwischen Grünflächen und depressiven Symptomen auf Individualebene in der longitudinalen Heinz-Nixdorf-Recall-Studie angewendet. Die Ergebnisse zeigen erneut eine negative Assoziation zwischen Grünflächen und Depression sowie einen abnehmenden linearen Zeittrend auf Individualebene für alle Modelle. Wir beobachten erneut sehr geringe räumliche Variation und moderate zeitliche Autokorrelation. Zusätzlich enthält die Arbeit umfassende Entscheidungsbäume für die Analyse von Daten in epidemiologischen Studien mit räumlichem Hintergrund.

Okt. 2013 - März 2016

Technische Universität Dortmund

M. Sc. · Statistics · Dortmund, Deutschland · Good

Mein Masterstudium in Statistik hat mir eine umfassende und fundierte Ausbildung sowohl in den theoretischen Grundlagen als auch in den angewandten Methoden der modernen Statistik vermittelt. Das Programm verband Wahrscheinlichkeitstheorie, statistische Inferenz und Entscheidungstheorie mit fortgeschrittenen rechnerischen und datengetriebenen Ansätzen und gewährleistete so ein ausgewogenes Verhältnis zwischen mathematischer Strenge und praktischer Anwendung.

Der Lehrplan umfasste eine breite Palette von Themen, darunter:

  • Theoretische Grundlagen: Wahrscheinlichkeitstheorie, Entscheidungstheorie, Schätz- und Hypothesentests, Bayessche Statistik, stochastische Prozesse.

  • Angewandte statistische Methoden: Deskriptive und inferenzielle Statistik, lineare Modelle, multivariate Analyse, Stichprobentechniken, fortgeschrittenes Versuchsdesign, nichtlineare Optimierung.

  • Spezialisierte Bereiche: Ökonometrie, Risikotheorie in der Versicherungsmathematik, statistische Methoden in Epidemiologie und Genetik, Meta-Analyse, räumliche Statistik, Splineregression.

  • Data Science & Machine Learning: Klassifikationsmethoden und Big Data Analytics, fortgeschrittenes statistisches Lernen, Einführung in Data Science, Zeitreihenanalyse.

Diese vielfältige Ausbildung befähigte mich:

  • robuste statistische Modelle zu erstellen und zu validieren.

  • fortgeschrittene Machine-Learning- und Data-Mining-Techniken auf große und komplexe Datensätze anzuwenden.

  • Experimente mit rigoroser Methodik zu entwerfen und durchzuführen.

  • komplexe statistische Ergebnisse in klare, umsetzbare Erkenntnisse für Entscheidungen zu übersetzen.

Insgesamt hat das Programm sowohl meine theoretische Expertise als auch meine praktischen Fähigkeiten gestärkt und mich darauf vorbereitet, eine Vielzahl datenbezogener Herausforderungen in Branchen wie Gesundheitswesen, Versicherungen, Finanzen und Forschung zu bewältigen.

Okt. 2008 - Dez. 2010

University Of Yaoundé I

M. Sc. · Mathematics · Yaoundé, Kamerun · Good

Mein Masterstudium in Mathematik hat mir eine tiefgehende und fundierte Ausbildung in reiner und angewandter Mathematik vermittelt und mich mit fortgeschrittenen Fähigkeiten zur Problemlösung, abstraktem Denken und der Fähigkeit ausgestattet, komplexe mathematische Konzepte in praktische Lösungen umzusetzen. Das Programm umfasste sowohl grundlegende Mathematik als auch hochspezialisierte Bereiche, die für moderne Anwendungen in Data Science, Optimierung und wissenschaftlichem Rechnen relevant sind.

Der Lehrplan beinhaltete:

  • Analysis & Funktionelle Räume: Maßtheorie und Integration, Sobolew-Räume, Distributionstheorie, Fourier-Transformation, Funktionalanalysis, Topologie und komplexe Analysis.

  • Geometrie & Algebra: Differentielle Geometrie, Kähler- und Riemannsche Geometrie, Ringe und Moduln, allgemeine Algebra und topologische Vektorräume.

  • Differentialgleichungen & Dynamische Systeme: Gewöhnliche und partielle Differentialgleichungen, numerische Methoden für partielle Differentialgleichungen, kontinuierliche und diskrete dynamische Systeme, inverse Probleme.

  • Optimierung & Numerische Methoden: Nichtlineare Optimierung, fortgeschrittene numerische Analyse, angewandte Statistik, Daten- und Korrespondenzanalyse.

  • Grundlagen & Logik: Mengenlehre, mathematische Logik, Grundlagen der Analysis und Algebra, Informatik für Mathematiker.

  • Wahrscheinlichkeit & Statistik: Wahrscheinlichkeitstheorie, angewandte Statistik und Bezüge zu realen Modellierungen.

Durch dieses Programm habe ich starke analytische Fähigkeiten entwickelt und bin in der Lage:

  • hochkomplexe mathematische Probleme mit theoretischen und numerischen Ansätzen zu lösen.

  • Optimierung und Differentialgleichungen auf reale Phänomene anzuwenden.

  • mit abstrakten mathematischen Strukturen (Algebra, Geometrie, Topologie) zu arbeiten und sie in anwendungsbezogene Kontexte zu übertragen.

  • fortgeschrittene statistische und rechnerische Methoden zur Datenanalyse und Entscheidungsunterstützung einzusetzen.

Dieser vielfältige mathematische Hintergrund ermöglicht es mir, Kundenprojekte mit Präzision, Kreativität und der Flexibilität anzugehen, rigorose Methoden an praktische Geschäfts- und Forschungsherausforderungen anzupassen.

...und 1 Weitere

Zertifikate & Bescheinigungen

AI in Healthcare Specialization

Stanford University, Coursera

Biostatistics in Public Health Specialization

Johns Hopkins University, Coursera

Certified Artificial Intelligence Practitioner

CertNexus, Coursera

Clinical Trials Operations Specialization

Johns Hopkins University, Coursera

Design and Interpretation of Clinical Trials

Johns Hopkins University, Coursera

Drug Development Product Management Specialization

University of California San Diego, Coursera

Google Machine Learning Engineer Professional Certificate

Google Cloud, Coursera

IBM Applied AI Professional Certificate

IBM Developer Skills Network

IBM Full Stack Software Developer Professional Certificate

IBM Developer Skills Network

IBM Machine Learning Professional Certificate

IBM Developer Skills Network

Introduction to Good Clinical Practice

Novartis, Coursera

Microsoft Azure Data Engineering Associate (DP-203) Professional Certificate

Microsoft, Coursera

Microsoft Azure Data Fundamentals DP-900 Exam Prep

Microsoft, Coursera

Python and Statistics for Financial Analysis

The Hong Kong University of Science and Technology, Coursera

Python for Data Science, AI & Development

IBM Developer Skills Network

Understanding Clinical Research: Behind the Statistics

University of Cape Town, Coursera

Sie suchen Freelancer?Passende Kandidaten in Sekunden!
FRATCH GPT testen
Weitere Aktionen