Mahmoud T.

Datenwissenschaftler

Sfax, Tunesien

Erfahrungen

Feb. 2024 - Bis heute
1 Jahr 11 Monaten

Data Scientist

Sofrecom Tunisia, part of Orange Group

  • Entwickelte automatisiertes System zur Extraktion von Audit-Informationen aus PDF-Dokumenten mit GPT-4
  • Implementierte Verarbeitung mehrseitiger PDFs mit Bildkonvertierung
  • Erstellte ein robustes Validierungssystem für extrahierte Daten
  • Entwarf modulare Python-Architektur für skalierbare Verarbeitung
  • Erstellte individuelle Datenvalidierung mit Pydantic-Modellen
  • Erstellte automatisierte Generierung von JSON-Ausgaben
  • Implementierte PDF-zu-Bild-Konvertierung mit optimierter Auflösung
  • Setzte Base64-Codierung für LLM-Kompatibilität ein
  • Führte strukturierte Datenvalidierung und Normalisierung durch
  • Entwickelte Prognose für FTTH-Zugangsaufträge mit 12-monatigem Horizont und multidimensionalen Vorhersagen
  • Erstellte umfassende Pipeline für Feature-Engineering und setzte fortgeschrittene Zeitreihenzerlegung ein
  • Implementierte Ensemble-Modellierung mit R-Paketen feasts und fable und erreichte ca. 5% RMSE
  • Migrierte Prognoselösung zu Dataiku und wandelte R-Code in produktionsbereite Flow-Zonen um
  • Validierte Performance mit nativen Dataiku-Modellen
  • Optimierte Vorhersagemodell für Kofinanzierungen durch Umwandlung von Python-Skripten in Dataiku-Workflows
  • Setzte SQL und native Dataiku-Komponenten vorrangig für Performance ein
  • Entwarf effizienten Prozess zur Erstellung einer Analytics Base Table
  • Validierte MLForecast-Funktion und testete zusätzliche prädiktive Variablen
  • Bewertete alternative Modellierungsansätze und bestätigte die Robustheit der Lösung durch Vergleichsanalysen
Feb. 2022 - Dez. 2022
11 Monaten

Teilzeit-Dozent für Statistik

International School of Business

März 2021 - Feb. 2023
2 Jahren

Data Scientist

Kiota Intelligence

  • Entwickelte prädiktive Modelle für Startup-Überleben, Series-A-Finanzierungswahrscheinlichkeit und Vorbewertungsmodelle
  • Entwickelte Algorithmus zur Investor-Startup-Zuordnung
  • Erstellte interaktives Shiny-Dashboard zur Visualisierung von Finanzierungen mit dynamischen Filtertools
  • Entwickelte multidimensionales Ausreißer-Erkennungssystem und zeitliche Clusteranalyse
  • Entwarf CSS-gestylte RMarkdown-Berichte in automatisierter Form und implementierte E-Mail-Verteilungssystem
  • Entwickelte statistisches Testframework für Finanzierungsrunden und interaktives Filtern zur Investorenzuordnung
Aug. 2019 - Jan. 2021
1 Jahr 6 Monaten

Machine-Learning-Wettbewerbsteilnehmer (R-Programmierer)

Zindi platform for Data Science

  • Erreichte Platz 4 im A14D-Zeitreihen-Wettbewerb 'Predict the Global Spread of COVID-19'
  • Erreichte Top 11% beim Uber Movement SANRAL Cape Town Road Incident Prediction
  • Erreichte Platz 6 im AI Hackathon Tunisia mit einer Betrugserkennungslösung
  • Erzielte Top 36% im Tech4MentalHealth NLP-Klassifikationswettbewerb für Mental Health Chatbot
  • Erreichte Top 26% bei Sendy Logistics ETA Prediction für Motorradlieferungen
  • Erzielte Top 13% im Wettbewerb Financial Inclusion in Africa zur Vorhersage der Bankkontonutzung
  • Nahm am IEEE Big Data Cup zur Vorhersage von Eskalationen im Kundensupport teil
  • Erreichte Top 31% bei Uber Nairobi Ambulance Perambulation Optimization
  • Erreichte Top 37% bei Wazihub Bodenfeuchtevorhersage mit IoT-Sensordaten
  • Erreichte Top 38% bei Vorhersage der Löhne in von Frauen geführten Haushalten in Südafrika
  • Erreichte Top 45% beim Akeed Restaurant Recommendation Engine für Oman
  • Erreichte Top 53% beim UNICEF Flood Prediction Wettbewerb in Malawi
  • Erreichte Top 52% bei der COVID-19 Verwundbarkeitskartierung in Südafrika
  • Erreichte Top 59% in der Sea Turtle Rescue Weekly Forecast Challenge
Nov. 2018 - Jan. 2020
1 Jahr 3 Monaten

Datenwissenschaftler (R-Programmierer)

Freelance

  • Entwickelte umfassendes Machine-Learning-Curriculum und praktische Workshops
  • Erstellte Python-Notebooks für überwachte (lineare/logistische Regression, SVM, Entscheidungsbäume) und unüberwachte Lernverfahren (K-Means)
  • Entwickelte Modelloptimierungstechniken und Best Practices für die ML-Implementierung
  • Erstellte NLP-Klassifizierungssystem mit skalierbarem Textklassifikationsmodell und automatisierter Pipeline zur Kategorievorhersage
  • Erstellte Framework für zukünftige Datenklassifikation
  • Entwickelte Vorhersagemodell für Gewichte anhand von IoT-Sensordaten und optimierte Algorithmen zur Fehlerreduzierung
  • Erstellte Social-Media-Analytics-Plattform mit Facebook-API-Integration, Sentiment-Analyse und umsetzbaren Erkenntnissen
Jan. 2018 - März 2020
2 Jahren 3 Monaten

Datenwissenschaftler

Tunisia Telecom Group

  • Aufbau einer Analytics-Basistabelle aus mehreren Datenquellen mit gründlichen Datenqualitätsprüfungen
  • Durchführung fortgeschrittener Feature-Engineering- und Transformationsprozesse
  • Durchführung statistischer Tests und Korrelationsanalysen
  • Entwicklung eines K-Means-Clustering-Modells für Verhaltenssegmentierung und detaillierte Segmentprofile
  • Konzeption eines automatisierten Klassifizierungssystems zur Zuweisung neuer Kunden
  • Bereitstellung umsetzbarer Kunden-Insights für die Geschäftsstrategie
  • Entwicklung und Validierung von Hypothesen zu Dual-SIM-Nutzungsmustern
  • Entwicklung eines Kunden-Scoring-Algorithmus und detaillierter Nutzerprofile mit SAS Guide und Miner
  • Unterscheidung von Verbindungen auf Haushaltsebene und Identifizierung erweiterter Familiennetzwerke
  • Zusammenarbeit mit Experten von SAS, KPMG und Business & Decision an Modellen zur Kündigungs-, Cross-Sell- und Community-Verknüpfungsanalyse
Juni 2016 - Dez. 2017
1 Jahr 7 Monaten

Datenanalyst

Tunisia Telecom Group

  • Entwicklung von SQL-Ad-hoc-Abfragen und Dashboards für CVM-Performance, Netzwerkqualitäts-KPIs, Datenservice-Durchdringung und Verkaufsanalysen
  • Implementierung einer VBA-Automatisierung für PowerPoint-Berichte und Etablierung von Protokollen zur Datenqualitätsprüfung
  • Konzeption zielgerichteter Marketingkampagnen und Try & Buy-Angebotsrahmen
  • Erstellung datengestützter Produktempfehlungen
Juni 2015 - Dez. 2015
7 Monaten
Toulouse, Frankreich

Forschungsstatistiker

LAAS-CNRS

  • Entwicklung eines Verhaltensmuster-Erkennungsmodells zur Identifizierung von Hausbesitzern
  • Entwicklung eines Echtzeit-Einbruchserkennungsalgorithmus und eines automatisierten Alarmmanagementsystems
  • Konzeption einer Echtzeit-Datenverarbeitungspipeline und statistischer Lernmodelle zur Verhaltensanalyse
  • Aufbau eines automatisierten Entscheidungsfindungssystems
  • Autor eines Forschungsbuchs "Gestion Automatique d'un Système de Sécurisation des Biens à Domicile", veröffentlicht bei European University Editions
  • Erster Platz im IBM Watson Services Wettbewerb und Leitung der KI-Labore als Dozent

Zusammenfassung

Data Scientist mit mehr als 9 Jahren Erfahrung, der technische Genauigkeit mit strategischem Weitblick verbindet. Ich spezialisiere mich auf geschäftsorientierte Daten, nutze tiefgehende Analyse und wiederholtes Erkunden, um aussagekräftige Muster zu entdecken. Meine Leidenschaft ist es, Rohdaten in wirkungsvolle Merkmale zu verwandeln und Modelle zu erstellen, die eng an realen Zielen und Entscheidungsprozessen ausgerichtet sind.

Sprachen

Arabisch
Muttersprache
Englisch
Fortgeschritten
Französisch
Fortgeschritten

Ausbildung

Okt. 2011 - Juni 2015

ESSAI

Ingenieurhochschule · Statistik und Datenanalyse

Okt. 2008 - Juni 2011

IPEIS

Mathematik - Physik · Sfax, Tunesien

High School

Abitur · Informatik

Zertifikate & Bescheinigungen

Fortgeschrittenes R-Programmieren

Coursera (from The Johns Hopkins University)

Erstellung von Features für Zeitreihendaten

Coursera (from SAS)

Praktische Zeitreihenanalyse

Coursera (from The State University Of New York)

Data-Analyst-Kurs in R

DataQuest

Prognose der Produktnachfrage in R

DataCamp Courses

Statistisches Lernen (mit R)

Stanford Online

Zeitreihen mit R (6 Kurse)

DataCamp Courses

Angewandte Datenwissenschaft mit R - Level 2

IBM Badges

Machine Learning mit Andrew Ng

Stanford Online

Prädiktives Modellieren und Text Mining

SAS Badges

Explorative Datenanalyse

SAS Badges

Data-Analyst-Programm

Udacity

Eigenen Chatbot erstellen - Level 1

IBM Badges

Node-RED-Grundlagen für Bots

IBM Badges

SAS-Programmierung 1: Grundlagen

SAS Badges

Einführung in Data Science

Coursera (from IBM)

Einführung in ANOVA, Regression und logistische Regression

SAS Badges

Analyse großer Datensätze (Big-Data-Algorithmen)

Stanford Online

Datenanalyse und -visualisierung mit Excel

edX

Inferenzstatistik und prädiktive Statistik für Unternehmen

Coursera (from Illinois University)

Text-Mining und Analytik

Coursera (from Illinois University)

Clusteranalyse im Data Mining

Coursera (from Illinois University)

SQL

Stanford Online

Data Science: Von Daten zu Erkenntnissen

MIT Professional X

Verwaltung großer Datenmengen mit MySQL und TERADATA

Coursera (from Duke University)

Abfragen mit Transact-SQL

edX (from Microsoft)

Statistik mit R: Korrelation und lineare Regression

DataCamp Courses

Einführung in Python für Data Science

edX (from Microsoft)

Sie suchen Freelancer?Passende Kandidaten in Sekunden!
FRATCH GPT testen
Weitere Aktionen