Mahmoud T.

Datenwissenschaftler

Sfax, Tunesien

Erfahrungen

Feb. 2024 - Bis heute
1 Jahr 9 Monaten

Datenwissenschaftler

Sofrecom Tunisia, part of Orange Group

  • Entwickelte ein automatisches System zur Extraktion von Audit-Informationen aus PDFs mithilfe von GPT-4
  • Implementierte mehrseitige PDF-Verarbeitung mit Bildkonvertierung
  • Erstellte ein robustes Validierungssystem für extrahierte Daten
  • Entwarf modulare Python-Architektur für skalierbare Verarbeitung
  • Erstellte individuelle Datenvalidierung mit Pydantic-Modellen
  • Entwickelte automatisierte JSON-Ausgabe
  • Implementierte PDF-zu-Bild-Konvertierung mit optimierter Auflösung
  • Setzte Base64-Codierung für LLM-Kompatibilität ein
  • Führte strukturierte Datenvalidierung und -normalisierung durch
  • Entwickelte Prognose für FTTH-Zugangsbestellungen mit 12-monatigem Horizont und multidimensionalen Vorhersagen
  • Erstellte umfassende Feature-Engineering-Pipeline und verwendete fortgeschrittene Zeitreihenzerlegungstechniken
  • Implementierte Ensemble-Modellierung mit R-Paketen feasts und fable und erreichte ca. 5% RMSE
  • Migrierte die Forecasting-Lösung zu Dataiku und wandelte R-Code in produktionsreife Flow Zones um
  • Validierte die Performance mit den nativen Modellen von Dataiku
  • Optimierte das Co-Finanzierungs-Vorhersagemodell durch Umwandlung von Python-Skripten in Dataiku-Workflows
  • Priorisierte SQL und native Dataiku-Komponenten zur Leistungssteigerung
  • Entwickelte einen effizienten Prozess zur Erstellung von Analytics Base Tables
  • Validierte die MLForecast-Funktion und testete zusätzliche Prädiktorvariablen
  • Bewertete alternative Modellierungsansätze und bestätigte die Robustheit der Lösung durch Vergleichsanalyse
Feb. 2022 - Dez. 2022
11 Monaten

Teilzeit-Dozent für Statistik

International School of Business

März 2021 - Feb. 2023
2 Jahren

Datenwissenschaftler

Kiota Intelligence

  • Entwickelte prädiktive Modelle für das Überleben von Startups, die Wahrscheinlichkeit für Series-A-Finanzierungen und Pre-Valuation-Modellierung
  • Entwickelte Algorithmus zur Zuordnung von Investoren und Startups
  • Erstellte interaktives Shiny-Dashboard zur Visualisierung von Finanzierungen mit dynamischen Filteroptionen
  • Entwickelte multidimensionales Ausreißer-Erkennungssystem und temporale Clusteranalyse
  • Entwarf automatisierte Berichte in RMarkdown mit CSS-Styling und implementierte ein E-Mail-Verteilungssystem
  • Entwickelte statistisches Testframework für Finanzierungsrunden und interaktive Filterfunktionen zur Investoren-Startup-Zuordnung
Aug. 2019 - Jan. 2021
1 Jahr 6 Monaten

Machine Learning Competitor (R programmer)

Zindi platform for Data Science

  • Belegte den 4. Platz im Zeitreihenwettbewerb A14D Predict the Global Spread of COVID-19
  • Zählte zu den besten 11% bei der Vorhersage von Straßenunfällen in Kapstadt (Uber Movement SANRAL)
  • Belegte den 6. Platz beim AI Hackathon Tunisia mit einer Betrugserkennungslösung
  • Zählte zu den besten 36% beim Tech4MentalHealth NLP-Klassifikationswettbewerb für einen Mental-Health-Chatbot
  • Zählte zu den besten 26% bei der ETA-Vorhersage für Motorradlieferungen von Sendy Logistics
  • Zählte zu den besten 13% beim Wettbewerb Financial Inclusion in Africa zur Vorhersage der Bankkontennutzung
  • Nahm am IEEE Big Data Cup zur Vorhersage von Eskalationen im Kundensupport teil
  • Zählte zu den besten 31% bei der Optimierung von Rettungswageneinsätzen in Nairobi (Uber)
  • Zählte zu den besten 37% beim Wazihub-Wettbewerb zur Bodenfeuchtevorhersage mit IoT-Sensordaten
  • Zählte zu den besten 38% bei der Lohnvorhersage in von Frauen geführten Haushalten in Südafrika
  • Zählte zu den besten 45% beim Akeed-Wettbewerb zur Restaurantempfehlung für Oman
  • Zählte zu den besten 53% im UNICEF-Wettbewerb zur Hochwasservorhersage in Malawi
  • Zählte zu den besten 52% bei der Vulnerabilitätskartierung für COVID-19 in Südafrika
  • Zählte zu den besten 59% beim Wochenprognose-Wettbewerb Sea Turtle Rescue
Nov. 2018 - Jan. 2020
1 Jahr 3 Monaten

Datenwissenschaftler (R-Programmierer)

Freelance

  • Entwickelte umfassendes Machine-Learning-Curriculum mit praktischen Übungen
  • Erstellte Python-Notebooks für überwachte (lineare/logistische Regression, SVM, Entscheidungsbäume) und unüberwachte Lernmethoden (K-Means)
  • Entwickelte Modelloptimierungstechniken und Best Practices für die ML-Implementierung
  • Baute ein NLP-Klassifikationssystem mit skalierbarem Textklassifizierungsmodell und automatisierter Pipeline zur Kategorievorhersage
  • Erstellte Framework für zukünftige Datenklassifizierung
  • Entwickelte IoT-Sensoranalyse-Modell zur Gewichtsprognose und optimierte Fehlerreduktionsalgorithmen
  • Entwickelte Social-Media-Analytics-Plattform mit Facebook-API-Integration, Sentiment-Analyse und umsetzbaren Erkenntnissen
Jan. 2018 - März 2020
2 Jahren 3 Monaten

Datenwissenschaftler

Tunisia Telecom Group

  • Erstellung einer Analytics-Basistabelle aus mehreren Datenquellen mit robusten Datenqualitätsprüfungen
  • Durchführung fortgeschrittener Feature-Engineering-Maßnahmen und Transformationen
  • Statistische Tests und Korrelationsanalysen durchgeführt
  • Entwicklung eines K-Means-Clustering-Modells zur Verhaltenssegmentierung und Erstellung detaillierter Segmentprofile
  • Konzeption eines automatisierten Klassifizierungssystems zur Zuordnung neuer Kunden
  • Bereitstellung umsetzbarer Kunden-Erkenntnisse für die Geschäftsstrategie
  • Entwicklung und Validierung von Hypothesen zu Dual-SIM-Nutzungsmustern
  • Entwicklung eines Kundenbewertungsalgorithmus und detaillierter Nutzerprofile mit SAS Guide und Miner
  • Erkennung von Verbindungen auf Haushaltsebene und Identifizierung erweiterter Familennetzwerke
  • Zusammenarbeit mit Experten von SAS, KPMG und Business&Decision an Modellen zur Abwanderung, Cross-Selling und Community-Link-Analyse
Juni 2016 - Dez. 2017
1 Jahr 7 Monaten

Datenanalyst

Tunisia Telecom Group

  • Erstellung von SQL-Ad-hoc-Abfragen und Dashboards für CVM-Performance, Netzqualitäts-KPIs, Durchdringung von Datendiensten und Verkaufsanalysen
  • Implementierung von VBA-Automatisierungen für PowerPoint-Berichte und Einrichtung von Protokollen zur Datenqualitätsprüfung
  • Konzeption zielgerichteter Marketingkampagnen und Try-&-Buy-Angebotsrahmen
  • Erstellung datenbasierter Produktempfehlungen
Juni 2015 - Dez. 2015
7 Monaten
Toulouse, Frankreich

Forschungsstatistiker

LAAS-CNRS

  • Entwicklung eines Modells zur Erkennung von Verhaltensmustern zur Identifizierung von Hausbesitzern
  • Erstellung eines Echtzeit-Algorithmus zur Einbruchserkennung und eines automatisierten Alarmmanagementsystems
  • Konzeption einer Echtzeit-Datenverarbeitungspipeline und statistischer Lernmodelle zur Verhaltensanalyse
  • Aufbau eines automatisierten Entscheidungsfindungssystems
  • Autor des Forschungsbuchs "Gestion Automatique d'un Système de Sécurisation des Biens à Domicile" veröffentlicht bei European University Editions
  • Erster Platz im IBM Watson Services Wettbewerb und Leitung von AI Labs als Dozent

Zusammenfassung

Datenwissenschaftler mit über 9 Jahren Erfahrung, der technische Genauigkeit mit strategischem Weitblick verbindet. Ich spezialisiere mich auf die Arbeit mit unternehmensbezogenen Daten, wende tiefes analytisches Denken und iterative Erkundung an, um aussagekräftige Muster zu finden. Meine Leidenschaft ist es, Rohdaten in wertvolle Features zu verwandeln und Modelle zu entwickeln, die eng mit den Zielen und Entscheidungsprozessen in der Praxis übereinstimmen.

Sprachen

Arabisch
Muttersprache
Englisch
Verhandlungssicher
Französisch
Verhandlungssicher

Ausbildung

Okt. 2011 - Juni 2015

ESSAI

Ingenieurschule · Statistik und Datenanalyse

Okt. 2008 - Juni 2011

IPEIS

Mathematik-Physik · Sfax, Tunesien

High School

Abitur · Informatik

Zertifikate & Bescheinigungen

Advanced R Programming

Coursera (from The Johns Hopkins University)

Creating Features For Time Series Data

Coursera (from SAS)

Practical Time Series Analysis

Coursera (from The State University Of New York)

Data Analyst In R Path

DataQuest

Forecasting Product Demand In R

DataCamp Courses

Statistical Learning (Using R)

Stanford Online

Time Series With R Track (6 Courses)

DataCamp Courses

Applied Data Science With R - Level 2

IBM Badges

Machine Learning By Andrew Ng

Stanford Online

Predictive Modeling And Text Mining

SAS Badges

Exploratory Data Analysis

SAS Badges

Data Analyst Track

Udacity

Build Your Own Chatbot - Level 1

IBM Badges

Node-Red Basics To Bots

IBM Badges

SAS Programming 1: Essentials

SAS Badges

Data Science Orientation

Coursera (from IBM)

Introduction To Anova, Regression And Logistic Regression

SAS Badges

Mining Massive Datasets (Big-Data Algorithms)

Stanford Online

Analyzing And Visualizing Data With Excel

edX

Inferential And Predictive Statistics For Business

Coursera (from Illinois University)

Text Mining And Analytics

Coursera (from Illinois University)

Cluster Analysis In Data Mining

Coursera (from Illinois University)

SQL

Stanford Online

Data Science: Data To Insights

MIT Professional X

Managing Big Data With MySQL And TERADATA

Coursera (from Duke University)

Querying With Transact-SQL

edX (from Microsoft)

Statistics With R: Correlation And Linear Regression

DataCamp Courses

Introduction To Python For Data Science

edX (from Microsoft)

Sie suchen Freelancer?Passende Kandidaten in Sekunden!
FRATCH GPT testen
Weitere Aktionen