Geraldine Castillo
Solution Engineer (Daten- & ML-Integration)
Erfahrungen
Solution Engineer (Daten- & ML-Integration)
Amadeus Data Processing GmbH
- Entwarf ML-fähige Datenintegrations-Workflows zwischen On-Premise-Systemen und Cloud-Plattformen (Snowflake, AWS Redshift, Azure) und ermöglichte so skalierbares Feature Engineering und Deployment von Modellen
- Implementierte automatisierte ML-Pipeline-Bereitstellung mit Python, SQL und CI/CD-Tools und reduzierte die Modellbereitstellungszeit um 60 %
- Entwickelte Logik zur Datenumwandlung für die Stammdatensynchronisation zwischen ERP- und Analysesystemen und sicherte so die Datenqualität für prädiktive Modelle
- Arbeitete mit funktionsübergreifenden Teams zusammen, um Geschäftsanforderungen in mathematische Spezifikationen für ML-Lösungen zu übersetzen
Senior Data Scientist und ML-Ingenieur
IQ-EQ Global Investor Services
- Entwickelte und validierte prädiktive Modelle für Kundensegmentierung und Umsatzprognosen mit Ensemble-Methoden (XGBoost, Random Forest) und erreichte eine Genauigkeit von 85 %
- Setzte fortgeschrittene Techniken der statistischen Modellierung (Bayessche Inferenz, multivariate Regression) ein, um Preisstrategien zu optimieren, und trug so zu einem Umsatzwachstum von 12 % bei
- Operationalisierte ML-Modelle auf der Azure-ML-Plattform und implementierte automatisierte Retraining-Pipelines sowie Monitoring-Dashboards
- Integrierte ERP-Daten mit Cloud-Analytics-Plattformen und verarbeitete komplexe, verteilte Datenquellen für die Feature-Generierung
- Führte Hyperparameter-Tuning und Kreuzvalidierung zur Optimierung von Modellen durch und verbesserte den F1-Score um 18 %
Data Scientist & ML-Spezialist
Ernst and Young (EY)
- Entwickelte produktionsreife ML-Modelle mit TensorFlow und PyTorch zur Vorhersage von Kundenabgängen, erreichte eine Recall-Rate von 89 % und verringerte die Abwanderung um 15 %
- Wandte semi-überwachte Lernverfahren an, um unbeschriftete Daten zu nutzen, und verbesserte die Modellleistung mit wenigen gelabelten Daten um 22 %
- Implementierte Zeitreihenprognosemodelle (Prophet, ARIMA, LSTM) zur Bedarfsprognose und erreichte eine MAE-Verbesserung von 35 % gegenüber der Basislinie
- Entwarf und implementierte skalierbare ML-Infrastruktur auf Snowflake + AWS und verarbeitete täglich über 10 Mio. Kundeninteraktionen
- Führte fortgeschrittenes Feature Engineering durch, inklusive Lag-Features, gleitenden Statistiken und Interaktionstermen, und generierte über 50 Features aus Rohdaten
- Übersetzte komplexe betriebliche Optimierungsprobleme (Budgetallokation, Kampagnen-ROI) in mathematische Formulierungen und setzte Lösungen um
- Verarbeitete semi-strukturierte Daten (JSON, Logs) aus verschiedenen Quellen mit PySpark für verteilte Verarbeitung und Modelltraining
Machine Learning Engineer
Infor
- Entwickelte und operationalisierte Gradient-Boosting-Modelle (XGBoost, LightGBM) zur Vorhersage des Customer Lifetime Value und trug so zu einem Umsatzwachstum von 10 % bei
- Entwickelte End-to-End-ML-Pipelines auf AWS (SageMaker, S3) und Snowflake, einschließlich Datenvorverarbeitung, Modelltraining und automatisierter Bereitstellung
- Setzte Ensemble-Methoden ein, die mehrere Modelle kombinierten, um 92 % Genauigkeit in der Betrugserkennung zu erreichen und False Positives um 40 % zu reduzieren
- Implementierte ein A/B-Test-Framework zur Modellevaluation, um statistische Signifikanz und Geschäftsauswirkungen von ML-Interventionen zu messen
- Führte Datenaufbereitung auf komplexen, verteilten Datenquellen (ERP, E-Commerce, CRM) mit Python und SQL durch
- Optimierte Hyperparameter mittels Grid Search und Bayes-Optimierung, reduzierte die Modelltrainingszeit um 50 % und steigerte gleichzeitig die Performance
Data Scientist
Ecorenew Group
- Entwickelte Zeitreihenprognosemodelle mit ARIMA und Prophet und verbesserte die Prognosegenauigkeit der Nachfrage um 25 % zur Bestandsoptimierung
- Baute eine Preisoptimierungs-Engine mit Regressionsmodellen und Constraint-Optimierung und steigerte die Bruttomarge um 10 %
- Wandte statistische Analysen und Hypothesentests an, um Umsatztreiber und operative Engpässe zu identifizieren
- Integrierte E-Commerce-Daten in Analysesysteme für Echtzeit-Tracking von Verkaufs- und Produktperformance
Zusammenfassung
Data Scientist mit über 5 Jahren Erfahrung in der Entwicklung und Operationalisierung von Machine-Learning-Modellen zur Lösung komplexer Geschäftsprobleme. Expertise in statistischer Modellierung, Deep Learning und cloudbasierten ML-Plattformen (AWS, Azure, GCP).
Nachgewiesene Erfolge bei der Übersetzung von Geschäftsanforderungen in mathematische Optimierungsprobleme und der Bereitstellung produktionsreifer ML-Lösungen. Spezialisierung auf Feature Engineering, Ensemble-Methoden und die Integration von Foundation Models (LLMs). Veröffentlicht als Forscher im Bereich KI-Anwendungen mit solider Grundlage in Python, TensorFlow und verteilten ML-Systemen.
Fähigkeiten
- Maschinelles Lernen & Deep Learning: Xgboost, Random Forest, Gradient Boosting, Neuronale Netze, Tensorflow, Pytorch, Ensemble-methoden
- Statistische Modellierung: Bayessche Inferenz, Multivariate Statistik, Zeitreihenanalyse, Hypothesentests, A/b-tests
- Fortgeschrittene Ml-algorithmen: Semi-überwachtes Lernen, Verstärkendes Lernen, Kausale Inferenz, Generierung Synthetischer Daten
- Cloud-ml-plattformen: Aws (Sagemaker, S3, Redshift), Microsoft Azure (Ml Studio, Data Lake), Google Cloud (Vertex Ai, Bigquery)
- Ml-betrieb & Deployment: Versionsverwaltung Von Modellen, Hyperparameter-tuning, Kreuzvalidierung, Ci/cd Für Ml, Apache Airflow
- Programmierung & Tools: Python (Pandas, Numpy, Scikit-learn), R, Pyspark, Sql, Dbt, Git
- Foundation Models & Genai: Integration Von Llms, Transformermodelle, Fine-tuning, Prompt Engineering, Rag-architektur
- Data Engineering: Komplexe Datenaufbereitung, Verteilte Datenverarbeitung, Feature Engineering, Datenpipelines
Sprachen
Ausbildung
Technische Hochschule Deggendorf
M.Eng. · Angewandte KI für das digitale Produktionsmanagement · Deggendorf, Deutschland
Mapua University
M.Sc., Spezialisierung: Fortgeschrittenes Machine Learning, Statistische Modellierung, Deep Learning, Zeitreihenanalyse · Business Analytics · Philippinen · 1,3 - Ausgezeichnet
Polytechnic University of the Philippines
B.Sc. · Industrieingenieurwesen · Philippinen · 1,9 - Sehr gut
Ähnliche Freelancer
Entdecken Sie andere Experten mit ähnlichen Qualifikationen und Erfahrungen.