Dan T.

Leitender Data Scientist / KI-Plattformingenieur

Warschau, Polen

Erfahrungen

Apr. 2024 - Bis heute
1 Jahr 9 Monaten

Leitender Data Scientist / KI-Plattformingenieur

Tkxel

  • Verantwortlich für Design und Rollout einer internen, auf LLM basierenden Assistenten-Plattform mit über 1.000 täglichen Nutzern, Steigerung der Antwortgenauigkeit um 28 % und Senkung der Inferenzkosten um 15 % durch optimierte RAG-Pipeline-Orchestrierung.
  • Entwicklung eines unternehmensweiten KI-Governance-Rahmens mit Model-Observability- und Sicherheitsfunktionen, um Compliance sicherzustellen und Halluzinationen in kundenorientierten Modellen zu reduzieren.
  • Aufbau modularer RAG 2.0-Pipelines mit LangChain und eigener Orchestrierung für dynamische Kontextabfragen über verschiedene Produktbereiche hinweg.
  • Zusammenarbeit mit Data-Engineering-Teams zur Abstimmung der Feature-Store-Schemata auf ML- und Analytics-Workflows, was die Modelliteration beschleunigte.
  • Betreuung von Junior Engineers in LLMOps-Best-Practices und skalierbaren Deployment-Strategien in Cloud- und On-Prem-Umgebungen.
  • Technologien & Tools: GPT-4/5-APIs, Llama 3, LangChain, HuggingFace, Pinecone, Weaviate, Ray, KServe, MLflow, Kubeflow, Airflow, Feast, Evidently, Prometheus, AWS/GCP
März 2021 - Apr. 2024
3 Jahren 2 Monaten

Senior Machine Learning Engineer (NLP-Fokus)

Meta

  • Leitung von Fine-Tuning und Deployment von transformer-basierten Modellen für Dokumenten-Intelligenz, Steigerung der Textextraktionsgenauigkeit um 21 % und Reduzierung der Inferenzlatenz um 35 % durch effizientes Model-Serving.
  • Entwurf und Implementierung skalierbarer ML-Pipelines und Retraining-Workflows, Reduzierung manueller Retraining-Zyklen um 40 % und Verbesserung der Modellüberwachung unternehmensweit.
  • Aufbau von End-to-End-NLP-Komponenten einschließlich Tokenisierung, Embeddings und Evaluationssystemen zur Unterstützung von Enterprise-Suche und Wissensextraktion.
  • Pionierarbeit bei frühen Retrieval-Augmented-Generation (RAG)-Prototypen für interne Dokumenten-Q&A-Lösungen.
  • Zusammenarbeit mit Plattform-Teams zur Integration von ML-Observability und CI/CD-Automatisierung in Kubernetes-Workflows.
  • Durchführung vergleichender A/B-Tests zwischen transformer-basierten und konventionellen NLP-Modellen für produktionsreife Deployment-Entscheidungen.
  • Tätigkeit als Mentor und Reviewer für Junior Engineers, Standardisierung von Best Practices für NLP-Experimente und Deployments.
  • Technologien & Tools: HuggingFace Transformers, BERT, RoBERTa, T5, GPT-3-API, Sentence Transformers, MLflow, DVC, Kubeflow, SageMaker, Feast, Evidently, Spark, Kafka, Delta Lake
Juni 2018 - Feb. 2021
2 Jahren 9 Monaten

Machine Learning Engineer

Semantic Visions

  • Entwicklung und Rollout von End-to-End-ML-Microservices für Empfehlungs- und NLP-Funktionen, Gewährleistung von zuverlässigem Model-Serving und Monitoring.
  • Implementierung von A/B-Testing-Frameworks zur Bewertung von ML-Systemen, Steigerung der Iterationsgeschwindigkeit und datengesteuerter Entscheidungsfindung.
  • Mitwirkung an der Entwicklung von MLOps-Pipelines, einschließlich CI/CD-Workflows, Modellversionierung und automatischem Retraining.
  • Zusammenarbeit mit Data-Engineering-Teams zur Optimierung von ETL- und Feature-Pipelines mit Spark und Airflow.
  • Beitrag zur frühen Einführung von MLflow und Dashboards zur Model-Observability, Verbesserung der Transparenz aller eingesetzten Modelle.
  • Technologien & Tools: TensorFlow 2.x, PyTorch, scikit-learn, BERT, Docker, Airflow, Kubernetes, Flask/FastAPI, MLflow, Spark, Kafka, BigQuery, Prometheus, Grafana
Nov. 2016 - Mai 2018
1 Jahr 7 Monaten

Data Engineer

Featurespace

  • Entwurf und Implementierung von ETL-zu-ELT-Datenpipelines mit Spark und Airflow zur Ermöglichung von nahezu Echtzeit-Analytics für Produktmetriken.
  • Migration wichtiger Daten-Workflows von On-Premise zu AWS und GCP, Verbesserung der Zuverlässigkeit und Reduzierung der Latenz.
  • Aufbau und Pflege von Data Marts und semantischen Layern zur Unterstützung von Analytics downstream und frühen Machine-Learning-Projekten.
  • Einführung von Kafka-Streaming zur Verarbeitung von Event-Daten, Steigerung der Skalierbarkeit und Monitoring-Funktionen.
  • Zusammenarbeit mit Analysten und Data Scientists zur Erstellung effizienter, feature-bereiter Datenpipelines für Experimente.
  • Technologien & Tools: Python 3, SQL, Airflow, Spark, Hive, Kafka, AWS (Redshift, S3), GCP (BigQuery), Docker, Bash
Okt. 2015 - Nov. 2016
1 Jahr 2 Monaten

Junior Data Engineer (Analytics & ETL)

UiPath

  • Automatisierung von Legacy-Excel/VBA-Berichten mit Python und SQL, wodurch manuelle Reporting-Zyklen deutlich verkürzt wurden.
  • Unterstützung beim Aufbau erster BI-Dashboards und ETL-Pipelines zur Unterstützung der Executive Analytics.
  • Mitarbeit an Pilotprojekten mit Hadoop/Hive zur Evaluierung verteilter Datenverarbeitung großer Datensätze.
  • Technologien & Tools: SQL (MySQL, Postgres), Python 2.7/3, Excel/VBA, Tableau, Power BI, Linux, Bash

Zusammenfassung

Erfahrener Machine Learning Engineer mit einer soliden hybriden Basis in Data Science, MLOps und KI-Plattform-Entwicklung, der die Lücke zwischen skalierbaren Machine-Learning-Systemen und geschäftsorientierten Modellierungsstrategien schließt. Über 10 Jahre Erfahrung in den Bereichen Data Engineering, ML-Infrastruktur, NLP und LLM-basierte Anwendungen, mit messbaren Erfolgen durch Optimierung der Modellleistung, Experimente und Produktionsstabilität. Versiert darin, funktionsübergreifende ML-Initiativen zu leiten, Teams zu betreuen und komplexe Datenpipelines in einsatzbereite, wertorientierte KI-Lösungen in Cloud-Umgebungen zu verwandeln.

Sprachen

Vietnamesisch
Muttersprache
Englisch
Verhandlungssicher

Ausbildung

Sept. 2017 - Aug. 2019

University of York

Master of Science in Informatik · Informatik · York, Vereinigtes Königreich

Sept. 2011 - Juni 2015

Hanoi University of Science and Technology

Bachelor of Science in Informatik · Informatik · Hanoi, Vietnam

Sie suchen Freelancer?Passende Kandidaten in Sekunden!
FRATCH GPT testen
Weitere Aktionen