Recommended expert

Dan Thach

Lead Data Scientist / KI-Plattformingenieur

Dan Thach
Warschau, Polen

Erfahrungen

Apr. 2024 - Bis heute
1 Jahr 10 Monaten

Lead Data Scientist / KI-Plattformingenieur

Tkxel

  • Leitung des Designs und der Bereitstellung einer internen, auf LLM basierenden Assistentenplattform mit über 1.000 täglichen Nutzern, wodurch die Antwortgenauigkeit um 28 % stieg und die Inferenzkosten durch optimierte RAG-Pipeline-Orchestrierung um 15 % sanken.
  • Entwicklung eines unternehmensweiten KI-Governance-Rahmens mit Modellsichtbarkeit und Sicherheitsebenen, um Compliance zu gewährleisten und Halluzinationen in kundenorientierten Modellen zu reduzieren.
  • Aufbau modularer RAG-2.0-Pipelines mit LangChain und eigener Orchestrierung zur dynamischen Kontextabfrage über Produktbereiche hinweg.
  • Zusammenarbeit mit Data Engineering-Teams zur Abstimmung der Feature-Store-Schemata auf ML- und Analyse-Workflows, wodurch Modelliterationen beschleunigt wurden.
  • Betreuung von Junior Engineers zu LLMOps-Best-Practices und skalierbaren Deployment-Strategien in Cloud- und On-Prem-Umgebungen.
  • Tech & Tools: GPT-4/5-APIs, Llama 3, LangChain, HuggingFace, Pinecone, Weaviate, Ray, KServe, MLflow, Kubeflow, Airflow, Feast, Evidently, Prometheus, AWS/GCP
März 2021 - Apr. 2024
3 Jahren 2 Monaten

Senior Machine Learning Engineer (NLP-Schwerpunkt)

Meta

  • Durchführung von Fine-Tuning und Deployment transformerbasierter Modelle für Document Intelligence, was die Textextraktionsgenauigkeit um 21 % steigerte und die Inferenzlatenz durch effizientes Model Serving um 35 % verringerte.
  • Entwurf und Implementierung skalierbarer ML-Pipelines und Retraining-Workflows, wodurch manuelle Retraining-Zyklen um 40 % reduziert und die Modellüberwachung im gesamten Unternehmen verbessert wurden.
  • Aufbau vollständiger NLP-Komponenten einschließlich Tokenisierung, Embeddings und Evaluationssystemen zur Unterstützung von Enterprise-Suche und Wissensextraktion.
  • Entwicklung erster Retrieval-Augmented-Generation-(RAG)-Prototypen für interne Document-Q&A-Lösungen.
  • Zusammenarbeit mit Plattform-Teams zur Integration von ML-Sichtbarkeit und CI/CD-Automatisierung in Kubernetes-Workflows.
  • Durchführung von vergleichenden A/B-Tests zwischen transformerbasierten und konventionellen NLP-Modellen für Produktionseinsatzentscheidungen.
  • Mentoring und Review von Junior Engineers, Standardisierung von Best Practices für NLP-Experimente und Deployment.
  • Tech & Tools: HuggingFace Transformers, BERT, RoBERTa, T5, GPT-3-API, Sentence Transformers, MLflow, DVC, Kubeflow, SageMaker, Feast, Evidently, Spark, Kafka, Delta Lake
Juni 2018 - Feb. 2021
2 Jahren 9 Monaten

Machine-Learning-Ingenieur

Semantic Visions

  • Planung und Bereitstellung von End-to-End-ML-Microservices für Empfehlungen und NLP-Funktionen, um zuverlässiges Model Serving und Monitoring zu gewährleisten.
  • Implementierung von A/B-Test-Frameworks zur Bewertung von ML-Systemen, wodurch die Iterationsgeschwindigkeit und datenbasierte Entscheidungsfindung verbessert wurden.
  • Mitarbeit an der Entwicklung von MLOps-Pipelines einschließlich CI/CD-Workflows, Modellversionierung und automatischem Retraining.
  • Zusammenarbeit mit Data Engineering-Teams zur Optimierung von ETL- und Feature-Pipelines mit Spark und Airflow.
  • Beitrag zur frühen Einführung von MLflow und Model-Observability-Dashboards, was die Transparenz der eingesetzten Modelle erhöhte.
  • Tech & Tools: TensorFlow 2.x, PyTorch, scikit-learn, BERT, Docker, Airflow, Kubernetes, Flask/FastAPI, MLflow, Spark, Kafka, BigQuery, Prometheus, Grafana
Nov. 2016 - Mai 2018
1 Jahr 7 Monaten

Dateningenieur

Featurespace

  • Gestaltung und Implementierung von ETL-zu-ELT-Datenpipelines mit Spark und Airflow, um nahezu Echtzeit-Analysen für Produktkennzahlen zu ermöglichen.
  • Migration wichtiger Datenworkflows von On-Premise zu AWS und GCP, was die Zuverlässigkeit erhöhte und die Latenz verringerte.
  • Aufbau und Pflege von Data Marts und semantischen Schichten zur Unterstützung nachgelagerter Analysen und früher Machine-Learning-Projekte.
  • Einführung von Kafka-Streaming zur Verarbeitung von Event-Daten, was Skalierbarkeit und Monitoring-Funktionen verbesserte.
  • Zusammenarbeit mit Analysten und Data Scientists zur Erstellung effizienter, funktionsbereiter Datenpipelines für Experimente.
  • Tech & Tools: Python 3, SQL, Airflow, Spark, Hive, Kafka, AWS (Redshift, S3), GCP (BigQuery), Docker, Bash
Okt. 2015 - Nov. 2016
1 Jahr 2 Monaten

Junior Dateningenieur (Analytics & ETL)

UiPath

  • Automatisierung veralteter Excel-/VBA-Berichte mit Python und SQL, was manuelle Reporting-Zyklen deutlich verkürzte.
  • Unterstützung beim Aufbau erster BI-Dashboards und ETL-Pipelines für Executive Analytics.
  • Mitarbeit an Pilotprojekten mit Hadoop/Hive zur Bewertung verteilter Datenverarbeitung großer Datensätze.
  • Tech & Tools: SQL (MySQL, Postgres), Python 2.7/3, Excel/VBA, Tableau, Power BI, Linux, Bash

Zusammenfassung

Erfahrener Machine Learning Engineer mit fundiertem Mix aus Data Science, MLOps und Entwicklung von KI-Plattformen, der die Lücke zwischen skalierbaren Machine-Learning-Systemen und geschäftsorientierten Modellierungsstrategien schließt. Mehr als 10 Jahre Erfahrung in Data Engineering, ML-Infrastruktur, NLP und LLM-Anwendungen, mit messbaren Ergebnissen dank Optimierung der Modellleistung, Experimenten und zuverlässigem Produktiveinsatz. Erfahren im Führen funktionsübergreifender ML-Projekte, im Mentoring von Teams und in der Umwandlung komplexer Datenpipelines in einsatzbereite, wertorientierte KI-Lösungen in verschiedenen Cloud-Umgebungen.

Fähigkeiten

  • Programmier­sprachen: Python (Numpy, Pandas, Pyspark), R, Sql, Bash
  • Data Engineering & Verarbeitung: Spark, Kafka, Airflow, Etl-/elt-pipelines, Datenmodellierung (Star/kimball)
  • Machine Learning: Scikit-learn, Tensorflow, Pytorch, Xgboost, Transformers (Bert, Gpt, Llama)
  • Nlp & Llms: Huggingface, Sentence Transformers, Rag-architekturen, Vektordatenbanken (Pinecone, Faiss, Weaviate)
  • Mlops & Plattformen: Mlflow, Kubeflow, Vertex Ai, Sagemaker, Docker, Kubernetes, Ci/cd
  • Experimente & Analysen: A/b-tests, Kausalanalyse, Feature Engineering, Statistische Modellierung
  • Cloud & Infrastruktur: Aws (S3, Ec2, Lambda), Gcp (Vertex, Bigquery), Azure Ml, Nvidia Triton/tensorrt
  • Beobachtung & Governance: Weights & Biases, Evidently, Prometheus, Grafana, Feast, Guardrails Ai
  • Soft Skills: Bereichsübergreifende Zusammenarbeit, Mentoring, Produktorientierte Ml-strategie

Sprachen

Englisch
Verhandlungssicher
Vietnamesisch
Fortgeschritten

Ausbildung

Sept. 2017 - Aug. 2019

University of York

Master of Science in Informatik · Informatik · York, Vereinigtes Königreich

Sept. 2011 - Juni 2015

Hanoi University of Science and Technology

Bachelor of Science in Informatik · Informatik · Hanoi, Vietnam

Sie suchen Freelancer?Passende Kandidaten in Sekunden!
FRATCH GPT testen
Weitere Aktionen

Ähnliche Freelancer

Entdecken Sie andere Experten mit ähnlichen Qualifikationen und Erfahrungen.

Adrian Hoang
Adrian Hoang

Senior Machine-Learning-Ingenieur / Datenwissenschaftler

Profil ansehen
Mateusz Majchrzak
Mateusz Majchrzak

Senior Softwareentwickler

Profil ansehen
Hiroshi Kaneko
Hiroshi Kaneko

Senior Data Scientist

Profil ansehen
Paweł Mucha
Paweł Mucha

Projektleitender Berater für KI-Lösungen

Profil ansehen
Manuel Pasieka
Manuel Pasieka

KI-Ingenieur

Profil ansehen
Lino Giefer
Lino Giefer

Leitender Data Scientist

Profil ansehen
Himanshu Negi
Himanshu Negi

Principal (Datenwissenschaftler/Dateningenieur/Gen-AI-Ingenieur)

Profil ansehen
Martin Musiol
Martin Musiol

Product Owner für AI-Lernplattform

Profil ansehen
Mahabub Akram
Mahabub Akram

Teamleiter – Engagement & Relevanz

Profil ansehen
Stephan Fröde
Stephan Fröde

NLP/LLM-Chatbot

Profil ansehen
Shahab Anbarjafari
Shahab Anbarjafari

Lead-KI-Wissenschaftler – Computer Vision & Sensor Fusion

Profil ansehen
Stephan Baier
Stephan Baier

Freiberuflicher Data Scientist

Profil ansehen
Tungi Dang
Tungi Dang

Technischer PMO | Delivery Master | LLM-Experte

Profil ansehen
Muhammad Ammad-ud-din
Muhammad Ammad-ud-din

Mitgründer

Profil ansehen
Jürgen Fey
Jürgen Fey

AR/VR/XR-Architekt

Profil ansehen
Dmytro Krasnoshlyk
Dmytro Krasnoshlyk

Unternehmensberater

Profil ansehen
Rohit Thanki
Rohit Thanki

Datenwissenschaftler

Profil ansehen
Mathias Wilhelm
Mathias Wilhelm

Entwicklung einer KI-gesteuerten Social Media Automatisierung zur Identifikation von Themen, Textgenerierung und Ausspielung

Profil ansehen
Kiran kumar Kanathala
Kiran kumar Kanathala

Angewandtes NLP: Wortbasierte Kodierung für intelligentere Ereignisvorhersagen

Profil ansehen
Louis Guitton
Louis Guitton

Freiberuflicher Solutions Architect und Machine Learning Engineer

Profil ansehen
Peter Kwohdyehchick
Peter Kwohdyehchick

Senior Softwareentwickler

Profil ansehen
Katharina Schachmatov
Katharina Schachmatov

KI-Ingenieur

Profil ansehen
Silver Rauk
Silver Rauk

Senior KI/ML-Ingenieur

Profil ansehen
Tim Raveneau
Tim Raveneau

KI-Ingenieur

Profil ansehen
Marcel Meyer
Marcel Meyer

Cloud-Architekt, Senior Solution Architekt, Senior Software Engineer

Profil ansehen
Umar Maqsud
Umar Maqsud

Senior KI-Architekt & Ingenieur

Profil ansehen
Kai Kramer
Kai Kramer

Chatbots für Steuer- und Rechtstexte

Profil ansehen
Lucas Habrich
Lucas Habrich

Industrielle Plattform für visuelle Qualitätskontrolle

Profil ansehen
Eduard Van kleef
Eduard Van kleef

Leiter Workshop „Einführung von KI Entwicklungstools“

Profil ansehen
Utku Erol
Utku Erol

KI-Strategieberater

Profil ansehen