Adrian Hoang
Senior Machine-Learning-Ingenieur / Datenwissenschaftler
Erfahrungen
Senior Machine-Learning-Ingenieur / Datenwissenschaftler
Artefact
- Entwicklung eines Evaluations-Workflows für Antworten von Sprachmodellen mit automatisierter Bewertungslogik und strukturierten manuellen Prüfungen, um stabilere Einschätzungen bei mehreren internen Aufgaben zu erhalten.
- Implementierung retrieval-basierter Prototypen mit Python, PyTorch und Vektorindizierung zur Unterstützung kontextbezogener Schlussfolgerungen in internen Dokumenten; inklusive Prüfungen zur Reproduzierbarkeit und festem Seed.
- Aufbau wiederholbarer Benchmark-Datensätze mit dokumentierten Bewertungskriterien, damit verschiedene Prompt-Revisionen und feinabgestimmte Versionen konsistent verglichen werden können.
- Analyse von Fehlermustern in generierten Ausgaben durch explorative Datenuntersuchungen, was spätere Datensatzauswahlen für Feinabstimmungen beeinflusste.
- Erstellung kleiner End-to-End-Analyseaufgaben zum Testen von Modell-Denkprozessen, die Datenaufbereitung, statistische Zusammenfassungen und einfache Vorhersagekomponenten abdecken, damit Forschungsteams Schwächen in realistischen Abläufen prüfen können.
- Enge Zusammenarbeit mit Produkt- und Technikteams, um Versuchsergebnisse in gestaffelte Rollout-Pläne zu überführen.
- Spürbare Verkürzung der Evaluationszyklen durch Umstrukturierung einiger Python-Tools und Hinzufügen leichter Werkzeuge für Nachvollziehbarkeit.
Senior KI/ML Datenwissenschaftler
Miquido
- Planung von A/B-Tests und statistischen Validierungsschritten zur Messung der geschäftlichen Auswirkungen neuer Funktionen, die auf Vorhersagemodellen basieren.
- Prototypische Entwicklung von NLP-, Empfehlungs- und strukturierten Datenmodellen in PyTorch und Hugging Face; Vergleich verschiedener Modellfamilien mit Basisansätzen in deterministischen Abläufen.
- Erstellung und Pflege von Feature-Engineering-Pipelines in Python und SQL zur Unterstützung regelmäßiger Datensatz-Updates und reproduzierbarer Experimente.
- Durchführung explorativer Studien zur Diagnose von Änderungen in Modellausgaben und zur Identifikation von Stichprobenverschiebungen oder Datenqualitätsproblemen.
- Standardisierung des Experiment-Trackings mit MLflow, um Vergleiche zwischen Modellversionen für Analysten und Entwickler zu erleichtern.
- Zusammenarbeit mit Entwicklungsteams zur Verfeinerung von Monitoring-Signalen nach dem Deployment und Hinzufügen fehlender Prüfungen zur Datenintegrität.
- Einführung eines Satzes analytischer Szenarien für interne Tests zur Bewertung der Modellargumentation; abgedeckt wurden Datenreinigung, Feature-Erstellung, einfache Prognosen und Interpretationsschritte.
- Betreuung weniger erfahrener Teammitglieder bei der Versuchsplanung, Dokumentationspraxis und klaren Ergebniskommunikation.
Machine-Learning-Ingenieur / Ingenieur für angewandte Forschung
PELTARION
- Vergleich mehrerer Modellierungsstrategien mit scikit-learn, TensorFlow und PyTorch, um Kompromisse zwischen Vorhersagestabilität und Datenbedarf zu verstehen.
- Aufbau von Datensatzvorbereitungs-Pipelines und Feature-Transformationen in Python und SQL für kontrollierte Experimente.
- Nutzung von Jupyter-Analysen zur Präsentation von Ergebnissen an Produkt- und Technikpartner, um den Forschungsschwerpunkt auf wertvolle Modellansätze einzugrenzen.
- Erstellung interner Skripte zur Protokollierung von Experimentläufen und Visualisierung von Performance-Trends, um die Forschungszyklen konsistenter zu gestalten.
Datenwissenschaftler
Seldon
- Durchführung explorativer Analysen und Hypothesentests zur Aufdeckung von Verhaltensmustern und zur Unterstützung von Planungsgesprächen.
- Erstellung prädiktiver Scoring-Modelle in Python und Validierung der Leistung durch retrospektive Auswertung und kontrollierte Experimente, wenn möglich.
Softwareingeneur
Neoteric
- Entwicklung von Python-Hilfsprogrammen für Datenextraktion und -transformation, die von Analyse- und Reporting-Teams genutzt werden.
- Abstimmung mit Analysten, um eine einheitliche Datenformatierung und -interpretation in allen Pipelineschritten sicherzustellen.
Zusammenfassung
Senior Machine-Learning-Ingenieur mit über 10 Jahren Erfahrung in Data Science, Forschungsprototypen und Modellevaluation für den praktischen Einsatz. Ich verfüge über Erfahrung in statistischer Modellierung, Experimenten und im Entwurf von Bewertungsrahmen, die klare Entscheidungen ermöglichen. Ich fühle mich sowohl in explorativer Forschung als auch beim Einrichten von Experimenten für reale Rollouts wohl. Meine Arbeit konzentriert sich dabei stets auf sorgfältiges Abwägen, strukturierte Analysen und schrittweise, evidenzbasierte Verbesserungen. Kürzlich lag mein Schwerpunkt auf der Bewertung von Sprachmodellen, Retrieval-Workflows und der Problemgestaltung, die mehrstufiges analytisches Denken erfordern.
Fähigkeiten
- Python
- C++
- Pytorch
- Tensorflow
- Hugging Face Transformers
- Numpy
- Pandas
- Scipy
- Scikit-learn
- Statsmodels
- Sql
- Langchain
- Fastapi
- Opencv
- Detectron2
- Mmdetection
- Yolo
- Cuda
- Tensorrt
- Onnx Runtime
- Docker
- Kubernetes
- Mlflow
- Weights & Biases
- Ray
- Airflow
- Aws
- Gcp
- Azure Ml
- Git
- Linux
- Bash
- Datenversionierung (Dvc)
- Ci/cd
- Rest-apis
- Cloud-bereitstellung
- Multi-gpu-training
- Vektor-datenbanken
- Retrieval-unterstützte Generierung
- Statistische Modellierung
- Versuchsplanung
- Reproduzierbare Analyse
Sprachen
Ausbildung
University of Essex
Master of Science in Informatik · Informatik · Colchester, Vereinigtes Königreich
Hanoi University of Science and Technology
Bachelor of Science in Informatik · Informatik · Hanoi, Vietnam
Ähnliche Freelancer
Entdecken Sie andere Experten mit ähnlichen Qualifikationen und Erfahrungen.