Hiroshi K.

Senior Data Scientist

Warschau, Polen

Erfahrungen

Okt. 2024 - Sept. 2025
1 Jahr
München, Deutschland

Senior Data Scientist

Siemens

  • Behob inkonsistente Annotationsergebnisse in verteilten Teams durch Einführung eines gestuften Prüfsystems mit strukturierten Feedback-Vorlagen, reduzierte die Nacharbeit um 35% und steigerte die Übereinstimmung der Annotatoren auf einen Cohen's Kappa von 0,85.
  • Behob Verschlechterungen der faktischen Genauigkeit in KI-generierter technischer Dokumentation durch Entwicklung eines mehrstufigen Verifikations-Workflows, der automatisierte Faktenchecks mit Expertenprüfungen kombiniert, und erreichte so 98% Genauigkeit bei Fertigungsspezifikationsdokumenten.
  • Verhinderte das Leaken sensibler Inhalte in Trainingsdaten durch Entwicklung von PII-Erkennungsfiltern und Einführung von Schwärzungsprotokollen für IoT-Sensordaten und Wartungsprotokolle und stellte so die Einhaltung der DSGVO und interner Sicherheitsrichtlinien sicher.
  • Optimierte das Onboarding neuer Annotatoren durch umfassende Trainingsworkshops und Mentorenprogramme, verkürzte die Einarbeitungszeit von 6 auf 3 Wochen und hielt dabei die Qualitätsstandards ein.
  • Beseitigte Uneinheitlichkeiten bei der Interpretation von Richtlinien durch Ausarbeitung detaillierter Annotationsprotokolle mit konkreten Beispielen und Randfällen, wodurch die Rückfragen um 60% in mehrsprachigen Annotationsprojekten sanken.
  • Behob Qualitätsabweichungen in laufenden Annotationsprojekten durch Einsatz von Prozesskontroll-Diagrammen und automatisierten Qualitätsprüfungen, erkannte Abweichungen 3 Tage früher als manuelle Reviews.
  • Steigerte den Annotationsthroughput bei gleichbleibender Qualität durch Optimierung der Review-Workflows und Einführung von Batch-Verarbeitung für ähnliche Inhalte, erhöhte die tägliche Leistung um 25% bei über 95% Genauigkeit.
  • Beseitigte Ineffizienzen im Feedback-Loop durch Einführung strukturierter Peer-Review-Sitzungen und wöchentlicher Kalibrierungsmeetings, um eine einheitliche Anwendung der Annotationsrichtlinien im gesamten Team sicherzustellen.
Juni 2021 - Sept. 2024
3 Jahren 4 Monaten
Warschau, Polen

Data Scientist

EPAM Systems

  • Behob inkonsistente Klassifikationen bei Finanzdokumenten durch Entwicklung eines hierarchischen Annotationssystems mit klaren Entscheidungsbäumen und verbesserte den F1-Score des Klassifikators von 0,78 auf 0,91 für Banktransaktionsdaten aus SAP und internen Datenbanken.
  • Bewältigte Skalierungsprobleme bei der Annotation mehrsprachiger Finanzberichte durch Einführung einer verteilten Labeling-Plattform mit Qualitäts-Gates und bearbeitete monatlich über 50.000 Dokumente mit 94% Konsistenz in englischen und deutschen Inhalten.
  • Behob Leistungsabfälle von Modellen in der Produktion durch Einrichtung kontinuierlicher Annotation-Pipelines für schwierige Fälle, reduzierte falsch-positive Ergebnisse in der Betrugserkennung um 22% und behielt dabei 99,9% Recall in Transaktionsüberwachungssystemen bei.
  • Behob Probleme mit der Qualität der Trainingsdaten durch Implementierung von Schema-Validierung und Ausreißererkennung in Feature-Pipelines und verringerte datenbedingte Produktionsvorfälle um 65% in Finanzdienstleistungsanwendungen der Kunden.
  • Beseitigte den Annotationsrückstau bei Projekt-Skalierung durch Gestaltung effizienter Batch-Workflows und Priorisierungs-Warteschlangensysteme und gewährleistete SLA-Einhaltung trotz einer Verdreifachung des Umfangs in Quartalsberichtszeiträumen.
  • Steigerte die Konsistenz der Annotationen zwischen Teams durch wöchentliche Kalibrierungssitzungen und Erstellung detaillierter Feedback-Dokumentationen und erreichte eine Inter-Annotator-Übereinstimmung von 0,88 in verteilten Teams in verschiedenen Zeitzonen.
  • Bewältigte Herausforderungen bei der Modellinterpretierbarkeit in Kundenpräsentationen durch Erstellung umfassender Annotationsrichtlinien mit Geschäftsbezug und verkürzte die Erklärungszeit in Stakeholder-Reviews von 45 auf 15 Minuten.
Aug. 2019 - Juni 2021
1 Jahr 11 Monaten
Warschau, Polen

Senior MLOps

Fujitsu

  • Behob manuelle Engpässe bei der Annotation zur Erkennung von Fertigungsfehlern durch Implementierung halbautomatischer Labeling-Tools mit menschlicher Verifizierung und reduzierte die Labeling-Zeit für CV-Modelle bei der Verarbeitung von Produktionsstraßenbildern um 40%.
  • Beseitigte Chaos bei der Versionsverwaltung von Trainingsdaten durch Einrichtung eines zentralen Annotation-Speichers mit Metadaten-Tracking und ermöglichte reproduzierbares Modelltraining über mehrere Datensätze von Fertigungsstandorten hinweg.
  • Behob Qualitätsinkonsistenzen bei der Sensordaten-Annotation durch Entwicklung standardisierter Labeling-Protokolle und Durchführung von Train-the-Trainer-Schulungen, steigerte die Modellgenauigkeit für Predictive-Maintenance-Aufgaben um 15%.
  • Beseitigte Probleme mit der Zuverlässigkeit von Annotationstools durch Migration von benutzerdefinierten Skripten zu containerisierten Labeling-Anwendungen und erreichte 99,5% Verfügbarkeit für verteilte Annotationsteams an drei Fertigungsstandorten.
Apr. 2014 - Aug. 2019
5 Jahren 5 Monaten
Japan

Machine Learning Engineer

Fujitsu

  • Löste anfängliche Herausforderungen bei der Datenannotation für frühe ML-Projekte durch Entwicklung strukturierter Annotationsrichtlinien und Qualitätssicherungsverfahren und legte damit die Grundlage für reproduzierbare Modellentwicklungen.
  • Bewältigte begrenzte Verfügbarkeit von Trainingsdaten durch Implementierung von Datenaugmentierungstechniken und systematischen Labeling-Workflows und ermöglichte so die erfolgreiche Einführung von Empfehlungssystemen der ersten Generation.
  • Behob Inkonsistenzen bei der Annotation durch verschiedene Teammitglieder durch Erstellung detaillierter Beispiele und Randfall-Dokumentationen und verbesserte die Stabilität der Modellleistung während der ersten Produktionseinführungen.
  • Beseitigte manuelle Engpässe in der Qualitätssicherung durch Entwicklung automatisierter Validierungsskripte für annotierte Datensätze und verkürzte die Überprüfungszeit um 50% bei gleichbleibend hohen Datenqualitätsstandards.

Zusammenfassung

Über 10 Jahre Erfahrung im Aufbau und Einsatz von Machine Learning Systemen in den Bereichen Fertigung und Finanzdienstleistungen. Spezialisierung auf End-to-End MLOps-Implementierungen mit Fachwissen in Qualitätssicherung bei Datenannotation, Bewertung faktischer Genauigkeit und Content-Moderations-Workflows. Nachweisliche Erfolge beim Aufbau von Qualitätskontrollprozessen für KI-Trainingsdaten und bei der Einführung strukturierter Feedback-Systeme für Annotationsteams. Verbindet tiefes technisches ML-Wissen mit praktischer Erfahrung in der Betreuung von Junior-Mitarbeitern und der Durchführung von Qualitätssicherungs-Reviews.

Sprachen

Japanisch
Muttersprache
Deutsch
Verhandlungssicher
Englisch
Verhandlungssicher

Ausbildung

Apr. 2016 - März 2018

Tokyo University of Science

Master in Informatik · Informatik · Japan

Apr. 2010 - März 2014

Tokyo University of Science

Bachelor in Informatik · Informatik · Japan

Zertifikate & Bescheinigungen

Google Professional Machine Learning Engineer

Google

AWS Certified Machine Learning - Specialty

AWS

DeepLearning.AI Natural Language Processing Specialization

DeepLearning.AI

Sie suchen Freelancer?Passende Kandidaten in Sekunden!
FRATCH GPT testen
Weitere Aktionen