Hiroshi K.

Senior Data Scientist

Warschau, Polen

Erfahrungen

Okt. 2024 - Sept. 2025
1 Jahr

Senior Data Scientist

Siemens

  • Hat uneinheitliche Annotationsqualität in verteilten Teams durch die Einführung eines gestuften Review-Systems mit strukturierten Feedback-Vorlagen behoben, wodurch Nacharbeiten um 35% verringert und die Inter-Annotator-Übereinstimmung auf einen Cohen’s Kappa von 0,85 verbessert wurde.
  • Behob die Abnahme der inhaltlichen Genauigkeit in KI-generierter technischer Dokumentation durch Entwicklung eines mehrstufigen Verifikations-Workflows, der automatisierte Faktenchecks mit fachkundiger menschlicher Überprüfung kombiniert, und erreichte dabei 98% Genauigkeit bei Fertigungsspezifikationsdokumenten.
  • Beseitigte das Leaken sensibler Inhalte in Trainingsdaten durch Konzeption von PII-Erkennungsfiltern und Etablierung von Schwärzungsprotokollen für IoT-Sensordaten und Wartungslogs, wodurch die Einhaltung der DSGVO und interner Sicherheitsrichtlinien gewährleistet wurde.
  • Optimierte das Onboarding des Annotationsteams durch Erstellung umfassender Trainingsworkshops und Mentorenprogramme, wodurch die Einarbeitungszeit von 6 auf 3 Wochen verkürzt wurde, bei gleichbleibenden Qualitätsstandards.
  • Behob Inkonsistenzen bei der Richtlinieninterpretation durch Entwicklung detaillierter Annotationsprotokolle mit konkreten Beispielen und Randfällen und reduzierte Anfragen zur Klärung in mehrsprachigen Annotationprojekten um 60%.
  • Behob Qualitätsdrift in laufenden Annotationprojekten durch Implementierung statistischer Prozesskontroll-Diagramme und automatisierter Qualitätsprüfungen und entdeckte Abweichungen 3 Tage früher als manuelle Überprüfungen.
  • Verbesserte den Annotationdurchsatz ohne Qualitätsverlust durch Optimierung der Review-Workflows und Einführung von Batch-Verarbeitung für ähnliche Inhaltstypen und steigerte den täglichen Output um 25% bei einer Genauigkeit von über 95%.
  • Behob Ineffizienzen im Feedbackprozess durch Einrichtung strukturierter Peer-Review-Sitzungen und wöchentlicher Kalibrierungsmeetings, wodurch die einheitliche Anwendung der Annotationsrichtlinien durch alle Teammitglieder sichergestellt wurde.
Juni 2021 - Sept. 2024
3 Jahren 4 Monaten

Data Scientist

EPAM Systems

  • Behob Inkonsistenzen bei der Klassifikation von Finanzdokumenten durch Entwicklung eines hierarchischen Annotationssystems mit klaren Entscheidungsbäumen und verbesserte den F1-Score des Klassifikators von 0,78 auf 0,91 bei Banktransaktionsdaten aus SAP und internen Datenbanken.
  • Behandelte Skalierungsherausforderungen bei der Annotation mehrsprachiger Finanzberichte durch Implementierung einer verteilten Labeling-Plattform mit Qualitätsschranken, die monatlich über 50.000 Dokumente mit einer Konsistenz von 94% zwischen englischen und deutschen Inhalten verarbeitete.
  • Behob Leistungsverlust des Modells in der Produktion durch Einrichtung kontinuierlicher Annotation-Pipelines für schwierige Fälle und reduzierte so False Positives in der Betrugserkennung um 22%, während der Recall in Transaktionsmonitoring-Systemen bei 99,9% blieb.
  • Behob Qualitätsprobleme der Trainingsdaten durch Implementierung von Schema-Validierung und Ausreißererkennung in Feature-Pipelines und reduzierte datenbezogene Produktionsvorfälle bei Kundenanwendungen im Finanzdienstleistungsbereich um 65%.
  • Beseitigte Annotation-Rückstau während der Projekt-Skalierung durch Gestaltung effizienter Batch-Verarbeitungs-Workflows und Priorisierungswarteschlangen, wobei die SLA-Einhaltung trotz einer Verdreifachung des Volumens in den Quartalsberichtszeiträumen gewährleistet wurde.
  • Steigerte teamübergreifende Annotationkonsistenz durch wöchentliche Kalibrierungssitzungen und Erstellung detaillierter Feedbackdokumentationen und erreichte eine Inter-Annotator-Übereinstimmung von 0,88 in verteilten Teams in verschiedenen Zeitzonen.
  • Behandelte Herausforderungen bei der Modellinterpretierbarkeit in Kundenpräsentationen durch Erstellung umfassender Annotationsrichtlinien mit Geschäftskontext und verkürzte die Erklärungszeit während Stakeholder-Reviews von 45 auf 15 Minuten.
Aug. 2019 - Juni 2021
1 Jahr 11 Monaten

Senior MLOps

Fujitsu

  • Überwand manuelle Annotationengpässe bei der Erkennung von Fertigungsfehlern durch Implementierung halbautomatisierter Labeling-Tools mit menschlicher Verifizierung und reduzierte die Labeling-Zeit für CV-Modelle zur Verarbeitung von Produktionslinienbildern um 40%.
  • Behob Chaos bei der Versionierung von Trainingsdaten durch Einrichtung eines zentralen Annotations-Speichers mit Metadatenverfolgung und ermöglichte reproduzierbares Modelltraining über mehrere Datensätze von Fertigungsanlagen hinweg.
  • Behob Qualitätsinkonsistenzen in der Sensordatenannotation durch Entwicklung standardisierter Labeling-Protokolle und Durchführung von Train-the-Trainer-Sessions und verbesserte die Modellgenauigkeit bei Aufgaben zur vorausschauenden Wartung um 15%.
  • Behandelte Zuverlässigkeitsprobleme von Annotation-Tools durch Migration von Custom-Skripten zu containerisierten Labeling-Anwendungen und erreichte eine Verfügbarkeit von 99,5% für verteilte Annotationsteams an drei Fertigungsstandorten.
Apr. 2014 - Aug. 2019
5 Jahren 5 Monaten

Machine Learning Engineer

Fujitsu

  • Behob anfängliche Herausforderungen beim Datenlabeling für frühe ML-Projekte durch Entwicklung strukturierter Annotationsrichtlinien und Qualitätssicherungsverfahren und schuf damit die Grundlage für reproduzierbare Modellentwicklung.
  • Überwand die begrenzte Verfügbarkeit von Trainingsdaten durch Implementierung von Datenaugmentationstechniken und systematischen Labeling-Workflows und ermöglichte so die erfolgreiche Bereitstellung der ersten Generation von Empfehlungssystemen.
  • Behob Inkonsistenzen in der Annotation zwischen Teammitgliedern durch Erstellung detaillierter Beispiele und Dokumentation von Randfällen und verbesserte die Stabilität der Modellleistung während der ersten Produktionsbereitstellungen.
  • Behandelte manuelle Engpässe in der Qualitätssicherung durch Entwicklung automatisierter Validierungsskripte für annotierte Datensätze und verkürzte die Überprüfungszeit um 50% bei gleichbleibend hohen Datenqualitätsstandards.

Zusammenfassung

Über 10 Jahre Erfahrung im Aufbau und Einsatz von Machine-Learning-Systemen in den Bereichen Fertigung und Finanzdienstleistungen. Spezialisiert auf die vollständige MLOps-Implementierung mit Expertise in der Qualitätssicherung von Datenannotationen, Bewertung der inhaltlichen Richtigkeit und Workflows zur Inhaltsmoderation. Nachweisliche Erfolge bei der Einrichtung von Qualitätskontrollprozessen für KI-Trainingsdaten und der Implementierung strukturierter Feedbacksysteme für Annotationsteams. Verbindet tiefgehendes technisches ML-Wissen mit praktischer Erfahrung in der Betreuung von Junior-Mitarbeitenden und der Durchführung von Qualitätsprüfungen.

Sprachen

Japanisch
Muttersprache
Deutsch
Verhandlungssicher
Englisch
Verhandlungssicher

Ausbildung

Apr. 2016 - März 2018

Tokyo University of Science

Informatik · Informatik · Japan

Apr. 2010 - März 2014

Tokyo University of Science

Informatik · Informatik · Japan

Zertifikate & Bescheinigungen

Google Professional Machine Learning Engineer

AWS Certified Machine Learning - Specialty

DeepLearning.AI Natural Language Processing Specialization

Sie suchen Freelancer?Passende Kandidaten in Sekunden!
FRATCH GPT testen
Weitere Aktionen