Hiroshi Kaneko

Senior Data Scientist

Hiroshi Kaneko
Warschau, Polen

Erfahrungen

Okt. 2024 - Sept. 2025
1 Jahr
München, Deutschland

Senior Data Scientist

Siemens

  • Behobene Inkonsistenzen in der Annotationqualität in verteilten Teams durch Implementierung eines gestuften Prüfungssystems mit strukturierten Feedbackvorlagen, Reduzierung des Nacharbeitsaufwands um 35% und Verbesserung der Inter-Annotator-Übereinstimmung auf einen Cohen’s Kappa von 0,85.
  • Behandelte die Verschlechterung der faktischen Genauigkeit in KI-erstellten technischen Dokumentationen durch Entwicklung eines mehrstufigen Verifizierungs-Workflows, der automatisierte Faktenprüfungen mit Experten-Reviews kombiniert, und erreichte dabei 98% Genauigkeit bei Fertigungsspezifikationsdokumenten.
  • Beseitigte das Leaken sensibler Inhalte in Trainingsdaten durch Entwicklung von PII-Erkennungsfiltern und Erstellung von Redaktionsprotokollen für IoT-Sensordaten und Wartungsprotokolle, um die Einhaltung von DSGVO und internen Sicherheitsrichtlinien zu gewährleisten.
  • Optimierte das Onboarding des Annotationsteams durch umfassende Schulungsworkshops und Mentorenprogramme, verkürzte die Einarbeitungszeit von 6 auf 3 Wochen bei gleichbleibenden Qualitätsstandards.
  • Beseitigte Inkonsistenzen bei der Richtlinienauslegung durch Ausarbeitung detaillierter Annotationsprotokolle mit konkreten Beispielen und Randfällen, wodurch Klärungsanfragen in mehrsprachigen Annotationsprojekten um 60% sanken.
  • Behebte Qualitätsdrift in laufenden Annotationsprojekten durch Implementierung von statistischen Prozesskontroll-Charts und automatisierten Qualitätsprüfungen, erkannte Abweichungen 3 Tage früher als manuelle Prüfprozesse.
  • Steigerte die Annotierungsdurchsatzrate ohne Qualitätsverlust durch Optimierung der Prüf-Workflows und Batch-Verarbeitung ähnlicher Inhaltstypen, erhöhte die tägliche Ausstoßmenge um 25% bei einer Genauigkeit von über 95%.
  • Behandelte Ineffizienzen im Feedback-Loop durch Einführung strukturierter Peer-Review-Sitzungen und wöchentlicher Kalibrierungsmeetings, um eine konsistente Anwendung der Annotationsrichtlinien bei allen Teammitgliedern sicherzustellen.
Juni 2021 - Sept. 2024
3 Jahren 4 Monaten
Warschau, Polen

Data Scientist

EPAM Systems

  • Löste Inkonsistenzen bei der Klassifikation von Finanzdokumenten durch Entwicklung eines hierarchischen Annotationssystems mit klaren Entscheidungsbäumen, Steigerung des F1-Scores des Klassifikators von 0,78 auf 0,91 bei Banktransaktionsdaten aus SAP und internen Datenbanken.
  • Behandelte Skalierungsprobleme bei der Annotation mehrsprachiger Finanzberichte durch Implementierung einer verteilten Labeling-Plattform mit Qualitätskontrollen, Verarbeitung von über 50.000 Dokumenten pro Monat mit einer Konsistenz von 94% in Englisch und Deutsch.
  • Behebte Leistungsverschlechterungen des Modells in der Produktion durch Aufbau kontinuierlicher Annotationspipelines für schwierige Fälle, Reduzierung von False Positives in der Betrugserkennung um 22% bei gleichbleibender Recall-Rate von 99,9% in Transaktionsüberwachungssystemen.
  • Beseitigte Trainingsdatenqualitätsprobleme durch Implementierung von Schema-Validierung und Ausreißererkennung in Feature-Pipelines, Verringerung datenbedingter Produktionsvorfälle um 65% in Finanzdienstleistungsanwendungen der Kunden.
  • Eliminierte den Annotationsrückstand während der Projekterweiterung durch Entwicklung effizienter Batch-Workflows und Prioritätensysteme, Einhaltung der SLAs trotz einer 3-fachen Volumensteigerung während der Quartalsberichte.
  • Verbessertes teamübergreifendes Annotationskonsistenz durch wöchentliche Kalibrierungssitzungen und Erstellung detaillierter Feedback-Dokumentationen, Erreichen eines Inter-Annotator-Agreements von 0,88 in verteilten Teams in verschiedenen Zeitzonen.
  • Gelöste Herausforderungen bei der Modellinterpretation in Kundenpräsentationen durch Erstellung umfassender Annotationsrichtlinien mit Geschäftskontext, Verringerung der Erklärzeit von 45 auf 15 Minuten bei Stakeholder-Reviews.
Aug. 2019 - Juni 2021
1 Jahr 11 Monaten
Warschau, Polen

Senior MLOps

Fujitsu

  • Behebte manuelle Annotation-Engpässe bei der Fehlererkennung in der Fertigung durch Einführung halbautomatisierter Labeling-Tools mit menschlicher Verifikation, Reduzierung der Kennzeichnungszeit für CV-Modelle, die Produktionslinienbilder verarbeiten, um 40%.
  • Löste Chaos bei der Versionierung von Trainingsdaten durch Aufbau eines zentralen Annotationsspeichers mit Metadaten-Tracking, was reproduzierbare Modelltrainings über mehrere Fertigungsstandorte hinweg ermöglichte.
  • Beseitigte Qualitätsinkonsistenzen bei der Sensordatenannotation durch Entwicklung standardisierter Labeling-Protokolle und Durchführung von Train-the-Trainer-Sitzungen, Steigerung der Modellgenauigkeit um 15% in Predictive-Maintenance-Aufgaben.
  • Behandelte Zuverlässigkeitsprobleme des Annotations-Tools durch Migration von benutzerdefinierten Skripten zu containerisierten Labeling-Anwendungen, Erreichen einer Verfügbarkeit von 99,5% für verteilte Annotationsteams an drei Fertigungsstandorten.
Apr. 2014 - Aug. 2019
5 Jahren 5 Monaten
Japan

Machine Learning Engineer

Fujitsu

  • Löste anfängliche Herausforderungen bei der Datenkennzeichnung für frühe ML-Projekte durch Entwicklung strukturierter Annotationsrichtlinien und Qualitätssicherungsprozeduren, schuf die Grundlage für reproduzierbare Modellentwicklung.
  • Behandelte begrenzte Verfügbarkeit von Trainingsdaten durch Einsatz von Datenaugmentierungstechniken und systematischen Labeling-Workflows, ermöglichte die erfolgreiche Implementierung von Empfehlungssystemen der ersten Generation.
  • Behebte Inkonsistenzen in der Annotation zwischen Teammitgliedern durch Erstellung detaillierter Beispiele und Randfall-Dokumentationen, verbesserte die Stabilität der Modellleistung bei den ersten Produktionseinsätzen.
  • Beseitigte manuelle QA-Engpässe durch Entwicklung automatisierter Validierungsskripte für annotierte Datensätze, Reduzierung der Prüfzeit um 50% bei gleichbleibend hohen Qualitätsstandards.

Zusammenfassung

10+ Jahre Erfahrung im Aufbau und Einsatz von Machine-Learning-Systemen in den Bereichen Fertigung und Finanzdienstleistungen. Spezialisierung auf End-to-End MLOps-Implementierung mit Fachwissen in Datenannotation-Qualitätssicherung, Bewertung faktischer Genauigkeit und Workflows zur Inhaltsmoderation. Nachweisliche Erfolge im Aufbau von Qualitätskontrollprozessen für KI-Trainingsdaten und der Implementierung strukturierter Feedbacksysteme für Annotationsteams. Kombiniert tiefes technisches ML-Know-how mit praktischer Erfahrung im Mentoring von Junior-Mitarbeitern und der Durchführung von Qualitätssicherungsprüfungen.

Fähigkeiten

  • Annotation & Qa: Datenkennzeichnung, Qualitätssicherung & -Überwachung, Driftkontrolle, Faktenprüfung, Erkennung Von Inhaltsmoderation, Leistungsüberwachung, A/b-tests
  • Mlops & Plattformen: Mlflow, Kubeflow, Azure
  • Devops & Zusammenarbeit: Github Actions
  • Ml-infrastruktur: Feature Stores, Model Registry, Docker, Kubernetes
  • Mentoring & Workshop-leitung
  • Modellierung: Klassifikation, Nlp, Llm-evaluierung, Klassische Ml, Deep Learning
  • Sprachen: Python, Sql
  • Daten & Features: Sql, Spark, Pandas, Datenvalidierung, Schema-evolution

Sprachen

Japanisch
Muttersprache
Deutsch
Verhandlungssicher
Englisch
Verhandlungssicher

Ausbildung

Apr. 2016 - März 2018

Tokyo University of Science

Master in Informatik · Informatik · Japan

Apr. 2010 - März 2014

Tokyo University of Science

Bachelor in Informatik · Informatik · Japan

Zertifikate & Bescheinigungen

Google Professional Machine Learning Engineer

AWS Certified Machine Learning - Specialty

DeepLearning.AI Natural Language Processing Specialization

Sie suchen Freelancer?Passende Kandidaten in Sekunden!
FRATCH GPT testen
Weitere Aktionen

Ähnliche Freelancer

Entdecken Sie andere Experten mit ähnlichen Qualifikationen und Erfahrungen.

Manuel Pasieka
Manuel Pasieka

KI-Ingenieur

Profil ansehen
Mathias Wilhelm
Mathias Wilhelm

Entwicklung einer KI-gesteuerten Social Media Automatisierung zur Identifikation von Themen, Textgenerierung und Ausspielung

Profil ansehen
Julien Look
Julien Look

MLOps-Ingenieur

Profil ansehen
Marcel Meyer
Marcel Meyer

Cloud-Architekt, Senior Solution Architekt, Senior Software Engineer

Profil ansehen
Stephan Baier
Stephan Baier

Freiberuflicher Data Scientist

Profil ansehen
Umar Maqsud
Umar Maqsud

Senior KI-Architekt & Ingenieur

Profil ansehen
Martin Musiol
Martin Musiol

Product Owner für AI-Lernplattform

Profil ansehen
Eduard Van kleef
Eduard Van kleef

Leiter Workshop „Einführung von KI Entwicklungstools“

Profil ansehen
Louis Guitton
Louis Guitton

Freiberuflicher Solutions Architect und Machine Learning Engineer

Profil ansehen
Christian Schulz
Christian Schulz

Data Scientist/AI-Ingenieur

Profil ansehen
Serge Kalinin
Serge Kalinin

MLOps (Machine-Learning-Betrieb)

Profil ansehen
Philipp Grunert
Philipp Grunert

Data Scientist und Data Engineer

Profil ansehen
Max Ritter
Max Ritter

Cloud (AWS) | KI | DevOps | Daten

Profil ansehen
Himanshu Negi
Himanshu Negi

Principal (Datenwissenschaftler/Dateningenieur/Gen-AI-Ingenieur)

Profil ansehen
Mathew Divine
Mathew Divine

Data-Science-Experte und KI-Stratege

Profil ansehen
Tim Raveneau
Tim Raveneau

KI-Ingenieur

Profil ansehen
Mario Tuta
Mario Tuta

Externer Dozent

Profil ansehen
Katharina Schachmatov
Katharina Schachmatov

KI-Ingenieur

Profil ansehen
Kimmo Suotsalo
Kimmo Suotsalo

Freiberuflicher Data Scientist

Profil ansehen
Jürgen Fey
Jürgen Fey

AR/VR/XR-Architekt

Profil ansehen
Chintan Padaliya
Chintan Padaliya

Product Owner und Technical Product Lead

Profil ansehen
Arun sai Thunga
Arun sai Thunga

AI-Backend-Entwickler-Praktikant

Profil ansehen
Shyam sundar Rampalli
Shyam sundar Rampalli

GenAI-Ingenieur

Profil ansehen
Anton Klonov
Anton Klonov

Leiter der technischen Gesamtintegration NSC / Entwicklung von Hadoop Cloud

Profil ansehen
Mirza Klimenta
Mirza Klimenta

Agentische KI für ein DeepResearch-Projekt

Profil ansehen
Fadi Shoaa
Fadi Shoaa

Dokumentenparser für Kommissionierlisten (PDF & PNG)

Profil ansehen
Nino Sandmeier
Nino Sandmeier

Freiberufler im Bereich Data Science

Profil ansehen
Kiran kumar Kanathala
Kiran kumar Kanathala

Angewandtes NLP: Wortbasierte Kodierung für intelligentere Ereignisvorhersagen

Profil ansehen
Jayana Shah
Jayana Shah

Implementierung eines Datenverwaltungstools für LLM- und Sprachtechnologien

Profil ansehen
Rutger Boels
Rutger Boels

Partner

Profil ansehen