Murad A.

KI-Ingenieur

Martinroda, Deutschland

Erfahrungen

Sept. 2024 - Mai 2025
9 Monaten
Paris, Frankreich

KI-Ingenieur

Eclevar Medtech

  • Eine klinische Beratungsassistenz auf GCP (Vertex AI und Cloud Run) entwickelt, die während der Besuche leitlinienbasierte Antworten liefert. Pilotprojekte verkürzten die Suchzeit von Minuten auf Sekunden und verringerten die Nachbearbeitung der Dokumentation um etwa 25–35%.
  • Medizinische Spracherkennung (ASR) produktiv gesetzt, indem Whisper und Wav2Vec2 auf pseudonymisierten Audiodaten mit VAD und fachlichen Lexika feinabgestimmt wurden. Die Wortfehlerrate bei verrauschten Klinikaufnahmen verbesserte sich um sechs bis acht Prozentpunkte und die Echtzeit-Latenz wurde stabil.
  • LLMs (Gemini, GPT, Claude, Llama) für SOAP-Format-Zusammenfassungen, Medikamenten- und Allergieextraktion sowie Risikohinweise integriert. RAG über einen geprüften Korpus eingesetzt, um Antworten mit Quellenangaben zu untermauern.
  • Strukturierte Reasoning-Prompts wie Chain of Thought (COT) und Schritt-für-Schritt-Aufschlüsselung während Entwicklung und Evaluation verwendet, um das klinische Denken und die Extraktionsgenauigkeit zu verbessern. In der Produktion wurden Begründungen kurz gehalten und Zwischenschritte verborgen, um die Privatsphäre zu schützen und geringe Latenz zu gewährleisten.
  • Guardrails implementiert, darunter Prompt-Checks, Zitationsanforderungen, PHI-Bereinigung und Ablehnungsrichtlinien. Prompts und Antworten mit PII-Hashing protokolliert, um GDPR-Anforderungen zu erfüllen.
  • Evals und Observability mit RAGAS, aufgabenspezifischem EM/F1 und einer schlanken UI für menschliche Bewertungen eingerichtet. Regressions verhindert und sichere A/B-Versionen ausgeliefert. Die mittlere Latenz sank um etwa 30% durch quantisierte Inferenz mit vLLM und Streaming der Antworten.
  • Prototypen mit Containern, CI/CD, Canary-Releases und Drift-Monitoring in Produktion überführt. Datenflüsse und DPIA-Materialien für Compliance dokumentiert.
März 2024 - Sept. 2024
7 Monaten
Deutschland

Masterarbeit - Forschung im Bereich Biomedical NLP

Friedrich-Schiller-Universität Jena

  • Angewandte Forschung zu Retrieval-Augmented Generation (RAG) für biomedizinisches Question Answering durchgeführt, dabei über 100 wissenschaftliche Publikationen als Quellenmaterial verwendet.
  • Dichte Retrieval-Pipelines mit FAISS aufgebaut und optimiert, um Präzision und Recall bei komplexem biomedizinischem Textverständnis zu verbessern.
  • Evaluationsabläufe mit RAGAS entworfen und starke Ergebnisse in der Treue und kontextuellen Präzision der generierten Antworten erzielt.
März 2023 - Aug. 2024
1 Jahr 6 Monaten
Deutschland

KI-Ingenieur (NLP/LLMs)

Incowia GmbH

  • Eine Rechnungs-Extraktionspipeline bereitgestellt, die gescannte PDFs mittels OCR, LayoutLMv3 und einem LLM-Fallback für Ausreißer in normalisierte Einzelposten umwandelt, um den manuellen Prüfaufwand zu reduzieren und das Buchen zu beschleunigen.
  • BERT-basierte NER für Lieferanten, Adressen, USt-IdNr., IBAN und Summen feinabgestimmt. Über 90% F1 auf einem versionierten Goldstandard erreicht und Formatierungsfehler mit regelgestützter Nachbearbeitung reduziert.
  • Tabellen und Einzelposten mit struktur-aware Modellen und Confidence Gating extrahiert. Für komplexe mehrseitige Rechnungen Llama oder Mistral als Fallback-Parser eingesetzt, um Recall zu steigern ohne Anstieg von False Positives.
  • Kosten und Latenz durch dynamisches Batching, Mixed Precision, sichere 4-Bit-Quantisierung und Dokument-Caching gesenkt. Stabile p95-Latenz unter Last gehalten und GPU-Stunden reduziert.
  • Daten- und Evaluierungsstandards formell festgelegt mit klaren Annotation-Guidelines, Inter-Annotator-Agreement-Checks und CI-Tests für EM/F1, um Qualitätsrückschritte zu verhindern.
  • Mit Produkt- und Operations-Teams zusammengearbeitet, um Fehlermodi wie verzerrte Scans, Stempelüberlagerungen und unvollständige Tabellen zu priorisieren. Korrekturen zurück in Training und Heuristiken eingespeist für kontinuierliche Qualitätssteigerungen.
Jan. 2022 - Feb. 2023
1 Jahr 2 Monaten
Deutschland

Deep-Learning-Ingenieur (HiWi)

Max Planck Institute

  • Eine Objekterkennungs-Pipeline mit SAM und GroundingDINO entwickelt, die die Klassifikation biologischer Proben mit über 90% Präzision verbessert.
  • Die Erkennung von Pflanzenarten mit ResNet-50 optimiert, die Leistung von 85% auf 93% gesteigert und experimentelle Arbeitsabläufe beschleunigt.

Zusammenfassung

KI-Ingenieur, spezialisiert auf große Sprachmodelle (LLMs) und Konversations-KI.

Erfahrungen im Aufbau von KI-gesteuerten Self-Service-Systemen, der Automatisierung von kundenorientierten Workflows und der Bereitstellung von produktionsreifen NLP-Lösungen auf Cloud-Plattformen.

Fähig, Technologie und Geschäftsergebnisse zu verbinden, mit einer nachweislichen Erfolgsbilanz bei der Effizienzsteigerung, der Verringerung manueller Arbeit und der Verbesserung der Benutzererfahrung.

Sprachen

Paschtu
Muttersprache
Urdu
Muttersprache
Englisch
Verhandlungssicher
Deutsch
Grundkenntnisse

Ausbildung

Okt. 2020 - Juni 2024

Technische Universität Ilmenau

M.Sc., Forschung · Computer- und Systemtechnik · Ilmenau, Deutschland

Okt. 2014 - Juni 2018

UET Peshawar

B.Sc. · Computer-Systemtechnik · Peshawar, Pakistan

Sie suchen Freelancer?Passende Kandidaten in Sekunden!
FRATCH GPT testen
Weitere Aktionen