Recommended expert

Murad Ali

KI-Agenten-Automatisierung – LLM-gesteuertes Agentensystem

Murad Ali
Martinroda, Deutschland

Erfahrungen

Jan. 2025 - Dez. 2025
1 Jahr

KI-Agenten-Automatisierung – LLM-gesteuertes Agentensystem

  • Entwicklung eines Multi-Agenten-Systems, das LangChain ZeroShotAgent mit maßgeschneiderten Tools für Live-APIs und Aufgabenautomatisierung verbindet.
  • Aufbau eines FastAPI-Backends für die Erstellung, Triage und Zuweisung von Jira-Tickets, automatische Einstufung der Priorität, Duplikaterkennung, SLA-Konfiguration, Rufbereitschaftsplanung und bidirektionale Synchronisierung von Status und Kommentaren.
  • Hinzufügen von Slack-Benachrichtigungen und RAG-Wissensabfrage mit FAISS oder pgvector zur Fehlerbehebung, optional PagerDuty-Eskalation bei Richtlinienverstößen.
  • Orchestrierung der Agenten mit einem Router und einer Celery-Redis-Warteschlange, Wiederholungsversuche mit Backoff, Ratenbegrenzungen, Idempotenz-Schlüsseln und menschlichen Freigaben.
  • Implementierung von Schutzmaßnahmen und Observability, Prompt-Versionierung, Token- und Kostenbudgets, PII-Redaktion, Tool-Nutzungs-Whitelists, Timeouts, OpenTelemetry-Tracing, Dashboards für Genauigkeit und Latenz sowie Deployment auf Kubernetes mit Feature Flags und Canary-Rollouts.
Jan. 2025 - Dez. 2025
1 Jahr

Shift AI – LLM-gesteuerter Assistent zur Schichtplanung

  • Entwicklung eines KI-Planungsassistenten, der mit LangChain und Llama automatisch konfliktfreie Schichtpläne erstellt.
  • Entwurf einer semantischen Suche mit FAISS zur Auswertung von Vorgaben und Verknüpfung der Planungsdaten über Prisma/PostgreSQL für präzises Nutzerdatenmanagement.
  • Bereitstellung eines FastAPI-Backends, das die prädiktive Planung für Betriebsteams vereinfacht.
Sept. 2024 - Mai 2025
9 Monaten
Paris, Frankreich

KI-Ingenieur

Eclevar Medtech

  • Aufbau eines klinischen Beratungsassistenten auf GCP (Vertex AI und Cloud Run), der während Patientengesprächen leitliniengestützte Antworten liefert. Pilotprojekte reduzierten die Suchzeit von Minuten auf Sekunden und verringerten die Nachbearbeitung der Dokumentation um etwa 25–35 %.
  • Produktivsetzung der medizinischen ASR durch Feintuning von Whisper und Wav2Vec2 auf anonymisierten Audiodaten mit VAD und domänenspezifischen Lexika. Die Wortfehlerrate bei lauter Klinik-Audio verbesserte sich um 6–8 Prozentpunkte und die Echtzeitlatenz wurde stabil.
  • Integration von LLMs (Gemini, GPT, Claude, Llama) für SOAP-ähnliche Zusammenfassungen, Extraktion von Medikamenten und Allergien sowie Risikohinweise. Einsatz von RAG auf einem geprüften Korpus, um Antworten mit Quellenangaben zu versehen.
  • Verwendung strukturierter Reasoning-Prompts wie Chain-of-Thought (COT) und Schritt-für-Schritt-Dekomposition während Entwicklung und Evaluation, um klinische Schlussfolgerungen und Extraktionsgenauigkeit zu verbessern. In der Produktion bleiben Begründungen knapp und Notizfelder werden verborgen, um Privatsphäre zu schützen und niedrige Latenz zu gewährleisten.
  • Implementierung von Schutzmaßnahmen wie Prompt-Checks, Zitationspflicht, PHI-Bereinigung und Ablehnungsrichtlinien. Protokollierung von Prompts und Ergebnissen mit PII-Hashing zur Erfüllung der DSGVO-Anforderungen.
  • Einrichtung von Evaluationen und Observability mit RAGAS, aufgabenspezifischen EM/F1-Metriken und einer einfachen Oberfläche für menschliche Bewertungen. Verhinderung von Regressionen und Ausrollen sicherer A/B-Tests. Die mittlere Latenz sank um etwa 30 % durch quantisierte Inferenz mit vLLM und Streaming-Ausgaben.
  • Überführung von Prototypen in die Produktion mit Containern, CI/CD, Canary-Releases und Drift-Monitoring. Dokumentation der Datenflüsse und DPIA-Materialien für Compliance.
März 2024 - Sept. 2024
7 Monaten
Deutschland

Masterarbeit – Forschung im Bereich biomedizinisches NLP

Friedrich-Schiller-Universität Jena

  • Durchführung angewandter Forschung zur Retrieval-Augmented Generation (RAG) für biomedizinische Frage-Antwort-Anwendungen basierend auf über 100 wissenschaftlichen Publikationen.
  • Aufbau und Optimierung dichter Retrieval-Pipelines mit FAISS zur Steigerung von Präzision und Recall beim komplexen biomedizinischen Textverständnis.
  • Entwicklung von Bewertungsabläufen mit RAGAS und Erzielung starker Ergebnisse bei Treue und kontextueller Präzision der generierten Antworten.
Jan. 2024 - Dez. 2024
1 Jahr

KI-gestützte Früherkennung von Legasthenie

  • Entwurf einer End-to-End-KI-Pipeline zur Früherkennung von Legasthenie, die Handschriftanalyse (Gemini 1.5 Pro) und Sprachbewertung via ASR kombiniert.
  • Umsetzung kognitiver Gedächtnis- und Lesetests zur Erfassung multimodaler Verhaltensmerkmale für die Vorhersage.
  • Training eines CatBoost-Klassifikators zur Vorhersage der Legastheniewahrscheinlichkeit mit hoher Genauigkeit und Interpretierbarkeit.
  • Bereitstellung einer produktionsreifen Pipeline mit Python, LangChain und FastAPI zur Unterstützung von Echtzeit-Screening-Anwendungen.
März 2023 - Aug. 2024
1 Jahr 6 Monaten
Deutschland

KI-Ingenieur (NLP/LLMs)

Incowia GmbH

  • Realisierte eine Pipeline zur Rechnungsextraktion, die gescannte PDFs mit OCR, LayoutLMv3 und einem LLM-Fallback für Ausreißer in normalisierte Einzelposten-Datensätze umwandelt, um die manuelle Prüfung zu reduzieren und die Buchung zu beschleunigen.
  • Feinjustiertes NER-Modell im BERT-Stil für Lieferanten, Adressen, Mehrwertsteuer, IBAN und Summen. Erreichte über 90% F1 auf einem versionierten Goldstandard und verringerte Formatierungsfehler durch regelbasierte Nachbearbeitung.
  • Extrahierte Tabellen und Einzelposten mit strukturbewussten Modellen und Konfidenzfilter. Setzte Llama oder Mistral als Fallback-Parser für herausfordernde mehrseitige Rechnungen ein und verbesserte die Erfassungsrate, ohne die Fehlalarmrate zu erhöhen.
  • Senkte Kosten und Latenz mit dynamischem Batching, Mixed Precision, sicherer 4-Bit-Quantisierung und Dokument-Caching. Hielt die p95-Latenz unter Last stabil und reduzierte GPU-Stunden.
  • Standardisierte Daten- und Evaluierungsvorgaben mit klaren Annotationsrichtlinien, Übereinstimmungsprüfungen zwischen Annotatoren und CI-Tests für EM/F1, um Qualitätsrückschritte zu verhindern.
  • Arbeitete eng mit Produkt- und Betriebsteams zusammen, um Fehlerfälle wie schiefe Scans, Stempelüberlagerungen und unvollständige Tabellen zu priorisieren. Führte Korrekturen zurück ins Training und in Heuristiken für stetige Qualitätssteigerungen.
Jan. 2022 - Feb. 2023
1 Jahr 2 Monaten
Deutschland

Deep-Learning-Ingenieur (HiWi)

Max-Planck-Institut

  • Entwickelte eine Objekterkennungs-Pipeline mit SAM und GroundingDINO und verbesserte die Klassifikation biologischer Proben auf über 90% Präzision.
  • Verbesserte die Erkennung von Pflanzenarten mithilfe von ResNet-50, steigerte die Leistung von 85% auf 93% und beschleunigte experimentelle Abläufe.

Zusammenfassung

KI-Ingenieur, spezialisiert auf große Sprachmodelle (LLMs) und Konversations-KI. Erfahren im Aufbau KI-gesteuerter Self-Service-Systeme, in der Automatisierung kundenorientierter Arbeitsabläufe und bei der Bereitstellung produktionsreifer NLP-Lösungen auf Cloud-Plattformen. Versiert darin, Technologie und Geschäftsergebnisse zu verbinden, mit nachgewiesener Effizienzsteigerung, Reduzierung manueller Arbeit und Verbesserung der Nutzererfahrung.

Fähigkeiten

  • Programmierung: Python, C++, C
  • Llms & Schlussfolgerung: Transformers, Hugging Face, Gemini / Gpt / Claude / Llama, Langchain / Langgraph / Llamaindex, Strukturierte Reasoning-prompts (Chain-of-thought Während Der Entwicklung), Tool-calling
  • Retrieval & Vektoren: Faiss, Pgvector, Hybrides Bm25 + Dense Retrieval, Reranker, Schema-bewusstes Chunking
  • Serving & Mlops: Fastapi, Docker, Ci/cd, Vllm, Quantisierung, Dynamisches Batching, Caching, Streaming, Observability, Ragas, Gold-sets, Em/f1, A/b-tests, Drift-monitoring
  • Speech & Dokumenten-ki: Whisper, Wav2vec2, Vad, Tesseract, Doctr, Layoutlmv3, Donut, Tabellen- Und Einzelpostenextraktion
  • Cloud & Daten: Gcp / Vertex Ai, Sql, Postgresql, Rest-apis
  • Arbeitsweise: Git, Jira, Confluence, Agile/scrum

Sprachen

Englisch
Verhandlungssicher
Deutsch
Grundkenntnisse

Ausbildung

Okt. 2020 - Juni 2024

Technische Universität Ilmenau

M.Sc. Forschung im Bereich Computer- und Systemtechnik · Forschung im Bereich Computer- und Systemtechnik · Ilmenau, Deutschland

Okt. 2014 - Juni 2018

UET Peshawar

B.Sc. Computer- und Systemtechnik · Computer- und Systemtechnik · Peshawar, Pakistan

Sie suchen Freelancer?Passende Kandidaten in Sekunden!
FRATCH GPT testen
Weitere Aktionen

Ähnliche Freelancer

Entdecken Sie andere Experten mit ähnlichen Qualifikationen und Erfahrungen.

Marcel Meyer
Marcel Meyer

Cloud-Architekt, Senior Solution Architekt, Senior Software Engineer

Profil ansehen
Mohamed Saleh
Mohamed Saleh

Machine Learning Engineer (Teilzeit)

Profil ansehen
Patrik Garten
Patrik Garten

Technischer Leiter Conversational AI

Profil ansehen
Julien Look
Julien Look

MLOps-Ingenieur

Profil ansehen
Manuel Pasieka
Manuel Pasieka

KI-Ingenieur

Profil ansehen
Martin Musiol
Martin Musiol

Product Owner für AI-Lernplattform

Profil ansehen
Tobias Jaeuthe
Tobias Jaeuthe

Externer Dienstleister

Profil ansehen
Jürgen Fey
Jürgen Fey

AR/VR/XR-Architekt

Profil ansehen
Mathias Wilhelm
Mathias Wilhelm

Entwicklung einer KI-gesteuerten Social Media Automatisierung zur Identifikation von Themen, Textgenerierung und Ausspielung

Profil ansehen
Stephan Baier
Stephan Baier

Freiberuflicher Data Scientist

Profil ansehen
Mohamed Yousfi
Mohamed Yousfi

KI-Ingenieur

Profil ansehen
Patrick Waldschmitt
Patrick Waldschmitt

KI-Softwareentwickler

Profil ansehen
Mirza Klimenta
Mirza Klimenta

Agentische KI für ein DeepResearch-Projekt

Profil ansehen
Sabrine Krichen
Sabrine Krichen

Teamleiter

Profil ansehen
Rohit Thanki
Rohit Thanki

Datenwissenschaftler

Profil ansehen
Max Ritter
Max Ritter

Cloud (AWS) | KI | DevOps | Daten

Profil ansehen
André Filip
André Filip

GenAI-Produktverantwortlicher

Profil ansehen
Muntaha Shams
Muntaha Shams

KI-Ingenieur (Freiberufler)

Profil ansehen
Himanshu Negi
Himanshu Negi

Principal (Datenwissenschaftler/Dateningenieur/Gen-AI-Ingenieur)

Profil ansehen
Vitalijs Visnevskis
Vitalijs Visnevskis

Mentor

Profil ansehen
Abhishek Nair
Abhishek Nair

Teamleiter Robotik-Compliance/Engineering

Profil ansehen
Oguzhan Yayla
Oguzhan Yayla

Berater für angewandte KI

Profil ansehen
Stephan Fröde
Stephan Fröde

NLP/LLM-Chatbot

Profil ansehen
Yannick Schuchmann
Yannick Schuchmann

Freiberuflicher IT-Berater

Profil ansehen
Mahabub Akram
Mahabub Akram

Teamleiter – Engagement & Relevanz

Profil ansehen
Hüseyin Korkut
Hüseyin Korkut

Senior Full-Stack-Entwickler

Profil ansehen
Kai Kramer
Kai Kramer

Chatbots für Steuer- und Rechtstexte

Profil ansehen
Tomas Stiller
Tomas Stiller

Mitgründer & CTO

Profil ansehen
Matthias Isler
Matthias Isler

Teilzeit-CTO (Leitender Ingenieur / Technischer Architekt)

Profil ansehen
Tim Raveneau
Tim Raveneau

KI-Ingenieur

Profil ansehen