Recommended expert
Murad Ali
KI-Agenten-Automatisierung – LLM-gesteuertes Agentensystem
Erfahrungen
Jan. 2025 - Dez. 2025
1 JahrKI-Agenten-Automatisierung – LLM-gesteuertes Agentensystem
- Entwicklung eines Multi-Agenten-Systems, das LangChain ZeroShotAgent mit maßgeschneiderten Tools für Live-APIs und Aufgabenautomatisierung verbindet.
- Aufbau eines FastAPI-Backends für die Erstellung, Triage und Zuweisung von Jira-Tickets, automatische Einstufung der Priorität, Duplikaterkennung, SLA-Konfiguration, Rufbereitschaftsplanung und bidirektionale Synchronisierung von Status und Kommentaren.
- Hinzufügen von Slack-Benachrichtigungen und RAG-Wissensabfrage mit FAISS oder pgvector zur Fehlerbehebung, optional PagerDuty-Eskalation bei Richtlinienverstößen.
- Orchestrierung der Agenten mit einem Router und einer Celery-Redis-Warteschlange, Wiederholungsversuche mit Backoff, Ratenbegrenzungen, Idempotenz-Schlüsseln und menschlichen Freigaben.
- Implementierung von Schutzmaßnahmen und Observability, Prompt-Versionierung, Token- und Kostenbudgets, PII-Redaktion, Tool-Nutzungs-Whitelists, Timeouts, OpenTelemetry-Tracing, Dashboards für Genauigkeit und Latenz sowie Deployment auf Kubernetes mit Feature Flags und Canary-Rollouts.
Jan. 2025 - Dez. 2025
1 JahrShift AI – LLM-gesteuerter Assistent zur Schichtplanung
- Entwicklung eines KI-Planungsassistenten, der mit LangChain und Llama automatisch konfliktfreie Schichtpläne erstellt.
- Entwurf einer semantischen Suche mit FAISS zur Auswertung von Vorgaben und Verknüpfung der Planungsdaten über Prisma/PostgreSQL für präzises Nutzerdatenmanagement.
- Bereitstellung eines FastAPI-Backends, das die prädiktive Planung für Betriebsteams vereinfacht.
Sept. 2024 - Mai 2025
9 MonatenParis, Frankreich
KI-Ingenieur
Eclevar Medtech
- Aufbau eines klinischen Beratungsassistenten auf GCP (Vertex AI und Cloud Run), der während Patientengesprächen leitliniengestützte Antworten liefert. Pilotprojekte reduzierten die Suchzeit von Minuten auf Sekunden und verringerten die Nachbearbeitung der Dokumentation um etwa 25–35 %.
- Produktivsetzung der medizinischen ASR durch Feintuning von Whisper und Wav2Vec2 auf anonymisierten Audiodaten mit VAD und domänenspezifischen Lexika. Die Wortfehlerrate bei lauter Klinik-Audio verbesserte sich um 6–8 Prozentpunkte und die Echtzeitlatenz wurde stabil.
- Integration von LLMs (Gemini, GPT, Claude, Llama) für SOAP-ähnliche Zusammenfassungen, Extraktion von Medikamenten und Allergien sowie Risikohinweise. Einsatz von RAG auf einem geprüften Korpus, um Antworten mit Quellenangaben zu versehen.
- Verwendung strukturierter Reasoning-Prompts wie Chain-of-Thought (COT) und Schritt-für-Schritt-Dekomposition während Entwicklung und Evaluation, um klinische Schlussfolgerungen und Extraktionsgenauigkeit zu verbessern. In der Produktion bleiben Begründungen knapp und Notizfelder werden verborgen, um Privatsphäre zu schützen und niedrige Latenz zu gewährleisten.
- Implementierung von Schutzmaßnahmen wie Prompt-Checks, Zitationspflicht, PHI-Bereinigung und Ablehnungsrichtlinien. Protokollierung von Prompts und Ergebnissen mit PII-Hashing zur Erfüllung der DSGVO-Anforderungen.
- Einrichtung von Evaluationen und Observability mit RAGAS, aufgabenspezifischen EM/F1-Metriken und einer einfachen Oberfläche für menschliche Bewertungen. Verhinderung von Regressionen und Ausrollen sicherer A/B-Tests. Die mittlere Latenz sank um etwa 30 % durch quantisierte Inferenz mit vLLM und Streaming-Ausgaben.
- Überführung von Prototypen in die Produktion mit Containern, CI/CD, Canary-Releases und Drift-Monitoring. Dokumentation der Datenflüsse und DPIA-Materialien für Compliance.
März 2024 - Sept. 2024
7 MonatenDeutschland
Masterarbeit – Forschung im Bereich biomedizinisches NLP
Friedrich-Schiller-Universität Jena
- Durchführung angewandter Forschung zur Retrieval-Augmented Generation (RAG) für biomedizinische Frage-Antwort-Anwendungen basierend auf über 100 wissenschaftlichen Publikationen.
- Aufbau und Optimierung dichter Retrieval-Pipelines mit FAISS zur Steigerung von Präzision und Recall beim komplexen biomedizinischen Textverständnis.
- Entwicklung von Bewertungsabläufen mit RAGAS und Erzielung starker Ergebnisse bei Treue und kontextueller Präzision der generierten Antworten.
Jan. 2024 - Dez. 2024
1 JahrKI-gestützte Früherkennung von Legasthenie
- Entwurf einer End-to-End-KI-Pipeline zur Früherkennung von Legasthenie, die Handschriftanalyse (Gemini 1.5 Pro) und Sprachbewertung via ASR kombiniert.
- Umsetzung kognitiver Gedächtnis- und Lesetests zur Erfassung multimodaler Verhaltensmerkmale für die Vorhersage.
- Training eines CatBoost-Klassifikators zur Vorhersage der Legastheniewahrscheinlichkeit mit hoher Genauigkeit und Interpretierbarkeit.
- Bereitstellung einer produktionsreifen Pipeline mit Python, LangChain und FastAPI zur Unterstützung von Echtzeit-Screening-Anwendungen.
März 2023 - Aug. 2024
1 Jahr 6 MonatenDeutschland
KI-Ingenieur (NLP/LLMs)
Incowia GmbH
- Realisierte eine Pipeline zur Rechnungsextraktion, die gescannte PDFs mit OCR, LayoutLMv3 und einem LLM-Fallback für Ausreißer in normalisierte Einzelposten-Datensätze umwandelt, um die manuelle Prüfung zu reduzieren und die Buchung zu beschleunigen.
- Feinjustiertes NER-Modell im BERT-Stil für Lieferanten, Adressen, Mehrwertsteuer, IBAN und Summen. Erreichte über 90% F1 auf einem versionierten Goldstandard und verringerte Formatierungsfehler durch regelbasierte Nachbearbeitung.
- Extrahierte Tabellen und Einzelposten mit strukturbewussten Modellen und Konfidenzfilter. Setzte Llama oder Mistral als Fallback-Parser für herausfordernde mehrseitige Rechnungen ein und verbesserte die Erfassungsrate, ohne die Fehlalarmrate zu erhöhen.
- Senkte Kosten und Latenz mit dynamischem Batching, Mixed Precision, sicherer 4-Bit-Quantisierung und Dokument-Caching. Hielt die p95-Latenz unter Last stabil und reduzierte GPU-Stunden.
- Standardisierte Daten- und Evaluierungsvorgaben mit klaren Annotationsrichtlinien, Übereinstimmungsprüfungen zwischen Annotatoren und CI-Tests für EM/F1, um Qualitätsrückschritte zu verhindern.
- Arbeitete eng mit Produkt- und Betriebsteams zusammen, um Fehlerfälle wie schiefe Scans, Stempelüberlagerungen und unvollständige Tabellen zu priorisieren. Führte Korrekturen zurück ins Training und in Heuristiken für stetige Qualitätssteigerungen.
Jan. 2022 - Feb. 2023
1 Jahr 2 MonatenDeutschland
Deep-Learning-Ingenieur (HiWi)
Max-Planck-Institut
- Entwickelte eine Objekterkennungs-Pipeline mit SAM und GroundingDINO und verbesserte die Klassifikation biologischer Proben auf über 90% Präzision.
- Verbesserte die Erkennung von Pflanzenarten mithilfe von ResNet-50, steigerte die Leistung von 85% auf 93% und beschleunigte experimentelle Abläufe.
Zusammenfassung
KI-Ingenieur, spezialisiert auf große Sprachmodelle (LLMs) und Konversations-KI. Erfahren im Aufbau KI-gesteuerter Self-Service-Systeme, in der Automatisierung kundenorientierter Arbeitsabläufe und bei der Bereitstellung produktionsreifer NLP-Lösungen auf Cloud-Plattformen. Versiert darin, Technologie und Geschäftsergebnisse zu verbinden, mit nachgewiesener Effizienzsteigerung, Reduzierung manueller Arbeit und Verbesserung der Nutzererfahrung.
Fähigkeiten
- Programmierung: Python, C++, C
- Llms & Schlussfolgerung: Transformers, Hugging Face, Gemini / Gpt / Claude / Llama, Langchain / Langgraph / Llamaindex, Strukturierte Reasoning-prompts (Chain-of-thought Während Der Entwicklung), Tool-calling
- Retrieval & Vektoren: Faiss, Pgvector, Hybrides Bm25 + Dense Retrieval, Reranker, Schema-bewusstes Chunking
- Serving & Mlops: Fastapi, Docker, Ci/cd, Vllm, Quantisierung, Dynamisches Batching, Caching, Streaming, Observability, Ragas, Gold-sets, Em/f1, A/b-tests, Drift-monitoring
- Speech & Dokumenten-ki: Whisper, Wav2vec2, Vad, Tesseract, Doctr, Layoutlmv3, Donut, Tabellen- Und Einzelpostenextraktion
- Cloud & Daten: Gcp / Vertex Ai, Sql, Postgresql, Rest-apis
- Arbeitsweise: Git, Jira, Confluence, Agile/scrum
Sprachen
Englisch
VerhandlungssicherDeutsch
GrundkenntnisseAusbildung
Okt. 2020 - Juni 2024
Technische Universität Ilmenau
M.Sc. Forschung im Bereich Computer- und Systemtechnik · Forschung im Bereich Computer- und Systemtechnik · Ilmenau, Deutschland
Okt. 2014 - Juni 2018
UET Peshawar
B.Sc. Computer- und Systemtechnik · Computer- und Systemtechnik · Peshawar, Pakistan
Sie suchen Freelancer?Passende Kandidaten in Sekunden!
FRATCH GPT testenWeitere Aktionen
Ähnliche Freelancer
Entdecken Sie andere Experten mit ähnlichen Qualifikationen und Erfahrungen.