Cyprian Feliks
Senior KI/ML-Ingenieur
Erfahrungen
Senior KI/ML-Ingenieur
Andor Health
- Verantwortete Design und Entwicklung des Digital Front Door Systems, eines Multi-Agenten-Sprach-KI-Assistenten für Patienten, und nutzte das Microsoft Agent Framework zur Steuerung komplexer Reasoning- und Gesprächsabläufe über LiveKit
- Implementierte ein hybrides Retrieval-Augmented Generation (RAG) System mit PgVector und HNSW-basierter Indexierung zur Bearbeitung von Nutzeranfragen zu Gesundheit und medizinischer Beratung, reduzierte Halluzinationen und verbesserte die Relevanz der Antworten um ca. 20 %
- Entwickelte und implementierte Model Context Protocol (MCP) Tools wie das Tavily Suchwerkzeug und das EHR-Retrieval-Tool für Echtzeitzugriff auf Gesundheitsdaten, steigerte die Antwortgenauigkeit um 90 %
- Führte die Integration HIPAA-konformer generativer KI-Sicherheitsvorkehrungen und eines maßgeschneiderten Safety Checkers mit TinyBERT in die Produktions-Sprach-KI-Pipeline ein, um regulatorische Compliance sicherzustellen und toxische Outputs zu verhindern
- Entwickelte eine Evaluations-Pipeline unter Einsatz von LLM-as-a-Judge und traditionellen Metriken (ROUGE, BLEU, BERTScore) mit Azure Evaluators und etablierte Logging und Monitoring mit Prometheus und Grafana für Echtzeit-Performance-Einblicke
- Implementierte MLOps- und LLMOps-Pipelines auf Azure Machine Learning mit CI/CD via GitLab Actions und HITL (Human-In-The-Loop) mit MLflow, erreichte 99,9 % Verfügbarkeit und skalierte auf Millionen gleichzeitiger Anfragen
- Entwickelte ein Multi-Agenten-System mit LangChain und LangGraph zur Orchestrierung domänenspezifischer Fine-Tuned LLMs für nahtlose domänenübergreifende Interaktionen und effiziente Informationsbeschaffung
- Entwarf und führte verteilte Fine-Tuning-Pipelines für Open-Source-LLMs (Llama, Medical-Llama) mit QLoRA und Instruction Tuning auf Azure ML durch, beschleunigte die Konvergenz um 45 % und verringerte die Halluzinationsrate um 40 %
- Optimierte die Inferenz-Performance durch Quantisierung, Adapter-Fusion und Model Distillation mit ONNX, vLLM und TensorRT, reduzierte die Antwortlatenz um 40 % ohne Einbußen bei der Reasoning-Tiefe
- Begleitete und coachte Junior-Ingenieur:innen durch Erstellung von Onboarding-Guides, Leitung von Wissensaustausch-Sessions und Etablierung von Best Practices für generative KI, verteilte Systeme und Produktionsreife im Healthcare-Bereich
Senior KI-Ingenieur
Amdocs
- Zusammenarbeit mit T-Mobile-Ingenieuren und Data Scientists zur Entwicklung von KI-Lösungen, darunter ein Conversational AI Chatbot, 3D-Rekonstruktion von Antennenmasten und Tiefenschätzungsmodelle für physische Messungen
- Entwicklung und Implementierung eines KI-gestützten Kundenservicesystems mittels feinabgestimmtem GPT mit QLoRA und Conversational AI zur Verbesserung der Kundenbindung, was zu einer 30 % Reduktion der Antwortzeiten führte
- Optimierung der LLM-Performance und Effizienz durch Model Distillation, Quantisierung und Pruning, erreichte bis zu 30 % geringere Latenz und schnellere Inferenz für Echtzeit-Interaktionen
- Implementierung eines Retrieval-Augmented Generation (RAG)-Systems mit FAISS-basierendem Vektor-Store zur Verbesserung der Bearbeitung von Kundenanfragen mit relevanteren und genaueren Antworten
- Optimierung von Dokumentenmanagement-Workflows auf AWS S3 mit LLM-Modellen für Klassifikation und Zusammenfassung, reduzierte manuellen Aufwand um 50 % und steigerte die Betriebseffizienz
- Entwicklung von End-to-End-MLOps-Pipelines für Echtzeit-Datenaufnahme auf AWS SageMaker mit MLflow für Pre-Processing und Inferenz, verbesserte Antennenerkennung und Überwachungsgeschwindigkeit um 40 %
- Erstellung eines Tiefenschätzungsmodells mit monokularen Techniken unter Nutzung von MonoDepth und Multi-Scale-Fusionsnetzwerken zur Optimierung und präzisen Planung von Netzwerken
- Einsatz von GANs mit Digital-Twin-Technologie zur Erstellung von 3D-Rekonstruktionen aus Drohnenaufnahmen von Antennenmasten, verkürzte Modellierungszeit um 30 % und ermöglichte Echtzeit-Virtual-Inspektionen
- Durchführung von Exploratory Data Analysis und Erstellung von Power BI-Visualisierungen zur Identifizierung von Prozessengpässen, um datenbasierte Entscheidungen und bereichsübergreifende Einblicke zu fördern
Machine Learning-Ingenieur
SiteCore
- Entwickelte ein multivariates Zeitreihen-Vorhersagesystem mit hybrider LSTM- und Transformer-Architektur zur Prognose von Rohstoffpreisbewegungen und verbesserte die Genauigkeit durch aufmerksamkeitsbasierte Modelle und Feature Engineering
- Entwarf und implementierte in Python mit scikit-learn ein K-Means-Clustering-Modell für Kundensegmentierung, steigerte die Conversion-Rate gezielter Kampagnen um 20 %
- Arbeitete mit Data-Science-Teams zusammen, um Prototypen und Bereitstellung von Empfehlungssystemen mittels Matrixfaktorisierung und Autoencodern zu realisieren und optimierte Algorithmen für personalisierte Nutzererlebnisse
- Erstellte interaktive Tableau-Dashboards zur Visualisierung von KPIs wie Modell-Performance, Conversion-Lift und Pipeline-Latenz und ermöglichte so datengetriebene Entscheidungen der Fachbereiche
- Aufbau und Wartung von ETL-Pipelines in Python auf GCP mit Google Cloud Storage für skalierbare Datenerfassung, -transformation und -speicherung und sicherte dabei zuverlässige Lieferung und konsistente Wiederherstellung
Software-Ingenieur
SimCorp
- Entwarf und implementierte Backend-Services mit Django und Flask in einer Microservices-Architektur, um hohe Performance und Skalierbarkeit für Finanzanwendungen sicherzustellen
- Verwaltung und Optimierung von MongoDB- und PostgreSQL-Datenbanken für Datenintegrität und Zuverlässigkeit bei großflächigen Transaktionen und Finanzberichterstattung
- Entwicklung und Wartung von Microservices mit Java und Node.js, ermöglichte nahtlose Modulinteraktion und reibungslose Deployment-Versionierung
- Umsetzung von Containerisierung und Orchestrierung mit Docker und Kubernetes zur Verbesserung der Entwicklungs-Pipelines, Reduzierung von Ausfallzeiten und Sicherstellung hoher Verfügbarkeit
- Aufbau und Pflege robuster Datenpipelines mit internen Tools für Log-Verarbeitung und Reporting-Infrastruktur zur Unterstützung unternehmensweiter Analysen
- Implementierung von A/B-Testframeworks für Frontend-Funktionen mithilfe statistischer Methoden zur Analyse der Nutzerbindung und Steuerung von Produktentscheidungen
Zusammenfassung
Erfahrener KI-Ingenieur mit über 10 Jahren Erfahrung und tiefem Fachwissen in Architektur und Bereitstellung groß angelegter KI-Systeme mit LLMs, Multi-Agenten-Orchestrierung, Computer Vision sowie cloud-nativem MLOps. Erfahren im Aufbau produktionsreifer Pipelines mit RAG, RLHF, verteiltem Fine-Tuning, Vektordatenbanken und automatisiertem CI/CD auf Azure, AWS und GCP. Nachweisliche Erfolge bei Verbesserung der Genauigkeit, Reduzierung von Halluzinationen und Beschleunigung von Deployment-Zyklen durch robuste Datenpipelines, Geodatenanalyse und Modelloptimierungs-Frameworks. Kompetent in der Übertragung komplexer Forschung in skalierbare Unternehmenslösungen, dabei Mentoring von Teams und Förderung funktionsübergreifender technischer Initiativen.
Fähigkeiten
- Programmierung & Tools – Python, Javascript, C++, React, Sql, Fastapi, Flask, Django, Restful Apis, Git, Jira
- Machine Learning & Deep Learning – Überwachtes, Unüberwachtes & Selbstüberwachtes Lernen, Cnn, Transformer, Tensorflow, Pytorch, Scikit-learn, Pandas, Pydantic, Spacy, Nltk, Transfer Learning, Multi-modal-modelle, Graph-neuronale Netze
- Generative Ai & Llms – Gemini Pro, Gpt-4/3.5, Claude, Llama 3, Mistral, Command R+, Prompt-engineering & Versionierung, Fine-tuning, Peft, Lora, Qlora, Instruction Tuning, Multi-agenten-systeme, Conversational Ai, Langchain, Langgraph, Crewai, Semantic Kernel, Microsoft Agent Framework, Tts & Stt-modelle
- Llm-optimierung – Vllm, Tensorrt-llm, Flashattention, Pagedattention, Dynamic Batching, Modellquantisierung, Peft (Lora, Qlora, Adapter), Destillation, Effiziente Transformer-architekturen
- Rag & Vektorsuche – Hybrid Retrieval, Metadaten-filterung, Pgvector, Pinecone, Faiss, Chroma, Hnsw-indexierung, Multi-modal-rag, Context Re-ranking (Colbert, Minilm, Tinybert)
- Mlops & Llmops – Aws (Sagemaker, Ecs, Eks, Lambda, Cloudwatch), Gcp (Vertex Ai, Bigquery, Cloud Run), Azure (Azure Ml, Azure Functions), Kubeflow, Mlflow, Llamaindex, Docker, Kubernetes, Helm, Terraform, Kserve, Triton, Modell-monitoring & Ci/cd, Prometheus, Grafana
- Data Science – Datenpipelines (Apache Airflow, Prefect), Spark, Postgresql, Mongodb, Nosql, Bigquery, Etl-pipelines, Eda, Power Bi, Databricks
- Soft Skills – Technische Führung & Mentoring, Bereichsübergreifende Zusammenarbeit, Strategisches Denken, Produktorientierte Entwicklung, Agile Teamarbeit, Kontinuierliches Lernen & Anpassungsfähigkeit In Der Forschung
Sprachen
Ausbildung
University of Copenhagen
Master of Science in Informatik · Informatik · Kopenhagen, Dänemark
University of Copenhagen
Bachelor of Science in Informatik · Informatik · Kopenhagen, Dänemark
Ähnliche Freelancer
Entdecken Sie andere Experten mit ähnlichen Qualifikationen und Erfahrungen.