Stephan F.

NLP/LLM-Chatbot

Wiesbaden, Deutschland

Erfahrungen

Okt. 2024 - Apr. 2025
7 Monaten

NLP/LLM-Chatbot

Versicherung

  • Konzipierte und implementierte einen LLM-basierten Fallassistenten (Dateiassistent).
  • Wählte RAG-Methoden aus und evaluierte sie; entwickelte ein hybrides RAG-Informationsabrufsystem mit Elasticsearch + Embeddings.
  • Erstellte Ingestion-Pipelines für verschiedene Dokumentformate; analysierte und stimmte sie mit den Quellsystemen ab.
  • Entwickelte eine Streamlit-basierte Chatbot-GUI und führte NLP-basierte Kausalkettenanalysen für Regressfälle durch.
  • Bewertete analytische LLM-Methoden; über Jenkins auf OpenStage bereitgestellt.
  • Genutzte Technologien: Streamlit, Elasticsearch/OpenSearch, Hugging Face, Python, OpenAI API, Jenkins
März 2024 - Dez. 2025
1 Jahr 10 Monaten
Wiesbaden, Deutschland

Berater

AWS PoC / Inhaltsanalyse

  • Bewertete Dashboard-Ansätze und erstellte ein Prototyp-Dashboard in Streamlit mit Google-Suchdaten und HTTP-Logs aus AWS S3/Athena.
  • Integrierte Websuche- und Marketing/Blog-Daten; entwickelte Pipelines für Bildwissensextraktion und -bewertung (LMM / Graph & Vector RAG).
  • Erstellte einen AWS-Amplify-basierten Service, der AI-as-a-Service (Mistral, Replicate) integriert; Daten in Neo4j mit Text-zu-Graph-Extraktion gespeichert.
  • Implementierte Graph-RAG mit Neo4j und stellte es via AWS CDK und GitLab CI/CD bereit.
  • Genutzte Technologien: AWS Amplify, S3, Athena, Neo4j, Pandas, Streamlit, Mistral API, Replicate API, GitLab CI/CD, AWS CDK
Juni 2023 - Juni 2024
1 Jahr 1 Monate

Knowledge Graph / NLP / KI-Ingenieur

Bundeskriminalamt

  • Arbeitete in einer sicherheitsgeprüften (SÜ2) und BSI-konformen Umgebung.
  • Untersuchte und beriet zum Einsatz von Knowledge Graphs; entwarf & implementierte Pipelines mit Neo4j.
  • Rohdatenextraktion aus SQL-Dumps und Zuordnung zu Entitäten; Design des Graph-Datenmodells.
  • Fortgeschrittenes NLP: NER, Themen- & Ereignisextraktion, Spracherkennung; Extraktion komplexer Relationen mit POLE (Personen, Objekte, Orte, Ereignisse).
  • Wendete Graphalgorithmen an (Eingangsgrad, Community Detection – Louvain/Dreiecksanzahl), um relevante Entitäten und Beziehungen zu identifizieren.
  • Integrierte GeoIP-/Domain-Extraktion und URL-Auswertung; implementierte Streaming-Ingestion mit Kafka.
  • Erstellte eine LLM/Chat-Streamlit-App, die auf Cloud Foundry in Kubernetes bereitgestellt wurde; integriert in eine BSI-konforme Umgebung.
  • Genutzte Technologien: Neo4j, Pandas, Polars, spaCy, OpenNLP, Hugging Face, Kafka, Cloud Foundry, Kubernetes, GitLab CI/CD, Streamlit
Mai 2022 - Nov. 2022
7 Monaten

Corporate-Webportal-Ingenieur

Siemens

  • Entwarf und implementierte tägliche Datenpipelines mit AWS Glue/PySpark und Athena; Überwachung über CloudWatch.
  • Erstellte einen GraphQL-Apollo-Server in AWS Lambda; integrierte Inhalte aus OpenSearch und Nutzungsdaten aus dem Adobe Data Warehouse.
  • Fügte eine App zur Lesbarkeitsbewertung hinzu; integrierte einen AWS-SageMaker-Endpunkt für Textklassifikation.
  • Führte Machbarkeitsstudien, Konzeptarbeiten und Abstimmungen mit Stakeholdern durch; evaluierte Athena Query Federation; verantwortete Kosten und Optimierung.
  • Genutzte Technologien: AWS Glue, PySpark, Athena, CloudWatch, Lambda, DynamoDB, SageMaker, KMS/SSM, EC2 (Tests), GraphQL/Apollo, OpenSearch/Elasticsearch, Terraform
März 2021 - März 2022
1 Jahr 1 Monate

Data-Lake-Ingenieur

BMW Connected Vehicle

  • Leitete die Entwicklung großskaliger, AWS-basierter Datenpipelines für mehrere Datensätze (Glue/PySpark, Athena, S3, Lambda, IAM, SQS/SNS, DynamoDB/DAX, Elasticsearch).
  • Verarbeitete über 30 Milliarden Zeilen; implementierte automatisierte Neustart- und Wiederherstellungsprozesse sowie Unit-Tests.
  • Entwarf Pipelines für tägliche, historische und Wartungsprozesse; führte Produktionsproblemanalysen durch und beriet intern.
  • Führte Kostenanalysen durch, leitete Maßnahmen ab, setzte Kosteneinsparungen um und überwachte deren Reduzierung.
  • Refaktorisierte komplexe Fahrzeug-Stammdaten (7 Datensätze, ~35 Tabellen; mittlere Geschäftslogik; >1 Mrd. Zeilen/Tag).
  • Führte Machbarkeitsanalysen, Anforderungsaufbereitung und Umsetzungskonzepte durch; verfasste Dokumentationen.
  • Genutzte Technologien: AWS Glue, PySpark, Athena, S3, CloudWatch, Lambda, SSM, KMS, IAM, SQS/SNS, Elasticsearch, DynamoDB/DAX, EC2 (Tests), Terraform
Jan. 2020 - Dez. 2025
6 Jahren

Unabhängiger Entwickler

Generative AI Blog & AWS Serverless-Experimente

  • Mehrere serverlose Stacks in AWS mit CDK und GitLab CI/CD erstellt.
  • LLMs/NLP erforscht; Experimente in automatisierter Bildanalyse und -erzeugung.
  • KI-Datenpipelines zur Wissensextraktion und -anreicherung implementiert; Chatbots entwickelt, die Bildanalyse mit Wissensgraph-Kontext kombinieren.
  • Explorative iOS-Apps mit Swift/SwiftUI und AWS-Backends entwickelt.
  • Verwendete Technologien: AWS CDK, AppSync, Amplify, Lambda, Cognito, API Gateway, Route 53, Glue, Neptune, SageMaker, Bedrock, S3, OpenAI, Mistral, Replicate, spaCy, Swift/SwiftUI, DynamoDB
Juli 2017 - Aug. 2020
3 Jahren 2 Monaten

Data-Warehouse-Ingenieur

Deutsche Bahn Vertrieb

  • Datenmodell für Passagierumsätze (Ticketverkäufe und andere Services) entworfen und implementiert, unter Berücksichtigung von AWS-spezifischen Aspekten (Sortier-Schlüssel, Datenverteilung).
  • Mehrstufige Data-Warehouse-Architektur aufgebaut: zweistufiges Staging, Core (persistentes Geschäftsmodell), Analytics (für SAP BO optimiert) und Output für Datei-Schnittstellen.
  • ETL-/Datenpipelines entworfen: täglich, historische Nachverarbeitung, Housekeeping; Lambda/S3-Ereignisse zur Job-Steuerung; Neustart aus Rohdaten; ~1M Zeilen/Tag verarbeitet.
  • Jobs mit AWS Batch (Python, Docker) über SSM Parameter Store implementiert; Integration von DynamoDB; eingeschränkter Einsatz von Red Hat OpenShift auf AWS.
  • Build-Pipelines für >15 Projekte via GitLab CI/CD verwaltet (dynamische Parametrisierung, Docker-Images, Build-Skripte, Python Merge/Deploy).
  • Performance-Analysen und Workshops mit AWS Support durchgeführt; Redshift WLM optimiert; Betriebsstabilität durch wöchentliche Koordination und Fehlersuche gesichert.
  • Verwendete Technologien: AWS Redshift, Lambda, S3, Batch, Docker, DynamoDB, Python, Pandas, SAP BO, GitLab CI/CD, Flyway
Aug. 2016 - Juni 2017
11 Monaten

Dateningenieur

Opel/GM

  • Datenmodell entworfen, um Logistikkosten für Wareneingang basierend auf Frachtraten, Wareneingängen und Stammdaten zu berechnen.
  • Eingangskosten pro produziertem Fahrzeug und pro Transport-/Sendungs-/Materialnummer berechnet; umfangreiche Analysen mit SQL und R zur Ableitung von Geschäftsregeln und Fehleranalyse.
  • In den Rollen Datenanalyst, Business Analyst und Dateningenieur gearbeitet; Schnittstellen und Prozesse mit Logistik, Netzplanung und Finanzabteilung koordiniert.
  • IT-Konzept erstellt und die Lösung zur operativen Nutzung an die Fachabteilung übergeben.
  • Verwendete Technologien: MS SQL Server, Transact-SQL, R, PowerBI/Excel
Apr. 2016 - Juni 2016
3 Monaten

Funktionaler Datenanalyst

BMW

  • Materialsteuerung und Logistikplanung analysiert; Prioritäten mit Stakeholdern festgelegt; Schnittstelle SAP–DWH untersucht.
  • Teradata SQL, ETL-Module, Views und Datenmodelle in den Quell-, Inbound- (SAP→DWH) und DWH-Ebenen untersucht; Lösungen vorgeschlagen und Ergebnisse dokumentiert.
  • Verwendete Technologien: Teradata SQL, ETL-Analyse, SAP DWH
Apr. 2016 - Juni 2016
3 Monaten

Produktionsdaten-/Big-Data-Analyst

BMW

  • Schnittstellenspezifikationen erstellt und SQL-basierte Datenanalysen durchgeführt; Anforderungen erfasst und analysiert; Lösung dokumentiert und modelliert.
  • IT-Konzept (Architektur, Schnittstellen, Betrieb) erstellt; Auswahl von Tools für Change-Data-Capture unterstützt.
  • Verwendete Technologien: Hadoop/Hive, GoldenGate/Sqoop, Spark, Scala
Jan. 2016 - Dez. 2025
10 Jahren

Entwickler für Nebenprojekte

Social VR Prototype

  • Prototyp eines kollaborativen VR-Raums mit Messaging, Nutzermanagement und Echtzeitanforderungen; Erforschung von Skalierung und Verfügbarkeit; visuelles Konzept und 3D-Modellierung.
  • Verwendete Technologien: Akka, Scala, C#, Unity (VR-GUI), Blender, WebRTC
Jan. 2013 - Dez. 2016
4 Jahren

BI-/Analytics-Berater

BMW

  • Leitung mehrerer Teilprojekte, darunter Strategisches Reporting, Zeiterfassung, Einführung Tableau/Teradata, Garantie-Kosten-Controlling, Sonderausstattungsplanung und BI in der Qualitätssicherung.
  • Strategisches Reporting: Koordination der Go-Live-Bereitschaft & Betriebseinführung; Arbeit mit SAP BW.
  • Zeiterfassung: Steuerung der Go-Live-Bereitschaft und des Testmanagements; Erstellung des Betriebshandbuchs.
  • Einführung von Tableau/Teradata: Etablierung der BI-/DWH-Umgebung; Architektur-Analyse; Koordination von Tests und Code-Reviews.
  • Garantie-Kosten-Controlling: Prozessanalyse; Prototypen in QlikView, SPSS Modeler und Java EJB geliefert.
  • Sonderausstattungsplanung: Erstellung von High-Level- und Funktionskonzepten; Prozessmodellierung.
  • BI in der Qualitätssicherung: Entwicklung von UI- und Analyseanforderungen in QlikView 11 mit VBScript.
  • Verwendete Technologien: SAP BW, Java/EJB, Oracle PL/SQL, Teradata, Tableau, QlikView, Informatica, SPSS Modeler, UML, VBScript
Jan. 2012 - Dez. 2025
14 Jahren
Hybrid

Gründer & Leitender Ingenieur

Saganode

  • Entwurf und Aufbau einer hybriden, KI-basierten Plattform für Storytelling und Weltaufbau, die Wissensgraphen, LLMs und individuelle Entropie-Shaping-Heuristiken kombiniert.
  • Implementierung mehrschichtiger Graph-Räume und Graph-RAG; Integration generativer Dienste für Text, Bild und Musik; React-basierter Graph-Explorer.
  • Sicherheit & Bereitstellung mit AWS AppSync/Amplify-Backends, REST/GraphQL-Endpunkten, CI/CD, AWS CDK, Cognito/IAM.
  • Verwendete Technologien: Neo4j, Qdrant, Python, React, GraphQL, AWS AppSync/Amplify, AWS CDK
Jan. 2012 - Dez. 2020
9 Jahren

Prototyp-Entwickler

Obylo

  • Erforschung von Graphdatenbank-Ansätzen und semantischem BI mit Neo4j; Entwicklung einer ETL-Pipeline zur Graph-Ingestion.
  • Entwicklung von Social-VR-Experimenten mit Unity/Blender unter Einsatz von Akka/C#; Erstellung von Such- und Empfehlungs-Komponenten.
  • Verwendete Technologien: Neo4j, Scala, Play Framework, Akka, HTML/JavaScript, Unity/Blender
Jan. 2009 - Dez. 2012
4 Jahren

Berater für ERP-/DWH-Migration und Finanzprozesse

Deutsche Telekom

  • Analyse der Auswirkungen der One.ERP-Integration auf DWH-T-Systeme; Abbildung der Ein- und Ausgangsdatenflüsse in SAP- und BW-Landschaften.
  • Bewertung zentraler Finanzprozesse: Umsatzbearbeitung, Monatsabschluss, Mahnwesen/Forderungsmanagement, Logistik, Nebenbücher, Rechnungsstellung.
  • Erstellung von Wissensmaterialien zu Controlling, Treasury, Buchhaltung, IFRS-/HGB-Unterschieden; Klarstellung der KPIs (OCF, ROCE, CapEx, EBITDA).
  • Verwendete Technologien: SAP BW, SAP ERP, Oracle, DWH-T, ConBW/IKOS
Jan. 2008 - Dez. 2011
4 Jahren

Senior Consultant

Deloitte

  • Berichtswesen auf Konzernebene: strategische und fachliche Konzepte; Abstimmung der Anforderungen; Projektmanagement.
  • Beratungsprojekte für Finanzinformatik, LBB und IKB im Reporting und BI-Flows zur Unterstützung von Controlling und Treasury; OSPlus-Migrationen und Datenintegration.
  • Entwurf von Cashflow-Prototypen und Abschlussprozess-Prototypen; Entwicklung des Businessplans für die Unternehmensinitiative Ask&Bid.
  • Eingesetzte Technologien: SAP BW, Oracle, QlikView, OSPlus/DB2, Java, Excel/R
Jan. 2008 - Dez. 2009
2 Jahren

BI/DWH-Architektur- und Reporting-Berater

NordLB

  • Beratung in BI/DWH-Architektur und Reporting für Bankfunktionen mit Schwerpunkt Controlling und risikoorientiertes Reporting.
  • Eingesetzte Technologien: SAP BW, Oracle, QlikView
Jan. 2001 - Dez. 2008
8 Jahren

Selbstständig/Freiberuflich

  • Projekte im Banking-, Medien- und Telekommunikationsbereich; Tätigkeiten im Projektmanagement, Software Engineering und Produktmanagement.
Jan. 1996 - Dez. 2001
6 Jahren

Mitgründer und Manager

Scopas Medien AG / FunPage

  • Mitaufbau und Leitung der Agenturbetriebe; Produktionsplanung; Umsetzung verschiedener Kundenprojekte; Software- und Multimedia-Engineering.
Jan. 1992 - Dez. 1997
6 Jahren

Student

Diplom in Wirtschaftsinformatik (FH), Hochschule Furtwangen (Auslandssemester in Leicester, UK)

Jan. 1988 - Dez. 1991
4 Jahren

Schüler

Abitur (deutsche Hochschulreife), Werner-Heisenberg-Schule, Rüsselsheim

Zusammenfassung

Berater und Ingenieur mit über 20 Jahren Erfahrung im Daten-Engineering, in der Integration von KI/LLM und in Cloud-Architekturen.

Spezialisiert auf skalierbare Datenpipelines, Wissensgraphen und Retrieval-Augmented Generation (RAG).

Fundierter Hintergrund in NLP-/LLM-Engineering, Ontologie-Integration, semantischer Anreicherung und Graphalgorithmen.

Erfolgreiche Projekte in der Automobilbranche, im Finanzwesen, in der Telekommunikation, im öffentlichen Sektor und in der Strafverfolgung.

Sprachen

Deutsch
Muttersprache
Englisch
Verhandlungssicher

Ausbildung

Okt. 1992 - Juni 1997

Fachhochschule Furtwangen

Diplom (FH) · Wirtschaftsinformatik · Deutschland

Okt. 1988 - Juni 1991

Werner-Heisenberg-Schule

Abitur · Deutschland

Sie suchen Freelancer?Passende Kandidaten in Sekunden!
FRATCH GPT testen
Weitere Aktionen