Stephan Fröde
NLP/LLM-Chatbot
Erfahrungen
Okt. 2024 - Apr. 2025
7 MonatenNLP/LLM-Chatbot
Versicherung
- Konzipierte und implementierte einen LLM-basierten Fallassistenten (Aktenassistent)
- Auswahl und Bewertung von RAG-Methoden; Entwurf einer hybriden RAG-Informationssuche mit Elasticsearch und Embeddings
- Aufbau von Ingestion-Pipelines für mehrere Dokumentformate; Analyse und Abstimmung mit den Quellsystemen
- Entwicklung einer Streamlit-basierten Chatbot-Benutzeroberfläche und Durchführung einer NLP-basierten Kausalkettenanalyse für Regressfälle
- Bewertung analytischer LLM-Methoden; Bereitstellung über Jenkins auf OpenStage
März 2024 - Bis heute
1 Jahr 10 MonatenAWS PoC / Inhaltsanalyse
- Bewertung von Dashboard-Ansätzen und Erstellung eines Prototyp-Dashboards in Streamlit mit Google-Suchdaten und HTTP-Logs in AWS S3/Athena
- Integration von Web-Such- und Marketing-/Blog-Daten; Konzeption von Pipelines zur Bildwissensextraktion und -bewertung (LMM / Graph & Vector RAG)
- Aufbau eines AWS-Amplify-Dienstes zur Integration von KI-as-a-Service (Mistral, Replicate); Daten persistent in Neo4j mit Text-zu-Graph-Extraktion
- Umsetzung von Graph RAG mit Neo4j und Bereitstellung über AWS CDK und GitLab CI/CD
Juni 2023 - Juni 2024
1 Jahr 1 MonateWissensgraph / NLP / KI
Bundeskriminalamt
- Arbeit in einem sicherheitsüberprüften (SÜ2) und BSI-konformen Umfeld
- Erforschung und Beratung zum Einsatz von Wissensgraphen; Konzeption und Implementierung von Pipelines mit Neo4j
- Rohdatenauszug aus SQL-Dumps und Zuordnung zu Entitäten; Entwurf des Graph-Datenmodells
- Fortgeschrittene NLP: NER, Themen- und Ereignisextraktion, Sprachenerkennung; Extraktion komplexer Beziehungen mit POLE (Persons, Objects, Locations, Events)
- Anwendung von Graph-Algorithmen (In-Degree, Community Detection – Louvain/Triangle Count) zur Identifikation relevanter Entitäten und Beziehungen
- Integration von GeoIP-/Domänenextraktion und URL-Auswertung; Implementierung einer Streaming-Ingestion (Kafka)
- Entwicklung einer LLM/Chat-Streamlit-App, bereitgestellt auf Cloud Foundry unter Kubernetes; Integration in ein BSI-konformes Umfeld
Mai 2022 - Nov. 2022
7 MonatenCorporate-Webportal
Siemens
- Entwurf und Implementierung täglicher Datenpipelines mit AWS Glue/PySpark und Athena; Überwachung über CloudWatch
- Aufbau eines GraphQL-Apollo-Servers in AWS Lambda; Integration von Content-Elementen aus OpenSearch und Nutzungsdaten aus dem Adobe Data Warehouse
- Entwicklung einer App zur Lesbarkeitsbewertung; Integration eines AWS-SageMaker-Endpunkts für Textklassifikation
- Durchführung von Machbarkeitsstudien, Konzeptarbeit und Abstimmung mit Stakeholdern; Bewertung der Athena Query Federation; Kostenmanagement und Optimierung
März 2021 - März 2022
1 Jahr 1 MonateData Lake
BMW Connected Vehicle
- Leitung der Entwicklung großskaliger, AWS-basierter Datenpipelines für mehrere Datensätze (Glue/PySpark, Athena, S3, Lambda, IAM, SQS/SNS, DynamoDB/DAX, Elasticsearch)
- Verarbeitung von bis zu 30+ Milliarden Zeilen; Implementierung automatisierter Neustart- und Wiederherstellungsverfahren sowie Unit-Tests
- Konzeption täglicher, historischer und Wartungspipelines; Durchführung von Produktionsproblem-Analysen und interne Beratung
- Durchführung von Kostenanalysen, Ableitung von Maßnahmen, Umsetzung von Kosteneinsparungen und Überwachung der Reduzierungen
- Überarbeitung komplexer Fahrzeugstammdaten (7 Datensätze, ca. 35 Tabellen; mittlere Geschäftslogik; >1 Mrd. Zeilen/Tag)
- Durchführung von Machbarkeitsanalysen, Anforderungsverfeinerung und Entwicklung von Implementierungskonzepten; Erstellung der Dokumentation
Jan. 2020 - Bis heute
6 JahrenProjekt
Generative AI Blog & AWS Serverless Experiments
- Mehrere serverlose Stacks in AWS mit CDK und GitLab CI/CD aufgebaut (VPC/Serverless, Amplify, AppSync, Lambda, API Gateway, Cognito, Route 53, Glue, Neptune, SageMaker, Bedrock, S3)
- LLMs/NLP erkundet (OpenAI API, Hugging Face, Mistral, Replicate, Gemini, Claude); Experimente in automatisierter Bildanalyse & -generierung mit VLM/LMM durchgeführt
- KI-Datenpipelines zur Wissensextraktion und -anreicherung implementiert (Image-to-Text-to-Knowledge); Chatbots entwickelt, die Bildanalyse mit Wissensgraph-Kontext kombinieren
- Explorative iOS-Apps (Swift/SwiftUI) mit API Gateway entwickelt; Ergebnisse in DynamoDB gespeichert; Lambda/Python-Backends
Juli 2017 - Aug. 2020
3 Jahren 2 MonatenData Warehouse (Passagiererlöse)
Deutsche Bahn Vertrieb
- Datenmodell für Passagiererlöse (Ticketverkäufe und andere Services) unter Berücksichtigung von AWS-Spezifika (Sortierschlüssel, Datenverteilung) entworfen und implementiert
- Mehrstufige Data Warehouse-Architektur erstellt: Zwei-Stufen Staging, Core (persistentes Geschäftsmodell), Analytics (für SAP BO optimiert) und Output für Datei-Schnittstellen
- ETL/Datenpipelines geplant: täglich, historische Nachverarbeitung, Housekeeping; Lambda/S3-Events für Job-Steuerung; Neustart aus Rohdaten; ca. 1 Mio. Zeilen/Tag verarbeitet
- Jobs mit AWS Batch (Python, Docker) unter Verwendung von SSM Parameter Store implementiert; DynamoDB integriert; Red Hat OpenShift auf AWS begrenzt
- Build-Pipelines für >15 Projekte über GitLab CI/CD verwaltet (dynamische Parametrisierung, Docker-Images, Buildskripte, Python Merge/Deploy)
- Performance-Analyse und Workshops mit AWS Support durchgeführt; Redshift WLM optimiert; Stabilität des Betriebs durch wöchentliche Koordination & Troubleshooting gesichert
Aug. 2016 - Juni 2017
11 MonatenInbound-Logistikkosten
Opel/GM
- Datenmodell zur Berechnung der Inbound-Logistikkosten auf Basis von Frachtkosten, Wareneingängen und Stammdaten entworfen
- Inbound-Kosten pro produziertem Fahrzeug und pro Transport/Ladung/Stücklisten-Nummer berechnet; umfangreiche Analysen mit SQL und R zur Ableitung von Geschäftsregeln und Fehlersuche
- In den Rollen Data Analyst, Business Analyst und Data Engineer gearbeitet; Schnittstellen und Prozesse mit Logistik, Netzwerkplanung und Finanzen koordiniert
- IT-Konzept erstellt und Lösung an die Fachabteilung für den operativen Einsatz übergeben
Apr. 2016 - Juni 2016
3 MonatenFunktionale Datenanalyse
BMW
- Materialsteuerung und Logistikplanung analysiert; Priorisierung mit Stakeholdern; SAP–DWH-Schnittstelle untersucht
- Teradata SQL, ETL-Module, Views und Datenmodelle in Source, Inbound (SAP→DWH) und DWH-Schichten untersucht; Lösungen vorgeschlagen und Ergebnisse dokumentiert
Apr. 2016 - Juni 2016
3 MonatenProduktionsdaten / Big Data
BMW
- Schnittstellenspezifikationen erstellt und SQL-basierte Datenanalyse durchgeführt; Anforderungen erfasst und analysiert; Lösung dokumentiert & modelliert
- IT-Konzept (Architektur, Schnittstellen, Betrieb) erstellt; Toolauswahl für Change-Data-Capture unterstützt
Jan. 2016 - Bis heute
10 JahrenNebenprojekt
Social VR Prototype
- Prototyp eines kollaborativen VR-Raums mit Messaging, Benutzerverwaltung und Echtzeit-Beschränkungen erstellt
- Skalierbarkeit und Verfügbarkeit von Echtzeitdiensten untersucht; visuelles Konzept erstellt und 3D-Modellierung durchgeführt
Sept. 2014 - Feb. 2015
6 MonatenZeiterfassung
BMW
- Go-Live-Bereitschaft und Testmanagement vorbereitet und abgeschlossen; Betriebshandbuch verfasst
- Bereitstellungs- und Betriebsprobleme analysiert
Apr. 2014 - März 2016
2 JahrenEinführung Tableau / Teradata
BMW
- Einführung einer Teradata/Tableau BI/DWH-Umgebung (~80 Schnittstellen): Architektur-Analyse, Skalierung/Performance und 7-Jahres-TCO über 6 Alternativen
- Unterstützung von High-Level-/Funktions-/IT-Konzepten, Schnittstellenanalyse und Koordination mit externen Datenlieferanten
- Beratung zu Informationssicherheit und Datenschutz; Betriebsprozesse initiiert und automatisiert; Änderungen und Vorfälle verwaltet
- Testkoordination (Testfälle & Monitoring); Code-Reviews, Datenqualitätsanalysen und Verbesserungsvorschläge geleitet
Apr. 2014 - Feb. 2015
11 MonatenStrategisches Reporting – Vorserie
BMW
- Änderungen koordiniert und Betriebshandbuch für Go-Live-Bereitschaft & Inbetriebnahme erstellt
- Bereitstellungs-/Betriebsprobleme analysiert und operative Maßnahmen dokumentiert
- Mit SAP BW gearbeitet (Prozessketten, DSO)
März 2013 - Juni 2013
4 MonatenSpezialausrüstungsplanung
BMW
- Erstellung von High-Level- und Funktionskonzepten: Prozessanalyse & -beschreibung, Anforderungsaufnahme & -analyse, Prozessmodellierung
- Anforderungen und Prozessmodelle in Benutzeranleitungen und Workflows für Datenpflege überführt
Feb. 2013 - März 2014
1 Jahr 2 MonatenControlling der Gewährleistungskosten
BMW
- Analysierte Prozesse und IT-Architektur; führte Leistungstests durch; erfasste funktionale Anforderungen (Kosten, Qualität, Rückstellungen)
- Schlug BI/Analytics-Lösungen und eine neue Architektur vor; lieferte Prototypen in QlikView, SPSS Modeler und Java EJB
Jan. 2013 - Feb. 2013
2 MonatenBI in der Qualitätssicherung
BMW
- Analysierte das Datenmodell und die Datenbereitstellung einer QlikView-Anwendung in der Qualitätssicherung; erstellte UI- und analytische Anforderungen in QlikView 11 mit VBScript-Komponenten
- Implementierte länderspezifische Datenansichten basierend auf dem Benutzer (NTUser)
Jan. 2012 - Bis heute
14 JahrenHybrid
Hybride KI-Storytelling-Plattform
Saganode
- Entwarf und baute eine hybride KI-Storytelling-/Weltenbau-Plattform, die Wissensgraphen, LLMs und angepasste Entropie-Steuerungsheuristiken kombiniert
- Implementierte mehrschichtige Graphräume (temporal, kausal, konzeptuell) und Graph RAG; integrierte generative Services für Text, Bild und Musik
- Entwickelte einen auf React basierenden Graph-Explorer zur Navigation durch Universum/Saga/Geschichte
- Verantwortlich für Sicherheit und Deployment: AWS AppSync/Amplify Backends; REST-/GraphQL-Endpunkte; CI/CD; AWS CDK; Cognito/IAM
Jan. 2012 - Dez. 2020
9 JahrenEmpfehlungs-Engine
Obylo
- Untersuchte Graphdatenbank-Ansätze und semantische BI auf Neo4j; entwickelte ETL für Graph-Ingestion; erforschte Skalierungs-, Latenz- und I/O-Einschränkungen
- Entwickelte erste Social-VR-Experimente mit Unity/Blender und Akka/C#; baute Such- und Empfehlungs-Komponenten für komplexe Daten
Jan. 2009 - Dez. 2012
4 JahrenERP-/DWH-Migration & Finanzprozesse
Deutsche Telekom
- Analysierte Auswirkungen der One.ERP-Integration auf DWH-T-Systeme; kartierte Datenflüsse in SAP- und BW-Landschaften
- Bewertete zentrale Finanzprozesse: Erlösabwicklung, Monatsabschluss, Mahnwesen/Forderungsmanagement, Logistik, Nebenbücher, Fakturierung/Rechnungsstellung
- Erstellte Wissensmaterialien zu Controlling, Treasury, Buchhaltung und Unterschieden in der Finanzberichterstattung nach IFRS/HGB; klärte KPIs (OCF, ROCE, CapEx, EBITDA)
Jan. 2008 - Dez. 2011
4 JahrenBank- und Finanzberatung
Mehrere Institutionen
- Seniorberater für konzernweites Management-Reporting: übergeordnete und fachliche Konzepte, Abstimmung der Anforderungen, Projektmanagement
- Beratung zu Reporting- und BI-Prozessen zur Unterstützung von Controlling und Treasury; OSPlus-Migrationen und Datenintegration
- Cashflow-Prototypen entworfen und zu Cash-Management-Lösungen und -prozessen beraten
- Geschäftsanalyse vorgenommen und Prototypen für Abschluss-Workflows und Finanzberichterstattung entworfen
- Businessplan, Liquiditätsplanung und Deckungsbeitragsrechnung für ein E-Commerce-Startup entwickelt; Marktmodell basierend auf börsenähnlichen Mechanismen
Jan. 2008 - Dez. 2009
2 JahrenBI/DWH-Architektur & Reporting
NordLB
- Beratung zur BI/DWH-Architektur und zum Reporting für Bankfunktionen mit Fokus auf Controlling und Risiko-Reporting
Jan. 2001 - Dez. 2008
8 JahrenBerater
Selbstständig/Freiberuflich
- Projekte im Banking-, Medien- und Telekombereich geleitet; Rollen im Projektmanagement, in der Softwareentwicklung und im Produktmanagement
Jan. 1996 - Dez. 2001
6 JahrenMitgründer und Manager
Scopas Medien AG / FunPage
- Agenturbetrieb mitgegründet und geleitet; Produktionsplanung; Umsetzung mehrerer Kundenprojekte
- Software- und Multimedia-Entwicklung
Zusammenfassung
Berater und Ingenieur mit über 20 Jahren Erfahrung in Data Engineering, KI/LLM-Integration und Cloud-Architekturen. Spezialisierung auf skalierbare Datenpipelines, Wissensgraphen und Retrieval-Augmented Generation (RAG). Umfassende Erfahrung in NLP/LLM-Entwicklung, Ontologie-Integration, semantischer Anreicherung und Graph-Algorithmen. Nachweisbare Erfolge in der Automobilbranche, im Finanzwesen, in der Telekom, im öffentlichen Sektor und in der Strafverfolgung.
Fähigkeiten
- Daten-engineering: Aws (Glue, Athena, S3, Lambda, Redshift, Sagemaker, Amplify), Databricks, Ci/cd (Gitlab Ci/cd, Jenkins), Python, Pyspark
- Ki & Llms: Llms (Openai, Mistral, Gemini, Claude, Amazon Nova), Rag-architekturen, Embeddings, Vektordatenbanken (Neo4j, Qdrant), Ontologie-integration (Esco), Nlp (Spacy, Nltk), Generative Ki
- Graph-analytik: Wissensgraph-modellierung, Graph-algorithmen (Community Detection, Triangle Count, Louvain), Graph-reasoning, Semantische Anreicherung, Graphql
- Finanz- & Controlling-expertise: Ifrs/hgb-rechnungslegung, Controlling, Treasury, Cash Management, Risikocontrolling, Finanzberichterstattung
Sprachen
Deutsch
VerhandlungssicherEnglisch
VerhandlungssicherAusbildung
Okt. 1992 - Juni 1997
Hochschule Furtwangen
Diplom in Wirtschaftsinformatik (FH) · Wirtschaftsinformatik · Furtwangen, Deutschland
Okt. 1988 - Juni 1991
Werner-Heisenberg-Schule
Abitur (deutsche A-Levels) · Rüsselsheim, Deutschland
Sie suchen Freelancer?Passende Kandidaten in Sekunden!
FRATCH GPT testenWeitere Aktionen
Ähnliche Freelancer
Entdecken Sie andere Experten mit ähnlichen Qualifikationen und Erfahrungen.