Davide Imperati
Berater – Leitender Dateningenieur
Erfahrungen
Berater – Leitender Dateningenieur
Awaze
- Föderierung von Daten über drei Hauptmarken und mehrere Nebenmarken
- Ziel-Datenmodell definiert und Migration von Altsystemen zum Snowflake Data Warehouse geleitet
- Stammdatenmanagement im SaaS-Tool des Anbieters (Step von Stibo) implementiert
- Daten aus Altsystemen extrahiert, für Kompatibilität mit dem neuen Modell transformiert und unter Erhalt der Herkunft in das Data Warehouse geladen
- Frontend-Team befähigt, Daten aus dem einheitlichen System abzurufen, um Cross-Selling über Marken hinweg zu unterstützen
- Daten-Governance zentralisiert, indem Data Stewards Governance basierend auf Geschäftsbereichen durchführen konnten
- Logging, Monitoring und erweiterte aggregierte Datenvisualisierung (Basis-Analytics) über zwei Jahre unter Dual-Run-Bedingungen implementiert
Technologien: Python, Pandas, SciPy, FastAPI, Flask, Django, Git, GitHub, Jenkins, Jira, ClickMe, CI/CD, TDD, DevOps, Terraform, Docker, Snowflake, PostgreSQL, AS400, Matillion, AWS (S3, ECS, ELB, Route53, ECR), sFTP, dbt, API, Step (Stibo), Linux, Bash Scripting.
Berater – Tech Lead und Machine-Learning-Ingenieur
Many Pets (Bought By Many)
- Interne und externe Datensätze eingebunden, um Kundenservice und Marketing zu unterstützen
- Import von PureCloud-Daten automatisiert, formatiert für erweitertes Callcenter-Monitoring, was intern 15 % und bei einem Drittanbieter-Center 42 % Leistungssteigerung ermöglichte
- Import von Mention-Me-Daten für Marketing-Analytics automatisiert, manuelle Prozesse ersetzt und Zeit gespart
- Airflow eingerichtet, um Datenbankmanipulationen mit dbt und Analytics-Tools in einer containerisierten Umgebung auszuführen, die Performance zu verbessern und Abhängigkeiten zu entkoppeln
Technologien: Python, Pandas, SciPy, FastAPI, Flask, Django, Git, GitHub, Jenkins, Jira, ClickMe, CI/CD, TDD, DevOps, Terraform, Docker, Fivetran, BigQuery, Composer-Airflow, GCP, dbt, API, sFTP, New Relic.
Berater – Leiter Core Data Engineering, Solution-Architekt (Neuron-Programm)
Vodafone
- Migration der Big-Data-Plattform von Vodafone zu Google Cloud für alle europäischen Märkte geleitet, die Terabytes pro Tag verarbeiten
- Fähigkeiten des Core Data Engineering-Teams nach IR35-Auswirkungen wiederhergestellt, technische Schulden bewertet und gemindert
- Umfangsreduzierung mit Stakeholdern verhandelt, um Zeitpläne und Budget unter COVID-19-Bedingungen einzuhalten
- Migration trotz Wissensverlust und fehlender Dokumentation mit minimaler Verzögerung geliefert
Technologien: Java EE, Scala, Python, PySpark, GitHub, Jenkins, Jira, CI/CD, TDD/BDD, DevOps, Testautomatisierung, Load-/Stress-Testing, Kostenoptimierung, GCP (Dataflow, Composer, Dataproc, Cloud Storage, BigQuery, Bigtable, Spanner, Flink), Kubernetes, Docker, Terraform.
Berater – Quant Research und Solution-Architekt
Lloyds Banking Group
- Automatisierte Handelsüberwachungsplattform überarbeitet, um den Anforderungen der Prüfer zu entsprechen
- Vermittelt zwischen Stakeholdern, um Ansätze über verschiedene Assetklassen hinweg zu vereinheitlichen und sicherzustellen, dass Entwickler einheitlich arbeiten
- Templates für effiziente, standardisierte Analytics-Implementierung definiert
- Hochwertige Analytics mit NLP, Machine Learning und fortgeschrittenen quantitativen Methoden implementiert
- Audit bestanden mit deutlicher Kostenreduktion und 67 % weniger Spam-Alarme
Assetklassen: Devisen Spot/Optionen, Zinsfutures, Anleihen, Swaps, Repo, maßgeschneiderte OTC Technologien: Java EE, Python, Pandas, NLTK, SciPy, NumPy, PySpark, Dask, Kafka, Bitbucket, Jenkins, Jira, CI/CD, TDD, DevOps, SVN, Confluence.
Berater – Principal Data Scientist
News UK – The Times
- Projekt „James“ umgesetzt, eine Reinforcement-Learning-KI zur Direktmarketing-Optimierung im Rahmen eines Google-Innovationsstipendiums
- Eine teilweise implementierte Plattform bewertet, den Kern mit modernen Tools neu aufgebaut und für den Produktionseinsatz termingerecht optimiert
- Zeitdruck, unvollständige Dokumentation und fehlende vorherige Fallstudien gemeistert
- Churn-Reduktion revolutioniert und ein preisgekröntes Contact Center unterstützt
Technologien: Python, Pandas, SciPy, NumPy, TensorFlow, Django, Flask, GitHub, Jenkins, Jira, GitOps, CI/CD, DevOps, Kubernetes, Docker, Terraform, Microservices, Confluence.
Berater – leitender Datenwissenschaftler
News UK – The Times
- Entwickelte ein Online-Propensity-Modell und eine API, um die Conversion zu verbessern und die Benutzererfahrung für The Times Digital
- Implementierte Echtzeit-Vorhersagen mit über 1000 Vorhersagen/s und einer Latenz von <250ms
- Steigerte Abonnements um 5% und Cross-Sales um 9% und pilotierte den API-Einsatz mit hoher Durchsatzrate auf Kubernetes
Technologien: Python, Pandas, NLTK, SciPy, NumPy, Django, Nginx, Docker, Kubernetes, Terraform, TensorFlow, GitHub, Jenkins, Jira, CI/CD, DevOps, New Relic.
Vizepräsident für Technologie
JP Morgan Chase
- Verantwortete die Bereitstellung einer Cloud-Logging- und Monitoring-Plattform mit einem 20-köpfigen Team an drei Standorten für die AWS Public Cloud-Einführung
- Überprüfte die Architektur nach dem PoC und skalierte die Plattform, um 5TB/Tag (5 Mrd. Nachrichten, 1,3 Mrd. Spitzenlast) zu bewältigen
- Erfüllte strenge Anforderungen an Cybersicherheit, Verfügbarkeit, Disaster Recovery und SLA/SLO unter Einschränkungen genehmigter Dienste
- Ermöglichte das Monitoring von fünf geschäftskritischen Cloud-Anwendungen, indem neue Muster und eine skalierbare Architektur eingeführt wurden
Technologien: AWS (API Gateway, Route53, S3, DynamoDB, Kinesis, Elastic Beanstalk, Lambda, ELB, IAM, CloudWatch, CloudTrail), MySQL, Boto, Terraform, FluentD, Flink, Kafka, Kafka Streams, Kinesis Firehose, NiFi, Cassandra, CQL, Elasticsearch, Logstash, Kibana, Java EE, Python, Bitbucket, Jenkins, Jira, CI/CD, TDD, BDD, DevOps, Docker, Kubernetes, Datadog.
Vizepräsident für Datenarchitektur
JP Morgan Chase
- Etablierte standardisierte aufsichtsrechtliche Berichte für alle Geschäftsbereiche nach regulatorischen Änderungen
- Erstellte kontrollierte Vokabulare und automatisierte Prozesse für das Metadaten-Management
- Stellte Wörterbücher und Referenzdaten über REST-APIs in einer Microservice-Architektur bereit
- Entwickelte Tools zur Minderung aufsichtsrechtlicher Risiken und zur Gewinnung von Unternehmens-Insights
Asset-Klassen: FX Spot/Optionen, Zinsfutures, Anleihen, Swaps, Derivate, OTC Technologien: Java EE, Spring, Python, RDF, OWL, SPARQL, Semantic-Web-Standards, Ontologien, Semantic Wiki, Knowledge Graphs, Neo4j, BigQuery (Blazegraph), ISO20022, Bitbucket, Jenkins, Jira, CI/CD, TDD, BDD, DevOps, Docker.
Vizepräsident für Datenarchitektur
JP Morgan Chase
- Entwickelte Meta-Analytics für die Unternehmens- und Investmentbank, kennzeichnete und bewertete alle Datenbestände und Softwareprodukte
- Definierte Metriken zur Datenqualität und formale Ontologien für logische Datenmodelle
- Scannte Metadaten, um physische Modelle abzuleiten, und verband sie heuristisch mit manueller Verfeinerung durch Informationsarchitekten
- Steigerte die Produktivität der Informationsarchitekten um den Faktor 4,7 durch teils automatisierte Prozesse
Technologien: Java, Spring, Python, RDF, OWL, Semantic-Web-Standards, Ontologien, Knowledge Graphs, BigQuery, ISO11179, Bitbucket, Jenkins, Jira, CI/CD, TDD, DevOps.
Zusammenfassung
Der Hintergrund von Davide Imperati basiert auf zwei Jahrzehnten akademischer und unternehmerischer Erfahrung in quantitativer Forschung, Datenstrategie und groß angelegten Cloud-Migrationen. Seine technische Expertise wird durch ausgeprägte Soft Skills und ein tiefes Verständnis der Geschäftsbereiche Finanzen, Telekommunikation, Medien, Logistik und digitales Marketing ergänzt. Er arbeitet in den anfänglichen Phasen von komplett neuen, datengetriebenen Projekten (PoC – Pilot). Außerdem bringt er nachweisliche Erfahrung darin mit, leistungsschwache, datenbezogene Projekte zu überarbeiten und sie termingerecht unter Budget-, Zeit- und Ressourcenbeschränkungen abzuschließen.
Fähigkeiten
- Datenmodellierung Und Datenbankentwurf
- Datenintegration Und -Transformation
- Daten-governance Und Sicherheit
- Big-data-technologien (Z. B. Hadoop, Spark, Nosql)
- Daten-warehouse
- Cloud Computing
- Sql-programmierung
- Etl (Extrahieren, Transformieren, Laden)
- Streaming (Spark, Kafka, Flink, Kinesis)
- Business-intelligence-tools
- Analyse Und Reporting
- Datenvisualisierung
- Machine Learning Und Ki-techniken
- Statistische Analyse
- Datenqualitätsmanagement
- Datenprofilierung
- Metadatenmanagement
- Schema-design Und -Optimierung
- Kapazitätsplanung Und Performance-tuning
- Datenbankadministration
- Backup Und Recovery
- Disaster-recovery-planung
- Nosql-datenbanken (Z. B. Mongodb, Cassandra)
- Relationale Datenbanken (Z. B. Oracle, Mysql, Sql Server)
- Datenarchitektur-frameworks (Z. B. Togaf)
- Data-governance-frameworks (Z. B. Dama-dmbok)
- Agile Software-entwicklungsmethoden
- Projektmanagement
- Datenschutz Und Compliance (Z. B. Dsgvo, Ccpa)
- Datenspeicher-technologien (Z. B. San, Nas)
- Datenzugriff Und Authentifizierung
- Cloud-speicher (Z. B. S3, Azure Blob)
- Datenvirtualisierung
- Daten-föderation
- Api-design Und -Entwicklung
- Webservices
- Verteilte Systeme
- Performance-tests Und Optimierung
- Systemintegration
- Governance Der Datenarchitektur
- Datenflussanalyse
- Konzeptionelle, Logische Und Physische Datenmodelle
- Multidimensionale Datenmodellierung
- Stammdatenmanagement
- Referenzdatenmanagement
- Datenherkunft Und Rückverfolgbarkeit
- Datenmigration
- Datentransformation
- Datenanreicherung
- Datenklassifizierung Und -Kategorisierung
- Agil
- Scrum
- Kanban
- Xp
- Extreme Programming
- Ttd
- Bdd
- Zuhören
- Projektdurchführung
- Stakeholder-management
- Product Owner
- Einfluss
- Führung
- Prozessoptimierung
- Wasserfall
- Book Of Work
- Meilensteine
- Backlog
- Jira
- Trello
- Continuous Delivery
- Continuous Integration
- Jenkins
- Versionsverwaltungssysteme
- Git
- Bitbucket
- Svn
- Java
- Python
- Pandas
- Numpy
- Scikit
- Scipy
- Nltk
- Statistik
- Analytik
- Machine Learning
- Künstliche Intelligenz
- Regression
- Entscheidungsbäume
- Random Forests
- Support Vector Machines
- Tensorflow
- Neuronale Netze
- Reinforcement Learning
- Multi-armed Bandits
- Expertenberatung
- Objektorientierte Programmierung
- Oop
- Solid-prinzipien
- Cloud
- Aws
- Google Cloud
- Gcp
- Reporting
Sprachen
Ausbildung
PhD · Statistische Datenverarbeitung
MSc · Informatik
New York University
Postdoc · New York, Vereinigte Staaten
Zertifikate & Bescheinigungen
Zertifizierter AWS Cloud Practitioner
Zertifizierter PADI-Ausbilder
PADI
Zertifizierter Scrum Product Owner
Ähnliche Freelancer
Entdecken Sie andere Experten mit ähnlichen Qualifikationen und Erfahrungen.