Wir suchen erfahrene Data Scientists, die rechenintensive Data-Science-Aufgaben für ein fortgeschrittenes KI-Evaluationsprojekt erstellen. Dies ist eine Remote-Projekttätigkeit für Expert:innen, die herausfordernde Probleme entwerfen können, die mit rechnergestützten Methoden gelöst werden müssen und den gesamten Data-Science-Lifecycle abbilden – von Datenerfassung und -aufbereitung über statistische Analysen bis hin zu verwertbaren Geschäftserkenntnissen.
Was Sie tun werden
- Entwicklung origineller, rechenintensiver Data-Science-Aufgaben, die reale Analyse-Workflows in verschiedenen Branchen (Telekommunikation, Finanzwesen, öffentliche Verwaltung, E-Commerce, Gesundheitswesen) simulieren
- Erstellung von Aufgaben, die Python-Programmierung erfordern (mit pandas, numpy, scipy, sklearn, statsmodels, matplotlib, seaborn)
- Sicherstellen, dass die Aufgaben so rechenintensiv sind, dass sie manuell nicht innerhalb angemessener Zeiträume (Tage/Wochen) gelöst werden können
- Entwicklung von Aufgaben, die nicht-triviale Rechenketten in Datenverarbeitung, statistischer Analyse, Feature Engineering, prädiktiver Modellierung und Erkenntnisgewinnung erfordern
- Erstellung deterministischer Aufgaben mit reproduzierbaren Ergebnissen – Vermeidung stochastischer Elemente oder Festlegen fester Zufalls-Samen für exakte Reproduzierbarkeit
- Basis auf realen geschäftlichen Herausforderungen: Kundenanalytics, Risikobewertung, Betrugserkennung, Forecasting, Optimierung und operative Effizienz
- Konzeption von End-to-End-Aufgaben, die die komplette Data-Science-Pipeline abdecken (Datenaufnahme → Reinigung → EDA → Modellierung → Validierung → Deployment-Aspekte)
- Einbindung von Big-Data-Verarbeitungsszenarien, die skalierbare Rechenansätze erfordern
- Überprüfung der Lösungen mit Python unter Einsatz gängiger Data-Science-Bibliotheken und statistischer Methoden
- Klare Dokumentation der Aufgabenstellungen mit realistischen Geschäftskontexten und Bereitstellung verifizierter, korrekter Antworten