Wir suchen erfahrene Data Scientists, die rechnerisch intensive Data-Science-Aufgaben für ein fortgeschrittenes KI-Evaluationsprojekt erstellen. Dies ist eine Remote-Projektmöglichkeit für Expert*innen, die herausfordernde Aufgaben entwerfen können, die rechnerische Methoden zur Lösung erfordern und den gesamten Data-Science-Lifecycle abbilden – von Datenaufnahme und -verarbeitung bis hin zu statistischer Analyse und verwertbaren Business-Insights.
What You'll Do
- Entwerfen origineller, rechnerisch intensiver Data-Science-Aufgaben, die realistische analytische Workflows in verschiedenen Branchen (Telekommunikation, Finanzen, Verwaltung, E-Commerce, Gesundheitswesen) simulieren
- Aufgaben erstellen, die mit Python zu lösen sind (pandas, numpy, scipy, sklearn, statsmodels, matplotlib, seaborn)
- Sicherstellen, dass die Aufgaben rechnerisch intensiv sind und manuell nicht in angemessener Zeit (Tage/Wochen) gelöst werden können
- Aufgaben entwickeln, die nicht triviale reasoning chains in Datenverarbeitung, statistischer Analyse, Feature Engineering, Predictive Modeling und Insight-Extraktion erfordern
- Deterministische Aufgaben mit reproduzierbaren Antworten erstellen – zufällige Elemente vermeiden oder feste Random Seeds für exakte Reproduzierbarkeit verlangen
- Aufgaben auf realen Business-Herausforderungen basieren lassen: Customer Analytics, Risikobewertung, Betrugserkennung, Forecasting, Optimierung und operative Effizienz
- End-to-End-Aufgaben über die komplette Data-Science-Pipeline entwerfen (Datenaufbereitung → Cleaning → EDA → Modeling → Validierung → Deployment-Überlegungen)
- Szenarien für Big-Data-Verarbeitung einbeziehen, die skalierbare Rechenansätze erfordern
- Lösungen mit Python und gängigen Data-Science-Bibliotheken sowie statistischen Methoden verifizieren
- Problemstellungen klar dokumentieren mit realistischen Business-Kontexten und verifizierten, korrekten Antworten bereitstellen