Projektdetail

Empfohlene Projekte

Frontend developer to HR platform with Angular experience

Reach out to us if you are interested in working with us on the project.

Registriere dich um Zugang zu weiteren spannenden Projekten zu erhalten, die deinen Fähigkeiten und Vorlieben entsprechen!

KI-Agent Evaluationsanalyst (m/w/d)

Melde dich an, um die Anzahl der Bewerber zu sehen

Industrie

Informationstechnologie (IT)

Bereich

Qualitätssicherung

Dauer
29.12.2025 - 25.04.2026
Auslastung
Ab 95%
Tagessatz
200 - 320€
Standort
Amsterdam, Niederlande
Sprachen
Wichtig:
- Deutsch
  (Verhandlungssicher)
Wünschenswert:
- Englisch
  (Verhandlungssicher)
Remoteanteil
Ab 95%

Dies ist eine flexible, wirkungsorientierte Rolle, in der Sie Raum haben, zu wachsen, Ideen einzubringen und mitzuprägen, wie Evaluation und Qualität im Projekt skaliert werden.

Diese Rolle passt besonders gut zu:

Analytikern, Forschern oder Beratern mit starken Struktur- und Denkfähigkeiten Junior Produktmanagern oder Strategen, die neugierig auf KI und Evaluationsaufgaben sind Schlauen Problemlösern (Studierende oder Berufseinsteiger), die gerne in Logik, Systeme und Randfälle eintauchen

Eine Programmiererfahrung ist nicht erforderlich. Entscheidend sind Neugier, intellektuelle Strenge und die Fähigkeit, komplexe Setups präzise zu bewerten.

Was Sie tun werden

Sie übernehmen vollständig die QA-Pipeline für Agenten-Evaluierungsaufgaben;
Sie prüfen und validieren Aufgaben und Beispielabläufe, die von Szenario-Autoren und Expert:innen erstellt wurden;
Sie identifizieren logische Inkonsistenzen, vage Anforderungen, versteckte Risiken und unrealistische Annahmen;
Sie geben strukturiertes Feedback und sorgen für Qualitätsabstimmung unter den Beitragenden; Sie schulen, eingliedern und begleiten neue QA-Teammitglieder;
Sie arbeiten mit Fachexpert:innen, Delivery Managern und Ingenieuren zusammen, um Tests klarer zu machen und abzudecken;
Sie pflegen und verbessern QA-Checklisten, SOPs und Review-Richtlinien;
Sie tragen zur Testplanung, Priorisierung und Qualitätsmaßstäben bei;
Sie ergreifen die Initiative, neue Ansätze, Tools und Prozesse vorzuschlagen, die bei der Skalierung von Validation und Analyse helfen.

Was Sie mitbringen / können sollten

Starke analytische und kritische Denkfähigkeiten;
Genauigkeit und Zuverlässigkeit – Ihre Arbeit kann ohne Nachprüfung vertraut werden;
Erfahrung in manueller QA, Szenario-Validierung oder ähnlicher analytischer Arbeit;
Sicherer Umgang mit strukturierten Formaten (JSON/YAML);
Klare schriftliche Kommunikation und Dokumentationsfähigkeiten;
Fähigkeit, konstruktives Feedback zu geben und andere anzuleiten;
Fähigkeit, mit einer Vielzahl von Stakeholdern zu arbeiten: von Ingenieuren bis hin zu Direktor:innen/VPs.

Nice to have

Hintergrund in szenariobasiertem Testen, Testdesign oder Annotation Workflows;
Erfahrung mit KI/LLM-Evaluierung, Prompt-Validierung oder Agentenverhaltenstests;
Technische Eigenständigkeit (z. B. Python-Kenntnisse);
Vertrautheit mit MCP / toolbasierter Aufgabenausführung;
Erfahrung in funktionsübergreifenden Teams aus Produkt, Delivery und Engineering.

Wer Sie sind

Detailverliebt, aber auch in der Lage, das Gesamtbild zu sehen;
Proaktiv, eigenständig und übernehmen echte Verantwortung für Ihre Arbeit;
Kommunikator:in, der/die komplexe Erkenntnisse in umsetzbare Insights verwandeln kann;
Flexibel und motiviert, zu verschiedenen Aufgaben und Projekten beizutragen;
Sie glauben, dass Qualität nicht nur Arbeit prüft, sondern das gesamte Produkt verbessert.

Projektdetail

Empfohlene Projekte