AI-Agent-Evaluationsanalyst (m/w/d)

Melde dich an, um die Anzahl der Bewerber zu sehen

Industrie

Informationstechnologie (IT)

Bereich

Qualitätssicherung

Dauer
15.12.2025 - 11.04.2026
Auslastung
Ab 95%
Tagessatz
200 - 320€
Standort
Amsterdam, Niederlande
Sprachen
Wichtig:
- Deutsch
  (Verhandlungssicher)
Wünschenswert:
- Englisch
  (Verhandlungssicher)
Remoteanteil
Ab 95%

Wir suchen einen freiberuflichen Agent-Evaluationsanalysten, der die Verantwortung für Qualität, Struktur und Erkenntnisse im gesamten Projekt übernimmt. Diese Rolle geht weit über reine Aufgabenprüfung hinaus – es geht um kritisches Denken, Systemanalyse und die Gewährleistung von Klarheit, Zuverlässigkeit und Konsistenz in großem Maßstab. Du arbeitest sowohl als praktischer Evaluator als auch als Analyst und kooperierst mit Fachexperten, Delivery Managern und Ingenieuren. Neben der Überprüfung der Ergebnisse sollst du das „Warum“ hinter der Arbeit verstehen, logische Lücken oder Inkonsistenzen aufdecken und sinnvolle Verbesserungen vorschlagen.

Dies ist eine flexible, wirkungsorientierte Rolle, bei der du Raum hast, dich weiterzuentwickeln, Ideen einzubringen und mitzugestalten, wie Evaluation und Qualität im Projekt skaliert werden.

Diese Rolle eignet sich besonders für:

Analysten, Forscher oder Berater mit starken Strukturierungs- und Argumentationsfähigkeiten
Junior-Produktmanager oder Strategen, die sich für KI und Evaluationsarbeit interessieren
Clevere Problemlöser (Studierende oder Berufseinsteiger), die gerne in Logik, Systeme und Grenzfälle eintauchen

Du benötigst keinen Programmierhintergrund. Entscheidender sind Neugier, intellektuelle Genauigkeit und die Fähigkeit, komplexe Strukturen präzise zu bewerten.

Was du tun wirst

Volle Verantwortung für den QA-Prozess bei den Agent-Evaluationsaufgaben übernehmen
Aufgaben und Golden Paths, die von Szenario-Autoren und Experten erstellt wurden, prüfen und validieren
Logische Inkonsistenzen, unklare Anforderungen, versteckte Risiken und unrealistische Annahmen erkennen
Strukturiertes Feedback geben und Qualitätsabstimmung unter den Mitwirkenden sicherstellen
Neue QA-Teammitglieder schulen, einarbeiten und coachen
Mit Fachexperten, Delivery Managern und Ingenieuren zusammenarbeiten, um Testklarheit und -abdeckung zu verbessern
QA-Checklisten, SOPs und Review-Richtlinien pflegen und optimieren
Zur Testplanung, Priorisierung und Festlegung von Qualitätsmaßstäben beitragen
Eigeninitiative zeigen, neue Ansätze, Tools und Prozesse vorschlagen, die Validierung und Analyse skalierbar machen

Was du wissen/kennen solltest

Starke analytische und kritische Denkfähigkeiten
Hohe Detailgenauigkeit und Zuverlässigkeit – deine Arbeit kann ohne Nachprüfung vertraut werden
Erfahrung in manueller QA, Szenarioprüfung oder ähnlicher analytischer Arbeit
Sicherer Umgang mit strukturierten Formaten (JSON/YAML)
Klare schriftliche Kommunikation und Dokumentationsfähigkeiten
Fähigkeit, konstruktives Feedback zu geben und andere anzuleiten
Kompetenz im Umgang mit verschiedenen Stakeholdern: von Ingenieuren bis hin zu Direktoren/VPs

Nice to have

Hintergrund in szenariobasierter Testung, Testdesign oder Annotation-Workflows
Erfahrung mit KI-/LLM-Evaluation, Prompt-Validierung oder Agentenverhaltens-Tests
Technische Unabhängigkeit (z. B. Python-Kenntnisse)
Vertrautheit mit MCP-/Tool-basierten Aufgaben
Erfahrung in funktionsübergreifenden Teams aus Produkt, Delivery und Engineering

Wer du bist

Detailverliebt, aber auch in der Lage, das große Ganze zu sehen
Proaktiv, eigenständig und übernimmst echte Verantwortung für deine Arbeit
Starker Kommunikatorin, der/die komplexe Erkenntnisse in umsetzbare Insights verwandelt
Flexibel und motiviert, bei verschiedenen Aufgaben und Projekten mitzuarbeiten
Glaubst, dass Qualität mehr ist als nur Kontrolle – sie macht das gesamte Produkt besser.

Nicht verfügbar? Hier Freelancer empfehlen & 30% Provision erhalten!

Projektdetail

Empfohlene Projekte

AI-Agent-Evaluationsanalyst (m/w/d)

KI-Agent-Evaluationsanalyst

KI-Bewertungsberater (m/w/d)

Freelance KI-Berater (Japanisch) (m/w/d)

Freelance AI Consultant (German) (m/w/d)

Freiberuflicher Berater - KI-Schulung (portugiesischsprachig)

Freiberuflicher KI-Berater (Koreanisch) (m/w/d)

Business Analyst – SAP S/4HANA Output Management (m/w/d)

Freiberuflicher Fahrzeugingenieur (mit Python) – Qualitätssicherung / KI-Trainer

Freiberuflicher Wirtschaftsexperte – KI-Trainer

Freiberuflicher Mathematik-Experte für KI-Modell-Training (m/w/d)

Freiberuflicher Chemie-Experte für KI-Modelltraining (m/w/d)

Freiberuflicher Physikexperte für KI-Modelltraining (m/w/d)

Freelance KI-Berater (Chinesisch) (m/w/d)

Freiberufliche/r Elektroingenieur/in mit Python-Erfahrung (m/w/d)

Freiberuflicher Maschinenbauingenieur mit Python-Erfahrung (m/w/d)

Freiberuflicher Bauingenieur mit Python-Erfahrung (m/w/d)

Freelance Kotlin-Entwickler (m/w/d)

Freiberuflicher Statistikexperte mit Python-Erfahrung (m/w/d)

Freiberuflicher Rust-Entwickler (m/w/d)

Freiberuflicher Physik-Experte (mit Python) – Qualitätssicherung / KI-Trainer

Frontend developer to HR platform with Angular experience

AI-Agent-Evaluationsanalyst (m/w/d)

Projekt Info

Beschreibung

Anforderungen