Projektdetail
Empfohlene Projekte
KI-Evaluierungsberater (m/w/d)
Autor für Evaluierungsszenarien (m/w/d)
Vibe Coding Web Scraping Experte (m/w/d)
Freiberuflicher Automobilingenieur (mit Python) - Qualitätssicherung / KI-Trainer
Area-Produktmanager (m/w/d)
Freiberuflicher Elektroingenieur mit Python-Erfahrung (m/w/d)
Freiberuflicher Maschinenbauingenieur mit Python-Erfahrung (m/w/d)
Senior Projektmanager Customer Interaction
KI-Berater - Machine Learning (m/w/d)
ERP-Transformation Manager (m/w/d)
Freelance Product Owner für Point Of Sale App
Auditor – FSC® und PEFC Chain of Custody (m/w/d)
Projektleitung (Schwerpunkt Projektsteuerung) (m/w/d)
Auditor für soziale Compliance (m/w/d)
Senior Regulatory Compliance Expert (FDA-Inspektionsvorbereitung) (m/w/d)
KI-Berater - Data Science (m/w/d)
Qualitäts-Compliance-Auditor (GCP/GCLP/GVP) (m/w/d)
Entwicklung TM1 Planning Analytics Und Schnittstellen (m/w/d)
Experte für Prozessautomatisierung in Kanzleiumgebungen (m/w/d)
IT-Projekt Manager ISO 27.001 - Gap Closure (m/w/d)
Inbetriebnahme- und Qualifizierungsingenieur (C&Q) (m/w/d)
ISO 20121 Auditor (w/m/d)
Data Engineer (m/w/d)
Managementberater (Senior Level) (m/w/d)
Interim Leiter Rechnungswesen / Head Of (m/w/d)
Beratung im Bereich Tax Strategy
Cyber Security Consultant – Product Security & Regulatory Compliance (m/w/d)
Java IT-Architekt (m/w/d)
Sicherheits- und Gesundheitsschutzkoordinator (SiGeKo) und Sicherheitsfachkraft (SiFa) (m/w/d)
Bilanzbuchhalter (m/w/d)
Frontend developer to HR platform with Angular experience
Die Zeit ist abgelaufen! Wir akzeptieren keine Bewerbungen mehr.
KI-Agenten-Bewertungsanalyst (m/w/d)
Projekt Info
- Dauer19.01.2026 - 16.05.2026
- AuslastungAb 95%
- Tagessatz200 - 320€
- StandortAmsterdam, Niederlande
- SprachenWichtig:
- Deutsch(Verhandlungssicher)
Wünschenswert:- Englisch(Verhandlungssicher)
- Deutsch
- RemoteanteilAb 95%
Beschreibung
Wir suchen einen freiberuflichen Agenten-Bewertungsanalysten, der die Verantwortung für Qualität, Struktur und Erkenntnisse im gesamten Projekt übernimmt. Diese Rolle geht weit über das reine Kontrollieren von Aufgaben hinaus – es geht um kritisches Denken, systemübergreifende Analyse und darum, Klarheit, Zuverlässigkeit und Konsistenz im großen Maßstab sicherzustellen. Du arbeitest sowohl als praktischer Evaluator als auch als Analyst und kooperierst mit Fachexperten, Delivery Managern und Ingenieuren. Über das Überprüfen von Ergebnissen hinaus sollst du das „Warum“ hinter der Arbeit verstehen, logische Lücken oder Widersprüche erkennen und sinnvolle Verbesserungen vorschlagen.
Dies ist eine flexible, wirkungsorientierte Rolle, in der du Raum zum Wachsen, Ideen einbringen und die Skalierung von Bewertung und Qualität im Projekt mitgestalten kannst.
Diese Rolle ist besonders geeignet für:
- Analysten, Forscher oder Berater mit starken Strukturierungs- und Argumentationsfähigkeiten
- Junior-Produktmanager oder Strategen, die sich für KI und Bewertungsarbeit interessieren
- clevere Problemlöser (Studierende oder Berufseinsteiger), die gern in Logik, Systeme und Randfälle eintauchen
Du brauchst keinen Programmierhintergrund. Was zählt, sind Neugier, geistige Genauigkeit und die Fähigkeit, komplexe Abläufe präzise zu bewerten.
Was du tun wirst
- Vollständige Verantwortung für die QA-Pipeline bei Agenten-Bewertungsaufgaben übernehmen
- Aufgaben und Golden Paths, die von Szenario-Autoren und Experten erstellt wurden, prüfen und validieren
- Logische Inkonsistenzen, vage Anforderungen, versteckte Risiken und unrealistische Annahmen aufdecken
- Strukturiertes Feedback geben und Qualitätsabgleich zwischen den Mitwirkenden sicherstellen; neue QA-Teammitglieder schulen und betreuen
- Mit Fachexperten, Delivery Managern und Ingenieuren zusammenarbeiten, um Testklarheit und -abdeckung zu verbessern
- QA-Checklisten, SOPs und Prüfungsrichtlinien pflegen und weiterentwickeln
- Zur Testplanung, Priorisierung und Qualitätstandards beitragen
- Eigeninitiativ neue Ansätze, Tools und Prozesse vorschlagen, um Validierung und Analyse zu skalieren.
Anforderungen
Was du mitbringen solltest / können musst
- Ausgeprägte analytische und kritische Denkfähigkeiten
- Detailgenauigkeit und Zuverlässigkeit – deine Arbeit kann ohne Nachprüfung vertraut werden
- Erfahrung in manueller QA, Szenariovalidierung oder ähnlicher analytischer Arbeit
- Sicherer Umgang mit strukturierten Formaten (JSON/YAML)
- Klare schriftliche Kommunikations- und Dokumentationsfähigkeiten
- Fähigkeit, konstruktives Feedback zu geben und andere anzuleiten
- Fähigkeit, mit unterschiedlichsten Stakeholdern zu arbeiten: von Ingenieuren bis zu Direktoren/VPs
Nice to have
- Hintergrund in szenariobasiertem Testen, Testdesign oder Annotierungs-Workflows
- Erfahrung mit KI-/LLM-Bewertung, Prompt-Validierung oder Agentenverhaltens-Tests
- Technische Unabhängigkeit (z.B. Python-Kenntnisse)
- Vertrautheit mit MCP-/Tool-basierten Aufgabenausführungen
- Erfahrung in funktionsübergreifenden Teams aus Produkt, Delivery und Engineering
Wer du bist
- Detailverliebt, siehst aber auch das große Ganze
- Proaktiv, unabhängig und übernimmst wirklich Verantwortung für deine Arbeit
- Starker Kommunikatorin, der/die komplexe Erkenntnisse in umsetzbare Insights übersetzt
- Flexibel und motiviert, in verschiedenen Aufgaben und Projekten mitzuwirken
- Überzeugt davon, dass Qualität nicht nur Kontrollieren bedeutet, sondern das ganze Produkt besser macht.