Projektdetail
Empfohlene Projekte
KI-Evaluationsberater (m/w/d)
Autor für Evaluierungsszenarien (m/w/d)
Freiberuflicher Fahrzeugingenieur (mit Python) - Qualitätssicherung / KI-Trainer
Freiberuflicher Maschinenbauingenieur mit Python-Erfahrung (m/w/d)
KI-Berater - Machine Learning (m/w/d)
Freiberuflicher Product Manager für Android-App (m/w/d)
Freiberuflicher Product Owner für Point-of-Sale-App
Senior Projektmanager Kundeninteraktion
KI-Berater - Data Science (m/w/d)
Freiberuflicher Cybersicherheitsberater für AI Red Teaming
ERP-Transformation Manager (m/w/d)
Infor AS Consultant (m/w/d)
Commissioning- und Qualifizierungsingenieur (m/w/d)
IT-Projektmanager ISO 27001 – Lückenbeseitigung (m/w/d)
Entwickler für Consent Management Implementierung (m/w/d)
Cyber Risk Consulting (Senior Level)
KI-Berater für Vibe Coding (m/w/d)
Projektleiter Zeitschriften / Magazinerstellung (m/w/d)
IT Projektleiter ServiceNow (Senior)
Java IT-Architekt (m/w/d)
EHS-Spezialist – Anlagen (m/w/d)
HSE Specialist – Cell Manufacturing
Beratung im Bereich Tax Strategy
Sicherheits- und Gesundheitsschutzkoordinator (SiGeKo) und Sicherheitsfachkraft (SiFa) (m/w/d)
Managementberater (Senior) (m/w/d)
Leittechniker / Leittechnik-Spezialist (m/w/d)
Entwicklung TM1 Planning Analytics Und Schnittstellen (m/w/d)
Cyber Security Consultant – Product Security & Regulatory Compliance (m/w/d)
Senior Cloud Developer Typesript (m/w/d)
Data Engineer (m/w/d)
Frontend developer to HR platform with Angular experience
Die Zeit ist abgelaufen! Wir akzeptieren keine Bewerbungen mehr.
KI-Agent-Bewertungsanalyst
Projekt Info
- Dauer19.01.2026 - 18.03.2026
- AuslastungAb 5%
- Tagessatz120 - 360€
- Sprache
- Englisch(Verhandlungssicher)
- Englisch
- RemoteanteilAb 95%
Beschreibung
Für ein KI-Labor suchen wir einen KI-Agent-Bewertungsanalysten, um ein KI-Modell (Large Language Model - LLM) zu trainieren.
Du hilfst der KI, die Welt zu verstehen. Als Berater wirst du möglicherweise zu Online-Projekten eingeladen, um das Modell in deinem Fachgebiet zu schulen.
Diese flexible Rolle eignet sich sowohl für Experten, die eine Teilzeitbeschäftigung (mindestens ein paar Stunden pro Woche) suchen, als auch für Interessierte an Vollzeitmöglichkeiten
- Überprüfung von Bewertungsszenarien und -aufgaben auf Logik, Vollständigkeit und Realitätsnähe.
- Erkennen von Widersprüchen, fehlenden Annahmen oder unklaren Entscheidungs- punkten.
- Mitwirkung bei der Definition klarer erwarteter Verhaltensweisen (Goldstandards) für KI-Agenten.
- Kennzeichnung von Ursache-Wirkungs-Beziehungen, Denkmustern und plausiblen Alternativen.
- Gedankliche Durchdringung komplexer Systeme und Richtlinien aus menschlicher Perspektive, um eine angemessene Prüfung der Agenten sicherzustellen.
- Enge Zusammenarbeit mit QA, Autoren oder Entwicklern zur Verbesserung oder zum Abdecken von Randfällen.
Anforderungen
- Hervorragende analytische Fähigkeiten: Du kannst komplexe Systeme, Szenarien und logische Zusammenhänge durchdenken.
- Starke Aufmerksamkeit fürs Detail: Du erkennst Widersprüche, Mehrdeutigkeiten und unklare Vorgaben.
- Vertrautheit mit strukturierten Datenformaten: Du kannst JSON/YAML lesen, nicht unbedingt schreiben.
- Ganzheitliche Szenario-Bewertung: Was fehlt, was ist unrealistisch, was könnte schiefgehen?
- Erfahrung mit Richtlinienprüfungen, Logikrätseln, Fallstudien oder strukturiertem Szenariodesign.
- Hintergrund in Beratung, Wissenschaft, Olympiaden (z.B. Logik/Mathematik/Informatik) oder Forschung.
- Erfahrung mit LLMs, Prompt-Engineering oder KI-generierten Inhalten.
- Vertrautheit mit QA- und Testfalldenken (Randfälle, Fehlerfälle, „was könnte schiefgehen“).
Bewerbungsprozess:
- Wenn du ausgewählt wirst, erhältst du eine Einladung zum Interview von Mindrift.