Projektdetail

Empfohlene Projekte

Frontend developer to HR platform with Angular experience

Reach out to us if you are interested in working with us on the project.

Registriere dich um Zugang zu weiteren spannenden Projekten zu erhalten, die deinen Fähigkeiten und Vorlieben entsprechen!

Analyst für KI-Agentenbewertung

Melde dich an, um die Anzahl der Bewerber zu sehen

Industrie

Informationstechnologie (IT)

Bereichen

Forschung und Entwicklung (F&E)

Produktentwicklung

Qualitätssicherung

Dauer
22.12.2025 - 18.02.2026
Auslastung
Ab 5%
Tagessatz
120 - 360€
Sprache
- Englisch
  (Verhandlungssicher)
Remoteanteil
Ab 95%

Für ein KI-Labor suchen wir einen Analysten für die Bewertung von KI-Agenten, um ein KI-Modell (Large Language Model – LLM) zu trainieren.

Du hilfst der KI, die Welt zu verstehen. Als Berater:in wirst du möglicherweise eingeladen, an Online-Projekten teilzunehmen, um das Modell in deinem Fachgebiet zu trainieren.

Diese flexible Rolle richtet sich sowohl an Expert:innen, die eine Teilzeittätigkeit (mindestens ein paar Stunden pro Woche) suchen, als auch an alle, die an Vollzeiteinsätzen interessiert sind

Überprüfung von Bewertungsaufgaben und Szenarien auf Logik, Vollständigkeit und Realismus.
Erkennung von Widersprüchen, fehlenden Annahmen oder unklaren Entscheidungspunkten.
Hilfe bei der Definition klarer erwarteter Verhaltensweisen (Goldstandards) für KI-Agenten.
Annotationen von Ursache-Wirkungs-Beziehungen, Denkwegen und plausiblen Alternativen.
Durchdenken komplexer Systeme und Richtlinien wie ein Mensch, um eine angemessene Prüfung der Agenten sicherzustellen.
Enge Zusammenarbeit mit QA, Autor:innen oder Entwicklern, um Verfeinerungen oder Randfälle vorzuschlagen.

Ausgeprägtes analytisches Denken: Kann komplexe Systeme, Szenarien und logische Folgerungen durchdringen.
Hohe Detailgenauigkeit: Erkennt Widersprüche, Mehrdeutigkeiten und vage Anforderungen.
Vertrautheit mit strukturierten Datenformaten: Kann JSON/YAML lesen, nicht zwingend selbst schreiben.
Ganzheitliche Szenario-Bewertung: Was fehlt, was ist unrealistisch, was könnte problematisch sein?
Erfahrung mit Policy-Evaluierung, Logikrätseln, Fallstudien oder dem Entwurf strukturierter Szenarien.
Hintergrund in Beratung, Wissenschaft, Wettbewerben (z.B. Logik/Mathematik/Informatik) oder Forschung.
Erfahrung mit LLMs, Prompt-Engineering oder KI-generierten Inhalten.
Vertrautheit mit QA- und Testfalldenken (Randfälle, Fehlermodi, "was könnte schiefgehen").

Bewerbungsprozess:

Wenn du ausgewählt wirst, laden wir dich zu einem Interview bei Mindrift ein.

Nicht verfügbar? Hier Freelancer empfehlen & 30% Provision erhalten!

Projektdetail

Empfohlene Projekte