Projektdetail

Empfohlene Projekte

Frontend developer to HR platform with Angular experience

Reach out to us if you are interested in working with us on the project.

Registriere dich um Zugang zu weiteren spannenden Projekten zu erhalten, die deinen Fähigkeiten und Vorlieben entsprechen!

KI-Agenten-Bewertungsanalyst

Melde dich an, um die Anzahl der Bewerber zu sehen

Industrie

Informationstechnologie (IT)

Bereichen

Forschung und Entwicklung (F&E)

Produktentwicklung

Qualitätssicherung

Dauer
29.12.2025 - 25.02.2026
Auslastung
Ab 5%
Tagessatz
120 - 360€
Sprache
- Englisch
  (Verhandlungssicher)
Remoteanteil
Ab 95%

Für ein KI-Labor suchen wir einen KI-Agenten-Bewertungsanalysten, um ein KI-Modell (Large Language Model – LLM) zu trainieren.

Du hilfst der KI, die Welt zu verstehen. Als Berater wirst du möglicherweise eingeladen, an Online-Projekten teilzunehmen, um das Modell in deinem Fachgebiet zu trainieren.

Diese flexible Rolle eignet sich sowohl für Experten, die eine Teilzeit-Bindung (mindestens ein paar Stunden pro Woche) suchen, als auch für diejenigen, die an Vollzeitmöglichkeiten interessiert sind

Überprüfung von Evaluierungsaufgaben und Szenarien auf Logik, Vollständigkeit und Realismus.
Identifizieren von Inkonsistenzen, fehlenden Annahmen oder unklaren Entscheidungspunkten.
Mithilfe bei der Definition klarer erwarteter Verhaltensweisen (Goldstandards) für KI-Agenten.
Annotieren von Ursache-Wirkungs-Beziehungen, Denkpfaden und plausiblen Alternativen.
Durchdenken komplexer Systeme und Richtlinien aus menschlicher Sicht, um sicherzustellen, dass Agenten richtig getestet werden.
Enge Zusammenarbeit mit QA, Autoren oder Entwicklern, um Verbesserungen oder Abdeckung von Randfällen vorzuschlagen.

Hervorragende analytische Fähigkeiten: Kann über komplexe Systeme, Szenarien und logische Implikationen nachdenken.
Starke Detailgenauigkeit: Erkennt Widersprüche, Unklarheiten und vage Anforderungen.
Vertrautheit mit strukturierten Datenformaten: Kann JSON/YAML lesen, muss sie nicht unbedingt schreiben.
Ganzheitliche Bewertung von Szenarien: Was fehlt, was ist unrealistisch, was könnte schiefgehen?
Erfahrung in der Politikbewertung, Logikrätseln, Fallstudien oder dem Design strukturierter Szenarien.
Hintergrund in Beratung, Wissenschaft, Olympiaden (z. B. Logik/Mathematik/Informatik) oder Forschung.
Erfahrung mit LLMs, Prompt-Engineering oder KI-generierten Inhalten.
Vertrautheit mit QA- oder Testfall-Denken (Randfälle, Fehlerfälle, „was könnte schiefgehen“).

Bewerbungsprozess:

Wenn du ausgewählt wirst, wirst du von Mindrift zu einem Interview eingeladen.

Projektdetail

KI-Agenten-Bewertungsanalyst

KI-Evaluationsberater (m/w/d)

Freiberuflicher Kfz-Ingenieur (mit Python) - Qualitätssicherung / KI-Trainer

Freiberufliche Chemie-Expert*in für KI-Modell-Training (m/w/d)

KI-Berater - Machine Learning (m/w/d)

Freiberuflicher Maschinenbauingenieur mit Python-Erfahrung (m/w/d)

Freiberuflicher Ruby-Entwickler (m/w/d)

KI-Agent Evaluationsanalyst (m/w/d)

Freiberufliche Biologie-Expertin/-Experte für KI-Modelltraining (w/m/d)

Freiberuflicher Statistikexperte mit Python-Erfahrung (m/w/d)

Business Analyst – SAP S/4HANA Output Management (m/w/d)

Freiberuflicher Elektroingenieur mit Python-Erfahrung (m/w/d)

Mathematiker mit Python-Erfahrung (m/w/d)

Freiberuflicher KI-Trainer – Writers (Englisch) (m/w/d)

Freiberuflicher Bauingenieur mit Python-Erfahrung (m/w/d)

Physiker mit Python-Erfahrung (m/w/d)

Senior Projektmanager Kundeninteraktion

Freiberuflicher Java-Entwickler (m/w/d)

Zahnarzt für das Training von KI-Modellen (m/w/d)

Freiberuflicher Physik-Experte (mit Python) - Qualitätssicherung / KI-Trainer

KI Consultants - Data Science (m/w/d)

Freiberuflicher Cybersecurity-Berater für KI-Red-Teaming

ERP-Transformation Manager (m/w/d)

Produktmanager POS / Kassensysteme (m/w/d)

Experte für den Aufbau eines Call Centers

Biologe mit Python-Erfahrung (m/w/d)

Experte für ethische KI (m/f/d)

KI-Berater für Vibe Coding (m/w/d)

Entwickler für Consent Management Implementierung (m/w/d)

Projektleiter Zeitschriften / Magazinerstellung (m/w/d)

Cyber Risk Consulting (Senior Level)

Frontend developer to HR platform with Angular experience