Projektdetail

Empfohlene Projekte

AI-Agent-Evaluationsanalyst (m/w/d)

Wir suchen einen freiberuflichen Agent-Evaluationsanalysten, der die Verantwortung für Qualität, Struktur und Erkenntnisse im gesamten Projekt übernimmt. Diese Rolle geht weit über reine Aufgabenprüfung hinaus – es geht um kritisches Denken, Systemanalyse und die Gewährleistung von Klarheit, Zuverlässigkeit und Konsistenz in großem Maßstab. Du arbeitest sowohl als praktischer Evaluator als auch als Analyst und kooperierst mit Fachexperten, Delivery Managern und Ingenieuren. Neben der Überprüfung der Ergebnisse sollst du das „Warum“ hinter der Arbeit verstehen, logische Lücken oder Inkonsistenzen aufdecken und sinnvolle Verbesserungen vorschlagen. Dies ist eine flexible, wirkungsorientierte Rolle, bei der du Raum hast, dich weiterzuentwickeln, Ideen einzubringen und mitzugestalten, wie Evaluation und Qualität im Projekt skaliert werden. Diese Rolle eignet sich besonders für: - Analysten, Forscher oder Berater mit starken Strukturierungs- und Argumentationsfähigkeiten - Junior-Produktmanager oder Strategen, die sich für KI und Evaluationsarbeit interessieren - Clevere Problemlöser (Studierende oder Berufseinsteiger), die gerne in Logik, Systeme und Grenzfälle eintauchen Du benötigst keinen Programmierhintergrund. Entscheidender sind Neugier, intellektuelle Genauigkeit und die Fähigkeit, komplexe Strukturen präzise zu bewerten. Was du tun wirst - Volle Verantwortung für den QA-Prozess bei den Agent-Evaluationsaufgaben übernehmen - Aufgaben und Golden Paths, die von Szenario-Autoren und Experten erstellt wurden, prüfen und validieren - Logische Inkonsistenzen, unklare Anforderungen, versteckte Risiken und unrealistische Annahmen erkennen - Strukturiertes Feedback geben und Qualitätsabstimmung unter den Mitwirkenden sicherstellen - Neue QA-Teammitglieder schulen, einarbeiten und coachen - Mit Fachexperten, Delivery Managern und Ingenieuren zusammenarbeiten, um Testklarheit und -abdeckung zu verbessern - QA-Checklisten, SOPs und Review-Richtlinien pflegen und optimieren - Zur Testplanung, Priorisierung und Festlegung von Qualitätsmaßstäben beitragen - Eigeninitiative zeigen, neue Ansätze, Tools und Prozesse vorschlagen, die Validierung und Analyse skalierbar machen
AI Studio
Amsterdam, Niederlande
100% Remoteanteil

KI-Agent-Evaluationsanalyst

Für ein KI-Labor suchen wir einen KI-Agent-Evaluationsanalyst, um ein KI-Modell (Large Language Model - LLM) zu trainieren. Du hilfst der KI, die Welt zu verstehen. Als Berater könntest du eingeladen werden, an Online-Projekten teilzunehmen, um das Modell in deinem Fachgebiet zu trainieren. Diese flexible Rolle richtet sich sowohl an Experten, die eine Teilzeitbeschäftigung (mindestens ein paar Stunden pro Woche) suchen, als auch an diejenigen, die an Vollzeitmöglichkeiten interessiert sind - Überprüfung von Evaluierungsaufgaben und Szenarien auf Logik, Vollständigkeit und Realitätsnähe. - Identifikation von Inkonsistenzen, fehlenden Annahmen oder unklaren Entscheidungsstellen. - Hilfe bei der Definition klarer erwarteter Verhaltensweisen (Goldstandards) für KI-Agenten. - Annotation von Ursache-Wirkungs-Beziehungen, Denkpfaden und plausiblen Alternativen. - Durchdenken komplexer Systeme und Richtlinien wie ein Mensch, um sicherzustellen, dass Agenten richtig getestet werden. - Enge Zusammenarbeit mit QA, Autoren oder Entwicklern, um Verfeinerungen oder Abdeckung von Randfällen vorzuschlagen.
KI-Labor
100% Remoteanteil
Neu

KI-Bewertungsberater (m/w/d)

Wir suchen einen analytischen und technisch versierten Experten, um: - KI-Ergebnisse und -Prozesse zu bewerten - Qualität, Genauigkeit und Zuverlässigkeit sicherzustellen - Logische Fehler, Risiken und strukturelle Inkonsistenzen zu erkennen - Dem Team umsetzbare Erkenntnisse und Empfehlungen zu liefern Ideale Kandidat:innen: - Consultants, Wirtschaftsprüfer:innen, Analyst:innen, Datenforscher:innen oder Business-/Technical-Analyst:innen mit starken logischen Fähigkeiten - Fachleute, die neugierig auf KI, Prozessverbesserung und Qualitätsbewertung sind - Problemlöser:innen, die es lieben, komplexe Systeme, Logik und Szenarien zu analysieren Hauptaufgaben: - Leitung der Bewertung von KI-Ergebnissen und zugehörigen Prozessen - Überprüfung von Aufgaben im Vergleich zu erwarteten/idealen Szenarien; Identifikation von Lücken und Risiken - Bereitstellung strukturierter, umsetzbarer Empfehlungen für Entwickler, Fachexpert:innen und Manager:innen - Pflege und Verbesserung von Bewertungsrichtlinien, Checklisten und SOPs - Vorschlag neuer Ansätze, Tools und Prozesse zur Optimierung der KI-Bewertung
AI Labs
100% Remoteanteil

Freelance KI-Berater (Japanisch) (m/w/d)

Für unseren Kunden suchen wir einen Japanisch sprechenden KI-Berater: Als Berater wirst du möglicherweise zu Online-Projekten eingeladen, um das Modell in deinem Fachbereich zu trainieren. Diese flexible Rolle richtet sich sowohl an Experten, die eine Teilzeittätigkeit (mindestens ein paar Stunden/Woche) suchen, als auch an diejenigen, die an Vollzeitmöglichkeiten interessiert sind. Aufgaben: - Sorgfältige Prüfung der bereitgestellten Daten (Text, Bilder oder Videos). - Überprüfung der vom Entwicklerteam eingereichten Aufgaben und Sicherstellung der Qualitätssicherung bzw. -kontrolle. - Kennzeichnung oder Klassifizierung von Inhalten gemäß den Projektvorgaben. - Erkennen und Markieren von faktisch falschem, sensiblen, unangemessenem oder unklarem Material.
AI Studio
100% Remoteanteil

Freelance AI Consultant (German) (m/w/d)

Für unseren Kunden suchen wir einen deutschsprachigen KI-Berater: Als Berater*in könntest du eingeladen werden, an Online-Projekten teilzunehmen, um das Modell in deinem Fachgebiet zu trainieren. Diese flexible Rolle richtet sich sowohl an Expert*innen, die eine Teilzeittätigkeit (mindestens wenige Stunden/Woche) suchen, als auch an alle, die an einer Vollzeitstelle interessiert sind. Aufgaben: - Sorgfältige Überprüfung der bereitgestellten Daten (Text, Bilder oder Videos). - Prüfung von Aufgaben, die vom Entwicklerteam eingereicht wurden, und Sicherstellung der Qualitätssicherung/-kontrolle. - Kennzeichnung oder Klassifizierung von Inhalten gemäß den Projektvorgaben. - Identifikation und Markierung von sachlich falschem, sensiblen, unangemessenen oder unklaren Material.
AI Studio
100% Remoteanteil

Freiberuflicher Berater - KI-Schulung (portugiesischsprachig)

Für ein KI-Labor suchen wir portugiesischsprachige freiberufliche Berater, um ein KI-Modell (Large Language Model – LLM) in verschiedenen Bereichen zu trainieren: Du hilfst der KI, die Welt zu verstehen. Als Berater wirst du möglicherweise in Online-Projekten eingeladen, das Modell in deinem Fachgebiet zu trainieren. Diese flexible Rolle richtet sich sowohl an Expert:innen, die eine Teilzeitbeschäftigung (mindestens ein paar Stunden pro Woche) anstreben, als auch an diejenigen, die an Vollzeitchancen interessiert sind Verantwortlichkeiten: - Analysiere sorgfältig die vom KI bereitgestellten Daten in deinem Fachgebiet. - Verbessere das Modell in deinem Fachgebiet. - Überprüfe KI-Ergebnisse und stelle Qualitätssicherung/Qualitätskontrolle sicher. - Kennzeichne oder klassifiziere Inhalte gemäß den Projektvorgaben.
AI Lab
100% Remoteanteil

Freiberuflicher KI-Berater (Koreanisch) (m/w/d)

Für unseren Kunden suchen wir einen Koreanisch sprechenden KI-Berater: Als Berater wirst du möglicherweise eingeladen, an Online-Projekten teilzunehmen, um das Modell in deinem Fachgebiet zu trainieren. Diese flexible Rolle richtet sich sowohl an Experten, die eine Teilzeittätigkeit suchen (mindestens ein paar Stunden pro Woche), als auch an Interessierte für Vollzeitmöglichkeiten. Aufgaben: - Sorgfältige Überprüfung der bereitgestellten Daten (Text, Bilder oder Videos). - Durchsicht der Aufgaben des Entwicklerteams und Sicherstellung der Qualitätssicherung/Qualitätskontrolle. - Kennzeichnung oder Klassifizierung von Inhalten gemäß den Projektleitlinien. - Erkennung und Markierung von sachlich falschem, sensiblen, unangemessenen oder unklarem Material.
AI Studio
100% Remoteanteil
Neu

Business Analyst – SAP S/4HANA Output Management (m/w/d)

- Ein Unternehmen sucht einen erfahrenen Business Analysten, der die Transformation von SAP ECC zu S/4HANA Utilities unterstützt. - Ziel des Projekts ist die Analyse, Dokumentation und Optimierung von Output- und Archivierungsprozessen sowie die Erstellung von Fachkonzepten und Spezifikationen. - Der Analyst wird eng mit Product Ownern, IT und Fachbereichen zusammenarbeiten, um die Machbarkeit, den Aufwand und die Priorisierung von Anforderungen abzustimmen.
Energie
München, Deutschland
100% Remoteanteil

Freiberuflicher Fahrzeugingenieur (mit Python) – Qualitätssicherung / KI-Trainer

Generative KI-Modelle verbessern sich sehr schnell, und eines unserer Ziele ist es, sie in die Lage zu versetzen, spezielle Fragen zu beantworten und komplexe Denkfähigkeiten zu erreichen. Obwohl jedes Projekt einzigartig ist, könntest du typischerweise: - Inhaltserstellung & Verfeinerung: Inhalte erstellen und verfeinern, um Genauigkeit und Relevanz für verschiedene Themen in der Physik sicherzustellen, und dabei Referenzen und Beispielaufgaben entwickeln. - Expertengewinnung: Qualifikationstests von Experten bewerten und ihre Kompetenz sicherstellen. - Chat-Moderation: Unterstützung bieten, indem du projektbezogene Fragen anderer Experten in Discord-Chats beantwortest, besonders zu Projekt-Richtlinien. - Arbeit prüfen: Aufgaben anderer Experten überprüfen und bewerten, um sicherzustellen, dass sie den Projekt-Richtlinien entsprechen. Konstruktives Feedback geben, fachbezogene Informationen überprüfen und Inhalte bei Bedarf bearbeiten, um die Qualität zu verbessern.
AI Studio
100% Remoteanteil
Neu

Freiberuflicher Wirtschaftsexperte – KI-Trainer

Für ein KI-Labor suchen wir einen Wirtschaftsexperten zur Schulung eines KI-Modells GenAI-Modelle entwickeln sich sehr schnell, und eines unserer Ziele ist, sie in die Lage zu versetzen, spezialisierte Fragen zu beantworten und komplexe Denkfähigkeiten zu erreichen. Wenn du mitmachst, hast du die Möglichkeit, an diesen Projekten mitzuarbeiten. Obwohl jedes Projekt einzigartig ist, würde deine Tätigkeit typischerweise so aussehen: Du erstellst komplexe, realistische Aufgaben, die die modernsten KI-Agenten herausfordern. Denk an verstreute Daten, bedingte Abläufe und echtes Fachwissen. Du entwickelst eine detaillierte Version mit objektiver Bewertung und erstellst dann eine vage Version, mit der der Agent lernen soll, auch ohne ständige Anleitung erfolgreich zu sein. Nur echte Expertenkomplexität. Du verbesserst die KI-Tools, die du später selbst nutzen wirst. Wenn du über die nötige Erfahrung verfügst und bereit bist, dieses anspruchsvolle und spannende Projekt anzugehen, mach mit!

Freiberuflicher Mathematik-Experte für KI-Modell-Training (m/w/d)

Ein AI-Lab sucht freiberufliche Mathematik-Expert:innen zur Bewertung von KI-Modellen. Ziel des Projekts ist es, die Leistung, Genauigkeit und Zuverlässigkeit von KI-Modellen in mathematischen Anwendungen zu bewerten. Die Rolle beinhaltet eine enge Zusammenarbeit mit dem Entwicklungsteam, um sicherzustellen, dass die Modelle den Industriestandards entsprechen und umsetzbare Erkenntnisse liefern. Dies ist eine remote Teilzeitstelle, die flexibel an deine Verfügbarkeit angepasst werden kann – von nur wenigen Stunden pro Woche bis hin zu Vollzeit. Hauptaufgaben: - Bewertung von KI-Modellen für mathematische Anwendungen. - Analyse der Modelloutputs und Feedback zur Verbesserung. - Zusammenarbeit mit dem Entwicklungsteam, um die Einhaltung der Industriestandards sicherzustellen. - Dokumentation der Erkenntnisse und Empfehlungen zur Modelloptimierung. - Durchführung von Tests zur Validierung der Modellleistung und Zuverlässigkeit.
AI Lab
100% Remoteanteil

Freiberuflicher Chemie-Experte für KI-Modelltraining (m/w/d)

Ein KI-Labor sucht freiberufliche Chemie-Expert:innen, um KI-Modelle zu bewerten. Das Ziel des Projekts ist es, die Leistung, Genauigkeit und Zuverlässigkeit von in Chemie-Kontexten eingesetzten KI-Modellen zu beurteilen. Die Rolle umfasst eine enge Zusammenarbeit mit dem Entwicklungsteam, um sicherzustellen, dass die Modelle den Branchenstandards entsprechen und umsetzbare Erkenntnisse liefern. Dies ist eine Remote-Teilzeitstelle, die flexibel an deine Verfügbarkeit angepasst werden kann – von nur wenigen Stunden pro Woche bis zur Vollzeit. Wichtige Aufgaben: - Bewertung von KI-Modellen für Chemie-Anwendungen. - Analyse der Modellausgaben und Feedback zur Verbesserung. - Zusammenarbeit mit dem Entwicklungsteam zur Einhaltung der Branchenstandards. - Dokumentation von Ergebnissen und Empfehlungen zur Modelloptimierung. - Durchführung von Tests zur Validierung der Modellleistung und Zuverlässigkeit.
AI Lab
100% Remoteanteil

Freiberuflicher Physikexperte für KI-Modelltraining (m/w/d)

Ein KI-Labor sucht freiberufliche Physikexperten zur Bewertung von KI-Modellen. Ziel des Projekts ist es, die Leistung, Genauigkeit und Zuverlässigkeit von KI-Modellen in physikalischen Anwendungen zu bewerten. Die Rolle beinhaltet die enge Zusammenarbeit mit dem Entwicklungsteam, um sicherzustellen, dass die Modelle Branchenstandards erfüllen und umsetzbare Erkenntnisse liefern. Dies ist eine remote Teilzeitstelle, die flexibel an deine Verfügbarkeit angepasst werden kann – von nur wenigen Stunden pro Woche bis hin zu Vollzeit. Wichtige Aufgaben: - Bewertung von KI-Modellen für physikalische Anwendungen. - Analyse der Modellausgaben und Feedback zur Verbesserung. - Zusammenarbeit mit dem Entwicklungsteam, um die Einhaltung von Branchenstandards sicherzustellen. - Dokumentation von Ergebnissen und Empfehlungen zur Modelloptimierung. - Durchführung von Tests zur Validierung der Modellleistung und -zuverlässigkeit.
AI Lab
100% Remoteanteil

Freelance KI-Berater (Chinesisch) (m/w/d)

Für unseren Kunden suchen wir einen chinesischsprachigen KI-Berater: Als Berater/in wirst du möglicherweise zu Online-Projekten eingeladen, um das Modell in deinem Fachbereich zu trainieren. Diese flexible Rolle eignet sich sowohl für Experten, die eine Teilzeit-Beschäftigung (mindestens ein paar Stunden pro Woche) suchen, als auch für Interessierte an Vollzeitmöglichkeiten. Aufgaben: - Gezielte Durchsicht der bereitgestellten Daten (Text, Bilder oder Videos). - Prüfung der vom Entwicklerteam eingereichten Aufgaben und Sicherstellung von Qualitätssicherung und -kontrolle. - Kennzeichnung oder Klassifizierung von Inhalten gemäß Projektvorgaben. - Erkennung und Markierung von faktisch falschem, sensiblen, unangemessenen oder unklaren Material.
AI Studio
100% Remoteanteil

Freiberufliche/r Elektroingenieur/in mit Python-Erfahrung (m/w/d)

Generative KI-Modelle verbessern sich sehr schnell, und eines unserer Ziele ist, sie in die Lage zu versetzen, spezialisierte Fragen zu beantworten und komplexe Denkaufgaben zu bewältigen. Obwohl jedes Projekt einzigartig ist, könnten Sie typischerweise: - Inhaltserstellung & -verfeinerung: Inhalte erstellen und überarbeiten, um Genauigkeit und Relevanz in verschiedenen Bereichen der Physik sicherzustellen, und dabei Referenzen und Aufgabenbeispiele entwickeln. - Expertengewinnung: Qualifikationstests von Experten bewerten und ihre Kompetenz sicherstellen. - Chat-Moderation: Unterstützung bieten, indem Sie projektbezogene Fragen anderer Experten in Discord-Chats beantworten, insbesondere zu Projektleitlinien. - Arbeitsprüfung: Aufgaben anderer Experten überprüfen und bewerten, sicherstellen, dass sie mit den Projektleitlinien übereinstimmen. Konstruktives Feedback geben, fachliche Informationen prüfen und Inhalte bei Bedarf bearbeiten, um die Qualität zu verbessern.
AI Studio
100% Remoteanteil

Freiberuflicher Maschinenbauingenieur mit Python-Erfahrung (m/w/d)

Für ein KI-Labor suchen wir einen Maschinenbauingenieur mit Python-Erfahrung, um ein KI-Modell (Large Language Model - LLM) zu trainieren. GenAI-Modelle entwickeln sich sehr schnell, und eines unserer Ziele ist, sie in die Lage zu versetzen, spezialisierte Fragen zu beantworten und komplexe Denkaufgaben zu meistern. Wenn du mitarbeitest, hast du die Möglichkeit, an diesen Projekten mitzuwirken. Auch wenn jedes Projekt einzigartig ist, könntest du typischerweise: - Inhaltserstellung & -verfeinerung: Inhalte erstellen und verfeinern, um Genauigkeit und Relevanz in verschiedenen Bereichen des Maschinenbaus sicherzustellen, und dabei Referenzen und Beispiele für Aufgaben entwickeln. - Expertengewinnung: Qualifikationstests von Experten bewerten und ihre Kompetenzen sicherstellen. - Chat-Moderation: Unterstützung bieten, indem du projektbezogene Fragen anderer Experten in Discord-Chats beantwortest, insbesondere zu den Projekt-Richtlinien. - Überprüfung der Arbeit: Aufgaben anderer Experten überprüfen und bewerten, um sicherzustellen, dass sie den Projekt-Richtlinien entsprechen. Konstruktives Feedback geben, fachliche Informationen prüfen und Inhalte bei Bedarf überarbeiten, um die Qualität zu verbessern.
AI Studio
100% Remoteanteil

Freiberuflicher Bauingenieur mit Python-Erfahrung (m/w/d)

Ein Unternehmen sucht freiberufliche Bauingenieure, die KI-Modelle bewerten. Ziel des Projekts ist es, Leistung, Genauigkeit und Zuverlässigkeit von KI-Modellen im Bauwesen zu prüfen. Die Rolle umfasst eine enge Zusammenarbeit mit dem Entwicklungsteam, um sicherzustellen, dass die Modelle den Branchenstandards entsprechen und umsetzbare Erkenntnisse liefern. Hauptverantwortlichkeiten: - Bewertung von KI-Modellen für Bauingenieur-Anwendungen. - Analyse der Modellausgaben und Feedback zur Verbesserung. - Zusammenarbeit mit dem Entwicklungsteam zur Einhaltung der Branchenstandards. - Dokumentation von Ergebnissen und Empfehlungen zur Modelloptimierung. - Durchführung von Tests zur Überprüfung der Modellleistung und -zuverlässigkeit.
AI Lab
100% Remoteanteil

Freelance Kotlin-Entwickler (m/w/d)

Für ein AI-Lab suchen wir einen Kotlin-Entwickler, der ein KI-Modell (Large Language Model – LLM) trainiert. Du hilfst der KI, die Welt zu verstehen. Als Berater kannst du eingeladen werden, an Online-Projekten teilzunehmen, um das Modell in deinem Fachgebiet zu trainieren. Diese flexible Rolle passt sowohl für Experten, die eine Teilzeitbeschäftigung (mindestens ein paar Stunden/Woche) suchen, als auch für alle, die an einer Vollzeitstelle interessiert sind. - Code-Generierung und Code-Review - Bewertung von Prompts und komplexe Datenannotation - Training und Evaluation großer Sprachmodelle - Benchmarking und agentenbasierte Code-Ausführung in gesicherten Umgebungen - Arbeit mit mehreren Programmiersprachen - Anpassung von Richtlinien für neue Bereiche und Anwendungsfälle - Einhaltung projektspezifischer Rubriken und Anforderungen - Zusammenarbeit mit Projektleitern, Solution Engineers und Supply Managern bei komplexen oder experimentellen Projekten
AI Lab
100% Remoteanteil
Neu

Freiberuflicher Statistikexperte mit Python-Erfahrung (m/w/d)

Für ein AI-Lab suchen wir einen Statistikexperten mit Python-Erfahrung, um ein KI-Modell (Large Language Model – LLM) zu trainieren. GenAI-Modelle verbessern sich sehr schnell, und eines unserer Ziele ist, sie dazu zu bringen, spezialisierte Fragen zu beantworten und komplexe Schlussfolgerungen zu ziehen. Wenn Sie sich uns anschließen, haben Sie die Möglichkeit, an diesen Projekten mitzuwirken. Auch wenn jedes Projekt einzigartig ist, könnten Sie typischerweise: - Prompts erstellen, die die KI herausfordern. - Umfassende Bewertungskriterien festlegen, um die Genauigkeit der Antworten der KI zu beurteilen. - Die Antworten des Modells anhand Ihres fachspezifischen Wissens korrigieren.
AI Lab
100% Remoteanteil

Freiberuflicher Rust-Entwickler (m/w/d)

Für ein AI-Labor suchen wir Rust-Entwickler*innen, um ein KI-Modell (Large Language Model – LLM) zu trainieren. Du hilfst der KI, die Welt zu verstehen. Als Berater*in kannst du online Projekte begleiten, um das Modell in deinem Fachbereich zu schulen. Diese flexible Rolle richtet sich sowohl an Expert*innen, die teilzeit (mindestens ein paar Stunden/Woche) arbeiten möchten, als auch an jene, die sich eine Vollzeitstelle wünschen. - Code-Generierung und Code-Review - Bewertung von Prompts und komplexe Datenannotation - Training und Evaluierung großer Sprachmodelle - Benchmarking und agentenbasierte Code-Ausführung in isolierten Umgebungen - Arbeit mit verschiedenen Programmiersprachen (Python, JavaScript/TypeScript, Rust, SQL usw.) - Anpassung von Richtlinien für neue Fachgebiete und Anwendungsfälle - Einhaltung projektspezifischer Vorgaben und Anforderungen - Zusammenarbeit mit Projektleitungen, Solution Engineers und Supply Managern bei komplexen oder experimentellen Projekten
AI Lab
100% Remoteanteil

Freiberuflicher Physik-Experte (mit Python) – Qualitätssicherung / KI-Trainer

Generative KI-Modelle verbessern sich sehr schnell, und eines unserer Ziele ist es, sie in die Lage zu versetzen, spezialisierte Fragen zu beantworten und komplexe Denkfähigkeiten zu entwickeln. Auch wenn jedes Projekt einzigartig ist, gehören zu deinen Aufgaben typischerweise: - Inhaltserstellung & -verfeinerung: Erstelle und überarbeite Inhalte, um Genauigkeit und Relevanz in verschiedenen Physik-Themen sicherzustellen, und entwickle dabei Referenzen und Aufgabenbeispiele. - Expertenrekrutierung: Bewerte Qualifikationstests von Experten, um ihre Kompetenz sicherzustellen. - Chat-Moderation: Unterstütze, indem du projektbezogene Fragen anderer Experten in Discord-Chats beantwortest, besonders zu Projektrichtlinien. - Arbeitsprüfung: Überprüfe und bewerte Aufgaben, die von anderen Experten erledigt wurden, um sicherzustellen, dass sie mit den Projektrichtlinien übereinstimmen. Gib konstruktives Feedback, prüfe fachliche Informationen und bearbeite Inhalte bei Bedarf, um die Qualität zu verbessern.
AI Studio
100% Remoteanteil

Frontend developer to HR platform with Angular experience

Reach out to us if you are interested in working with us on the project.
FRATCH
München
90% Remoteanteil
Registriere dich um Zugang zu weiteren spannenden Projekten zu erhalten, die deinen Fähigkeiten und Vorlieben entsprechen!

AI-Agent-Evaluationsanalyst (m/w/d)

Melde dich an, um die Anzahl der Bewerber zu sehen
Industrie
Informationstechnologie (IT)
Bereich
Qualitätssicherung

Projekt Info

  • Dauer
    15.12.2025 - 11.04.2026
  • Auslastung
    Ab 95%
  • Tagessatz
    200 - 320€
  • Standort
    Amsterdam, Niederlande
  • Sprachen
    Wichtig:
    • Deutsch
      (Verhandlungssicher)
    Wünschenswert:
    • Englisch
      (Verhandlungssicher)
  • Remoteanteil
    Ab 95%

Beschreibung

Wir suchen einen freiberuflichen Agent-Evaluationsanalysten, der die Verantwortung für Qualität, Struktur und Erkenntnisse im gesamten Projekt übernimmt. Diese Rolle geht weit über reine Aufgabenprüfung hinaus – es geht um kritisches Denken, Systemanalyse und die Gewährleistung von Klarheit, Zuverlässigkeit und Konsistenz in großem Maßstab. Du arbeitest sowohl als praktischer Evaluator als auch als Analyst und kooperierst mit Fachexperten, Delivery Managern und Ingenieuren. Neben der Überprüfung der Ergebnisse sollst du das „Warum“ hinter der Arbeit verstehen, logische Lücken oder Inkonsistenzen aufdecken und sinnvolle Verbesserungen vorschlagen.

Dies ist eine flexible, wirkungsorientierte Rolle, bei der du Raum hast, dich weiterzuentwickeln, Ideen einzubringen und mitzugestalten, wie Evaluation und Qualität im Projekt skaliert werden.

Diese Rolle eignet sich besonders für:

  • Analysten, Forscher oder Berater mit starken Strukturierungs- und Argumentationsfähigkeiten
  • Junior-Produktmanager oder Strategen, die sich für KI und Evaluationsarbeit interessieren
  • Clevere Problemlöser (Studierende oder Berufseinsteiger), die gerne in Logik, Systeme und Grenzfälle eintauchen

Du benötigst keinen Programmierhintergrund. Entscheidender sind Neugier, intellektuelle Genauigkeit und die Fähigkeit, komplexe Strukturen präzise zu bewerten.

Was du tun wirst

  • Volle Verantwortung für den QA-Prozess bei den Agent-Evaluationsaufgaben übernehmen
  • Aufgaben und Golden Paths, die von Szenario-Autoren und Experten erstellt wurden, prüfen und validieren
  • Logische Inkonsistenzen, unklare Anforderungen, versteckte Risiken und unrealistische Annahmen erkennen
  • Strukturiertes Feedback geben und Qualitätsabstimmung unter den Mitwirkenden sicherstellen
  • Neue QA-Teammitglieder schulen, einarbeiten und coachen
  • Mit Fachexperten, Delivery Managern und Ingenieuren zusammenarbeiten, um Testklarheit und -abdeckung zu verbessern
  • QA-Checklisten, SOPs und Review-Richtlinien pflegen und optimieren
  • Zur Testplanung, Priorisierung und Festlegung von Qualitätsmaßstäben beitragen
  • Eigeninitiative zeigen, neue Ansätze, Tools und Prozesse vorschlagen, die Validierung und Analyse skalierbar machen

Anforderungen

Was du wissen/kennen solltest

  • Starke analytische und kritische Denkfähigkeiten
  • Hohe Detailgenauigkeit und Zuverlässigkeit – deine Arbeit kann ohne Nachprüfung vertraut werden
  • Erfahrung in manueller QA, Szenarioprüfung oder ähnlicher analytischer Arbeit
  • Sicherer Umgang mit strukturierten Formaten (JSON/YAML)
  • Klare schriftliche Kommunikation und Dokumentationsfähigkeiten
  • Fähigkeit, konstruktives Feedback zu geben und andere anzuleiten
  • Kompetenz im Umgang mit verschiedenen Stakeholdern: von Ingenieuren bis hin zu Direktoren/VPs

Nice to have

  • Hintergrund in szenariobasierter Testung, Testdesign oder Annotation-Workflows
  • Erfahrung mit KI-/LLM-Evaluation, Prompt-Validierung oder Agentenverhaltens-Tests
  • Technische Unabhängigkeit (z. B. Python-Kenntnisse)
  • Vertrautheit mit MCP-/Tool-basierten Aufgaben
  • Erfahrung in funktionsübergreifenden Teams aus Produkt, Delivery und Engineering

Wer du bist

  • Detailverliebt, aber auch in der Lage, das große Ganze zu sehen
  • Proaktiv, eigenständig und übernimmst echte Verantwortung für deine Arbeit
  • Starker Kommunikatorin, der/die komplexe Erkenntnisse in umsetzbare Insights verwandelt
  • Flexibel und motiviert, bei verschiedenen Aufgaben und Projekten mitzuarbeiten
  • Glaubst, dass Qualität mehr ist als nur Kontrolle – sie macht das gesamte Produkt besser.