Projektdetail

Empfohlene Projekte

KI-Agent Evaluationsanalyst (m/w/d)

Wir suchen einen freiberuflichen Agenten-Evaluationsanalysten, der die Verantwortung für Qualität, Struktur und Erkenntnisse im Projekt übernimmt. Diese Rolle geht weit über das einfache Überprüfen von Aufgaben hinaus – es geht um kritisches Denken, Systemanalyse und darum, auf großer Skala Klarheit, Verlässlichkeit und Konsistenz zu gewährleisten. Du arbeitest sowohl als praktischer Evaluator als auch als Analyst und kooperierst mit Fachexperten, Delivery Managern und Entwicklern. Neben der Prüfung der Ergebnisse sollst du das "Warum" hinter der Arbeit verstehen, logische Lücken oder Inkonsistenzen erkennen und sinnvolle Verbesserungen vorschlagen. Dies ist eine flexible, wirkungsorientierte Rolle, in der du Raum zum Wachsen hast, Ideen einbringen und mitgestalten kannst, wie Evaluation und Qualität im Projekt skaliert werden. Diese Rolle eignet sich besonders für: - Analysten, Forscher oder Berater mit starken Strukturierungs- und Argumentationsfähigkeiten - Junior-Produktmanager oder Strategen, die sich für KI und Evaluationsarbeit interessieren - Clevere Problemlöser (Studierende oder Berufseinsteiger), die gerne in Logik, Systeme und Randfälle eintauchen Du brauchst keinen Programmierhintergrund. Wichtig sind Neugier, intellektuelle Genauigkeit und die Fähigkeit, komplexe Abläufe präzise zu bewerten. Was du tun wirst - Volle Verantwortung für die QA-Pipeline bei Agenten-Evaluationsaufgaben übernehmen; - Aufgaben und Goldpfade prüfen und validieren, die von Szenarioautoren und Experten erstellt wurden; - Logische Inkonsistenzen, vage Anforderungen, versteckte Risiken und unrealistische Annahmen erkennen; - Strukturiertes Feedback geben und die Qualitätsausrichtung aller Beteiligten sicherstellen; - Neue QA-Teammitglieder schulen, einarbeiten und betreuen; - Mit Fachexperten, Delivery Managern und Entwicklern zusammenarbeiten, um Testklarheit und -abdeckung zu verbessern; - QA-Checklisten, SOPs und Prüfrichtlinien pflegen und weiterentwickeln; - Zur Testplanung, Priorisierung und Festlegung von Qualitätsmaßstäben beitragen; - Eigeninitiative zeigen und neue Ansätze, Tools und Prozesse vorschlagen, die Validierung und Analyse skalieren helfen.
AI Studio
Amsterdam, Niederlande
100% Remoteanteil
Neu

KI-Agenten-Bewertungsanalyst

Für ein AI-Lab suchen wir einen KI-Agenten-Bewertungsanalysten, um ein KI-Modell (Large Language Model – LLM) zu trainieren. Du hilfst der KI, die Welt zu verstehen. Als Berater*in wirst du möglicherweise eingeladen, an Online-Projekten teilzunehmen, um das Modell in deinem Fachgebiet zu trainieren. Diese flexible Rolle eignet sich sowohl für Expert*innen, die eine Teilzeitbeschäftigung (mindestens einige Stunden pro Woche) suchen, als auch für diejenigen, die an Vollzeitmöglichkeiten interessiert sind - Bewertung von Evaluierungsaufgaben und Szenarien hinsichtlich Logik, Vollständigkeit und Realismus. - Identifizierung von Inkonsistenzen, fehlenden Annahmen oder unklaren Entscheidungspunkten. - Mithilfe bei der Definition klarer erwarteter Verhaltensweisen (Goldstandards) für KI-Agenten. - Markierung von Ursache-Wirkungs-Beziehungen, Denkpfaden und plausiblen Alternativen. - Durchdenken komplexer Systeme und Richtlinien wie ein Mensch, um sicherzustellen, dass Agenten richtig getestet werden. - Enge Zusammenarbeit mit QA, Autor*innen oder Entwickler*innen, um Verbesserungen oder die Abdeckung von Randfällen vorzuschlagen.
AI Lab
100% Remoteanteil

Freiberuflicher QA-Annotator (Japanisch)

Für unseren Kunden suchen wir eine japanischsprachige Datenkennzeichnungsspezialistin oder einen Datenkennzeichnungsspezialisten: Kennzeichnung hilft KI, die Welt zu verstehen. Als QA-Annotator könntest du eingeladen werden, an Online-Projekten teilzunehmen, z. B. bei der Bewertung von KI-generierten Inhalten, der Überprüfung der inhaltlichen Genauigkeit oder dem Vergleich von Antworten – wenn Projekte verfügbar sind. Aufgaben: - Überprüfung der bereitgestellten Daten (Text, Bilder oder Videos) mit Sorgfalt. - Prüfung der vom Annotatoren-Team eingereichten Aufgaben und Sicherstellung der Qualitätssicherung/-kontrolle. - Kennzeichnung oder Klassifizierung von Inhalten gemäß Projektvorgaben. - Erkennung und Markierung von inhaltlich falschen, sensiblen, unangemessenen oder unklaren Materialien.
AI Studio
100% Remoteanteil
Neu

Freelance Datenannotator QA (Deutsch)

Für unseren Kunden suchen wir einen deutschsprachigen Spezialisten für Datenannotationen: Annotation hilft KI, die Welt zu verstehen. Als QA-Annotator kannst du eingeladen werden, an Online-Projekten teilzunehmen, z. B. KI-generierte Inhalte zu bewerten, die faktische Genauigkeit zu prüfen oder Antworten zu vergleichen – wenn Projekte verfügbar sind. Verantwortlichkeiten: - Gezielte Überprüfung bereitgestellter Daten (Text, Bilder oder Videos). - Kontrolle der vom Annotationsteam eingereichten Aufgaben und Sicherstellung der Qualitätssicherung/-kontrolle. - Kennzeichnung oder Klassifizierung von Inhalten gemäß Projektleitfäden. - Erkennen und Markieren faktisch falscher, sensibler, unangemessener oder unklarer Inhalte.
AI Studio
100% Remoteanteil
Neu

Freiberuflicher Berater - KI-Schulung (portugiesischsprachig)

Für ein KI-Labor suchen wir portugiesischsprachige freiberufliche Berater, um ein KI-Modell (Large Language Model – LLM) in verschiedenen Bereichen zu trainieren: Du hilfst der KI, die Welt zu verstehen. Als Berater wirst du möglicherweise in Online-Projekten eingeladen, das Modell in deinem Fachgebiet zu trainieren. Diese flexible Rolle richtet sich sowohl an Expert:innen, die eine Teilzeitbeschäftigung (mindestens ein paar Stunden pro Woche) anstreben, als auch an diejenigen, die an Vollzeitchancen interessiert sind Verantwortlichkeiten: - Analysiere sorgfältig die vom KI bereitgestellten Daten in deinem Fachgebiet. - Verbessere das Modell in deinem Fachgebiet. - Überprüfe KI-Ergebnisse und stelle Qualitätssicherung/Qualitätskontrolle sicher. - Kennzeichne oder klassifiziere Inhalte gemäß den Projektvorgaben.
AI Lab
100% Remoteanteil
Neu

Freiberuflicher Datenannotator (Koreanisch) (m/w/d)

Für unseren Kunden suchen wir eine Data-Annotation-Spezialistin oder einen -Spezialisten mit Koreanischkenntnissen: Annotation hilft KI, die Welt zu verstehen. Als QA-Annotator/in nimmst du, wenn Projekte verfügbar sind, an Online-Projekten teil, z. B. bei der Bewertung von KI-generierten Inhalten, der Überprüfung der sachlichen Genauigkeit oder dem Vergleich von Antworten. Diese flexible Rolle richtet sich sowohl an Expertinnen und Experten, die eine Teilzeit-Tätigkeit (mindestens wenige Stunden pro Woche) suchen, als auch an Personen, die an Vollzeitmöglichkeiten interessiert sind. Verantwortlichkeiten: - Überprüfung der bereitgestellten Daten (Text, Bilder oder Videos). - Überprüfung der vom Annotationsteam eingereichten Aufgaben und Sicherstellung der Qualitätskontrolle/-sicherung. - Kennzeichnung oder Klassifizierung von Inhalten gemäß den Projektvorgaben. - Erkennen und Markieren von sachlich falschem, sensiblen, unangemessenen oder unklaren Material.
AI Studio
100% Remoteanteil

Freiberuflicher Maschinenbauingenieur (mit Python) - Qualitätssicherung (KI-Trainer)

Generative KI-Modelle verbessern sich sehr schnell, und eines unserer Ziele ist, sie in die Lage zu versetzen, spezialisierte Fragen zu beantworten und komplexe Denkfähigkeiten zu entwickeln. Obwohl jedes Projekt einzigartig ist, könnten deine typischen Aufgaben sein: - Inhaltserstellung & -verfeinerung: Erstellen und Verfeinern von Inhalten, um Genauigkeit und Relevanz in verschiedenen Physikthemen sicherzustellen, und dabei Referenzen und Beispielaufgaben entwickeln. - Rekrutierung von Experten: Bewertung der Qualifikationstests von Experten, um ihre Kompetenz sicherzustellen. - Chat-Moderation: Unterstützung bei projektbezogenen Fragen anderer Experten in Discord-Chats, insbesondere zu Projektleitlinien. - Überprüfung der Arbeit: Kontrolle und Bewertung von Aufgaben, die von anderen Experten durchgeführt wurden, um sicherzustellen, dass sie den Projektleitlinien entsprechen. Konstruktives Feedback geben, fachliche Informationen prüfen und Inhalte bei Bedarf bearbeiten, um die Qualität zu verbessern.
AI Studio
100% Remoteanteil

Freiberuflicher Fahrzeugingenieur (mit Python) - Qualitätssicherung / KI-Trainer

Generative KI-Modelle entwickeln sich sehr schnell und eines unserer Ziele ist, sie in die Lage zu versetzen, spezielle Fragen zu beantworten und komplexe Denkaufgaben zu lösen. Obwohl jedes Projekt einzigartig ist, kannst du typischerweise folgende Aufgaben übernehmen: - Inhaltserstellung & Verfeinerung: Inhalte erstellen und überarbeiten, um Genauigkeit und Relevanz in verschiedenen Physikthemen sicherzustellen und Referenzen sowie Beispielaufgaben zu entwickeln. - Expertengewinnung: Qualifikationstests von Experten bewerten und ihre Kompetenz sicherstellen. - Chat-Moderation: Unterstützung bieten, indem du projektbezogene Fragen anderer Experten in Discord-Chats beantwortest, insbesondere zu den Projekt-Richtlinien. - Aufgabenprüfung: Arbeiten anderer Experten überprüfen und bewerten, ob sie den Projekt-Richtlinien entsprechen. Konstruktives Feedback geben, fachliche Informationen verifizieren und Inhalte bei Bedarf bearbeiten, um die Qualität zu verbessern.
AI Studio
100% Remoteanteil

Freiberuflicher Elektroingenieur (mit Python) – Qualitätssicherung / AI-Trainer

Generative KI-Modelle verbessern sich sehr schnell, und eines unserer Ziele ist es, sie in die Lage zu versetzen, spezialisierte Fragen zu beantworten und komplexe Denkaufgaben zu meistern. Obwohl jedes Projekt einzigartig ist, könnten Ihre Aufgaben typischerweise sein: - Inhaltserstellung & -verfeinerung: Erstellen und Überarbeiten von Inhalten, um Genauigkeit und Relevanz für verschiedene Themen der Physik sicherzustellen, und dabei Referenzen und Aufgabenbeispiele entwickeln. - Expertenakquise: Bewertung der Qualifikationstests von Experten, um ihre Kompetenz sicherzustellen. - Chat-Moderation: Unterstützung, indem Sie projektbezogene Fragen anderer Experten in Discord-Chats beantworten, besonders in Bezug auf Projektleitfäden. - Arbeitsprüfung: Durchsicht und Bewertung von Aufgaben, die andere Experten abgeschlossen haben, um sicherzustellen, dass sie den Projektleitfäden entsprechen. Geben Sie konstruktives Feedback, überprüfen Sie fachbezogene Informationen und bearbeiten Sie Inhalte bei Bedarf, um die Qualität zu verbessern.
AI Studio
100% Remoteanteil
Neu

Freiberuflicher Rust-Entwickler (m/w/d)

Für ein AI-Lab suchen wir einen Rust-Entwickler, um ein KI-Modell (Large Language Model – LLM) zu trainieren. Du hilfst der KI, die Welt zu verstehen. Als Berater wirst du möglicherweise zu Online-Projekten eingeladen, um das Modell in deinem Fachbereich zu trainieren. Diese flexible Rolle eignet sich sowohl für Experten, die eine Teilzeittätigkeit (mindestens ein paar Stunden pro Woche) suchen, als auch für Interessierte an einer Vollzeitstelle. - Codegenerierung und Code-Review - Prompt-Bewertung und komplexe Datenannotation - Training und Evaluation von Large Language Models - Benchmarking und agentenbasierte Codeausführung in isolierten Umgebungen - Arbeit mit mehreren Programmiersprachen (Python, JavaScript/TypeScript, Rust, SQL usw.) - Anpassung von Richtlinien für neue Bereiche und Anwendungsfälle - Einhalten projekt­bezogener Richtlinien und Anforderungen - Zusammenarbeit mit Projektleitern, Solution Engineers und Supply Managern an komplexen oder experimentellen Projekten
AI Lab
100% Remoteanteil

Freiberuflicher Mathematik-Experte für KI-Modell-Training (m/w/d)

Ein KI-Labor sucht freiberufliche Mathematik-Experten, um KI-Modelle zu bewerten. Ziel des Projekts ist es, die Leistung, Genauigkeit und Zuverlässigkeit von KI-Modellen in mathematischen Anwendungen zu prüfen. Die Rolle beinhaltet eine enge Zusammenarbeit mit dem Entwicklungsteam, um sicherzustellen, dass die Modelle den Branchenstandards entsprechen und umsetzbare Erkenntnisse liefern. Es handelt sich um eine remote Teilzeitstelle, die flexibel an deine Verfügbarkeit angepasst werden kann – von nur wenigen Stunden pro Woche bis hin zu Vollzeit. Hauptaufgaben: - Bewerten von KI-Modellen für mathematische Anwendungen. - Analysieren der Modellausgaben und Feedback zur Verbesserung geben. - Zusammenarbeit mit dem Entwicklungsteam, um die Einhaltung der Branchenstandards sicherzustellen. - Dokumentieren von Ergebnissen und Empfehlungen zur Modelloptimierung. - Durchführen von Tests zur Validierung der Modellleistung und -zuverlässigkeit.
AI Lab
100% Remoteanteil

Freiberufliche Chemieexpertin / freiberuflicher Chemieexperte für KI-Modell-Training (m/w/d)

Ein KI-Labor sucht freiberufliche Chemieexperten zur Bewertung von KI-Modellen. Das Ziel des Projekts ist es, die Leistung, Genauigkeit und Zuverlässigkeit von in der Chemie eingesetzten KI-Modellen zu beurteilen. Die Rolle umfasst die enge Zusammenarbeit mit dem Entwicklungsteam, um sicherzustellen, dass die Modelle den Branchenstandards entsprechen und praxisrelevante Erkenntnisse liefern. Dies ist eine remote Teilzeitstelle, die flexibel an deine Verfügbarkeit angepasst werden kann – von nur wenigen Stunden pro Woche bis hin zu Vollzeit. Hauptverantwortlichkeiten: - Evaluierung von KI-Modellen für chemische Anwendungen. - Analyse der Modellausgaben und Feedback zur Verbesserung. - Zusammenarbeit mit dem Entwicklungsteam, um die Übereinstimmung mit Branchenstandards sicherzustellen. - Dokumentation der Ergebnisse und Empfehlungen zur Modelloptimierung. - Durchführung von Tests zur Validierung der Modellleistung und Zuverlässigkeit.
AI Lab
100% Remoteanteil

Freiberufliche Physikexpertin bzw. freiberuflicher Physikexperte für KI-Modell-Training (m/w/d)

Ein AI-Labor sucht freiberufliche Physikexperten, um KI-Modelle zu bewerten. Ziel des Projekts ist es, die Leistung, Genauigkeit und Zuverlässigkeit von KI-Modellen in physikalischen Anwendungsbereichen zu beurteilen. Die Aufgabe umfasst die enge Zusammenarbeit mit dem Entwicklungsteam, um sicherzustellen, dass die Modelle den Branchenstandards entsprechen und umsetzbare Erkenntnisse liefern. Dies ist eine remote ausgeübte Teilzeitstelle, die flexibel an deine Verfügbarkeit angepasst werden kann – von nur wenigen Stunden pro Woche bis hin zu einer Vollzeitbeschäftigung. Key responsibilities: - KI-Modelle für physikalische Anwendungen bewerten. - Modellausgaben analysieren und Verbesserungsvorschläge geben. - Mit dem Entwicklungsteam zusammenarbeiten, um die Einhaltung der Branchenstandards sicherzustellen. - Erkenntnisse und Empfehlungen zur Modelloptimierung dokumentieren. - Tests durchführen, um Modellleistung und -zuverlässigkeit zu verifizieren.
AI Lab
100% Remoteanteil

Freiberuflicher Elektroingenieur für KI-Modelltraining (m/w/d)

Ein Unternehmen sucht freiberufliche Elektroingenieure, um KI-Modelle zu bewerten. Ziel des Projekts ist es, die Leistung, Genauigkeit und Zuverlässigkeit von KI-Modellen in elektrotechnischen Anwendungen zu prüfen. Die Rolle umfasst die enge Zusammenarbeit mit dem Entwicklungsteam, um sicherzustellen, dass die Modelle den Industriestandards entsprechen und umsetzbare Erkenntnisse liefern. Wesentliche Aufgaben: - Bewertung von KI-Modellen für elektrotechnische Anwendungen. - Analyse der Modellausgaben und Feedback zur Verbesserung. - Zusammenarbeit mit dem Entwicklungsteam zur Einhaltung der Industriestandards. - Dokumentation der Ergebnisse und Empfehlungen zur Modelloptimierung. - Durchführung von Tests zur Validierung der Modellleistung und -zuverlässigkeit.
AI Lab
100% Remoteanteil

Freiberuflicher Maschinenbauingenieur für KI-Modell-Training (m/w/d)

Ein Unternehmen sucht freiberufliche Experten im Maschinenbau, um KI-Modelle zu evaluieren. Ziel des Projekts ist es, Leistung, Genauigkeit und Zuverlässigkeit von KI-Modellen in maschinenbaulichen Anwendungsbereichen zu bewerten. Die Rolle umfasst eine enge Zusammenarbeit mit dem Entwicklungsteam, um sicherzustellen, dass die Modelle den Industriestandards entsprechen und umsetzbare Erkenntnisse liefern. Hauptverantwortlichkeiten: - KI-Modelle für Anwendungen im Maschinenbau bewerten. - Modelergebnisse analysieren und Verbesserungsvorschläge geben. - Mit dem Entwicklungsteam zusammenarbeiten, um die Einhaltung der Industriestandards sicherzustellen. - Ergebnisse und Empfehlungen zur Modelloptimierung dokumentieren. - Tests durchführen, um die Leistung und Zuverlässigkeit der Modelle zu validieren.
AI Lab
100% Remoteanteil

Freiberufliche*r Bauingenieur*in für KI-Modell-Training (m/w/d)

Ein Unternehmen sucht freiberufliche Experten im Bauingenieurwesen, um KI-Modelle zu bewerten. Ziel des Projekts ist es, die Leistung, Genauigkeit und Zuverlässigkeit von KI-Modellen im Bereich des Bauingenieurwesens zu beurteilen. Die Rolle beinhaltet die enge Zusammenarbeit mit dem Entwicklungsteam, um sicherzustellen, dass die Modelle den Branchenstandards entsprechen und umsetzbare Erkenntnisse liefern. Key responsibilities: - KI-Modelle für bauingenieurtechnische Anwendungen bewerten. - Modelleergebnisse analysieren und Verbesserungsvorschläge geben. - Mit dem Entwicklungsteam zusammenarbeiten, um die Einhaltung von Branchenstandards zu gewährleisten. - Erkenntnisse und Empfehlungen zur Modelloptimierung dokumentieren. - Tests durchführen, um Modellleistung und -zuverlässigkeit zu validieren.
AI Lab
100% Remoteanteil
Neu

Freelance-Datenannotator (Chinesisch) (m/w/d)

Für ein AI-Studio suchen wir eine chinesischsprachige Fachkraft für Datenannotation: Annotation hilft der KI, die Welt zu verstehen. Als QA-Annotator*in wirst du eingeladen, an Online-Projekten teilzunehmen, wie z. B. die Bewertung von KI-generierten Inhalten, die Überprüfung der sachlichen Richtigkeit oder den Vergleich von Antworten – wenn Projekte verfügbar sind. Diese flexible Rolle eignet sich sowohl für Expert*innen, die eine Teilzeit-Tätigkeit (mindestens ein paar Stunden pro Woche) suchen, als auch für diejenigen, die Vollzeitoptionen bevorzugen. Aufgaben: - Sorgfältige Überprüfung der bereitgestellten Daten (Text, Bilder oder Videos). - Durchsicht der Aufgaben des Annotator-Teams und Sicherstellung der Qualität (QA/QC). - Kennzeichnung oder Klassifizierung von Inhalten gemäß Projektleitfäden. - Erkennen und Markieren von sachlich falschem, sensiblen, unangemessenem oder unklaren Material.
AI Studio
100% Remoteanteil

Leiter Elektronikentwicklung (m/w/d)

Ein Unternehmen sucht einen erfahrenen Leiter Elektronikentwicklung, der die fachliche und disziplinarische Führung eines Hardware- und Softwareentwicklungsteams übernimmt. Ziel des Projekts ist es, die Qualität der technischen Arbeitsprodukte sicherzustellen, strategische Vorentwicklungen zu planen und durchzuführen sowie bestehende Prozesse und Systeme zu optimieren. Die Rolle umfasst die Mitarbeit im agilen Projektmanagement, die Kostenermittlung und Angebotserstellung sowie die Team- und Kapazitätsplanung. Der Kandidat wird die fachliche Weiterentwicklung der Teammitglieder verantworten und eng mit Kunden und Lieferanten kommunizieren. Hauptaufgaben: - Fachliche und disziplinarische Führung eines HW- und SW-Entwicklungsteams - Mitarbeit im agilen Projektmanagement, Kostenermittlung und Angebotserstellung - Team- und Kapazitätsplanung - Fachliche Weiterentwicklung der Teammitglieder - Verantwortung für die Qualität der formalen und technischen Arbeitsprodukte - Kalkulation und Preisermittlung von Produkten, insbesondere PCBA - Planung und Durchführung von strategischen Vorentwicklungen - Kommunikation mit Kunden und Lieferanten - Optimierung bestehender Prozesse und Systeme
Fertigung
Frankfurt, Deutschland
100% Remoteanteil
Neu

Berater Unternehmensfinanzierung / M&A-Berater / Finanzen

Für ein AI-Labor suchen wir freiberufliche Finanzexperten, die ein KI-Modell (Large Language Model – LLM) in verschiedenen Bereichen trainieren: Sie helfen der KI, die Welt zu verstehen. Als Berater können Sie zu Online-Projekten eingeladen werden, um das Modell in Ihrem Fachgebiet zu schulen. Diese flexible Rolle richtet sich sowohl an Experten, die eine Teilzeitanstellung (mindestens ein paar Stunden pro Woche) suchen, als auch an solche, die an Vollzeitmöglichkeiten interessiert sind. Unterstützung bei einer oder mehreren der folgenden Aufgaben: - Finanzprognosen - Risikomanagement - Internationale Finanzen - Finanztechnik - Volkswirtschaft, Unternehmensfinanzierung - Investment Management, Mathematische Finanzen - Öffentliche Finanzen, Verhaltensfinanzen - Finanzmärkte und Institutionen - Finanztechnologie - Algorithmischer Handel
AI Lab
100% Remoteanteil
Neu

Freiberuflicher Kotlin-Entwickler (m/w/d)

Für ein AI-Labor suchen wir einen Kotlin-Entwickler, um ein AI-Modell (Large Language Model – LLM) zu trainieren. Du hilfst der KI, die Welt zu verstehen. Als Berater:in wirst du vielleicht zu Online-Projekten eingeladen, um das Modell in deinem Fachbereich zu trainieren. Diese flexible Rolle bietet sowohl Expert:innen, die eine Teilzeit-Tätigkeit (mindestens ein paar Stunden pro Woche) suchen, als auch diejenigen, die an Vollzeitangeboten interessiert sind. - Code-Generierung und Code-Review - Prompt-Bewertung und komplexe Datenannotation - Training und Evaluation von Large Language Models - Benchmarking und agentenbasierte Code-Ausführung in sandboxed Umgebungen - Arbeit mit mehreren Programmiersprachen - Anpassung von Richtlinien für neue Bereiche und Anwendungsfälle - Einhaltung projektspezifischer Rubriken und Anforderungen - Zusammenarbeit mit Projektleitungen, Solution Engineers und Supply Managern in komplexen oder experimentellen Projekten
AI Lab
100% Remoteanteil
Neu

Freelance Ruby-Entwickler (m/w/d)

Für ein AI Lab suchen wir Ruby-Entwickler, um ein KI-Modell (Large Language Model - LLM) zu trainieren. Du hilfst der KI, die Welt zu verstehen. Als Berater wirst du eventuell eingeladen, an Online-Projekten teilzunehmen, um das Modell in deinem Fachgebiet zu trainieren. Diese flexible Rolle richtet sich sowohl an Experten, die eine Teilzeit-Tätigkeit (mindestens wenige Stunden/Woche) suchen, als auch an diejenigen, die Vollzeitmöglichkeiten bevorzugen. - Code-Generierung und Code-Review - Prompt-Bewertung und komplexe Datenanotierung - Training und Evaluation großer Sprachmodelle - Benchmarking und agentenbasierte Code-Ausführung in abgesicherten Umgebungen - Arbeiten mit mehreren Programmiersprachen (Python, JavaScript/TypeScript, Rust, SQL usw.) - Anpassung von Richtlinien für neue Bereiche und Anwendungsfälle - Zusammenarbeit mit Projektleitern, Solution Engineers und Supply Managern an komplexen oder experimentellen Projekten
AI Lab
100% Remoteanteil

Frontend developer to HR platform with Angular experience

Reach out to us if you are interested in working with us on the project.
FRATCH
München
90% Remoteanteil
Registriere dich um Zugang zu weiteren spannenden Projekten zu erhalten, die deinen Fähigkeiten und Vorlieben entsprechen!

KI-Agent Evaluationsanalyst (m/w/d)

Melde dich an, um die Anzahl der Bewerber zu sehen
Industrie
Informationstechnologie (IT)
Bereich
Qualitätssicherung

Projekt Info

  • Dauer
    17.11.2025 - 14.03.2026
  • Auslastung
    Ab 95%
  • Tagessatz
    200 - 320€
  • Standort
    Amsterdam, Niederlande
  • Sprachen
    Wichtig:
    • Deutsch
      (Verhandlungssicher)
    Wünschenswert:
    • Englisch
      (Verhandlungssicher)
  • Remoteanteil
    Ab 95%

Beschreibung

Wir suchen einen freiberuflichen Agenten-Evaluationsanalysten, der die Verantwortung für Qualität, Struktur und Erkenntnisse im Projekt übernimmt. Diese Rolle geht weit über das einfache Überprüfen von Aufgaben hinaus – es geht um kritisches Denken, Systemanalyse und darum, auf großer Skala Klarheit, Verlässlichkeit und Konsistenz zu gewährleisten. Du arbeitest sowohl als praktischer Evaluator als auch als Analyst und kooperierst mit Fachexperten, Delivery Managern und Entwicklern. Neben der Prüfung der Ergebnisse sollst du das "Warum" hinter der Arbeit verstehen, logische Lücken oder Inkonsistenzen erkennen und sinnvolle Verbesserungen vorschlagen. Dies ist eine flexible, wirkungsorientierte Rolle, in der du Raum zum Wachsen hast, Ideen einbringen und mitgestalten kannst, wie Evaluation und Qualität im Projekt skaliert werden.

Diese Rolle eignet sich besonders für:

  • Analysten, Forscher oder Berater mit starken Strukturierungs- und Argumentationsfähigkeiten
  • Junior-Produktmanager oder Strategen, die sich für KI und Evaluationsarbeit interessieren
  • Clevere Problemlöser (Studierende oder Berufseinsteiger), die gerne in Logik, Systeme und Randfälle eintauchen

Du brauchst keinen Programmierhintergrund. Wichtig sind Neugier, intellektuelle Genauigkeit und die Fähigkeit, komplexe Abläufe präzise zu bewerten.

Was du tun wirst

  • Volle Verantwortung für die QA-Pipeline bei Agenten-Evaluationsaufgaben übernehmen;
  • Aufgaben und Goldpfade prüfen und validieren, die von Szenarioautoren und Experten erstellt wurden;
  • Logische Inkonsistenzen, vage Anforderungen, versteckte Risiken und unrealistische Annahmen erkennen;
  • Strukturiertes Feedback geben und die Qualitätsausrichtung aller Beteiligten sicherstellen;
  • Neue QA-Teammitglieder schulen, einarbeiten und betreuen;
  • Mit Fachexperten, Delivery Managern und Entwicklern zusammenarbeiten, um Testklarheit und -abdeckung zu verbessern;
  • QA-Checklisten, SOPs und Prüfrichtlinien pflegen und weiterentwickeln;
  • Zur Testplanung, Priorisierung und Festlegung von Qualitätsmaßstäben beitragen;
  • Eigeninitiative zeigen und neue Ansätze, Tools und Prozesse vorschlagen, die Validierung und Analyse skalieren helfen.

Anforderungen

Was du wissen solltest / können musst

  • Starke analytische und kritische Denkfähigkeiten;
  • Sorgfalt und Verlässlichkeit – deine Arbeit kann ohne Nachprüfung vertraut werden;
  • Erfahrung in manueller QA, Szenariovalidierung oder ähnlicher analytischer Arbeit;
  • Sicherer Umgang mit strukturierten Formaten (JSON/YAML);
  • Klare schriftliche Kommunikations- und Dokumentationsfähigkeiten;
  • Fähigkeit, konstruktives Feedback zu geben und andere anzuleiten;
  • Fähigkeit, mit einer breiten Palette von Stakeholdern zu arbeiten: von Entwicklern bis zu Direktoren/VPs.

Nice to have

  • Erfahrung mit szenariobasierten Tests, Testdesign oder Annotations-Workflows;
  • Erfahrung in der KI/LLM-Evaluation, Prompt-Validierung oder Agentenverhaltenstests;
  • Technische Eigenständigkeit (z. B. Python-Kenntnisse);
  • Vertrautheit mit MCP / tool-basierter Task-Ausführung;
  • Erfahrung in funktionsübergreifenden Teams aus Produkt, Delivery und Entwicklung.

Wer du bist

  • Detailverliebt, aber auch in der Lage, das große Ganze zu sehen;
  • Proaktiv, eigenständig und übernimmst echte Verantwortung für deine Arbeit;
  • Starker Kommunikator, der komplexe Erkenntnisse in umsetzbare Einsichten umwandeln kann;
  • Flexibel und motiviert, an verschiedenen Aufgaben und Projekten mitzuwirken;
  • Glaubt, dass Qualität nicht nur aus dem Prüfen von Arbeit besteht, sondern das gesamte Produkt verbessert.