Projektdetail

Empfohlene Projekte

KI-Agent-Bewertungsanalyst (m/w/d)

Wir suchen einen freiberuflichen Bewertungsanalysten für Agenten, der die Verantwortung für Qualität, Struktur und Erkenntnisse im Projekt übernimmt. Diese Rolle geht weit über reine Aufgabenprüfung hinaus – es geht um kritisches Denken, systematische Analyse und darum, Klarheit, Zuverlässigkeit und Konsistenz im großen Maßstab sicherzustellen. Du arbeitest sowohl als praktischer Evaluator als auch als Analyst und arbeitest dabei mit Fachexperten, Delivery Managern und Ingenieuren zusammen. Neben der Überprüfung der Ergebnisse sollst du das „Warum“ hinter der Arbeit verstehen, logische Lücken oder Inkonsistenzen erkennen und sinnvolle Verbesserungen vorschlagen. Dies ist eine flexible, wirkungsorientierte Rolle, in der du Raum hast, dich weiterzuentwickeln, Ideen einzubringen und mitzugestalten, wie Evaluation und Qualität im Projekt skaliert werden. Diese Rolle eignet sich besonders für: Analysten, Forscher oder Berater mit starken Strukturierungs- und Argumentationsfähigkeiten Junior-Produktmanager oder Strategen, die neugierig auf KI und Evaluation sind Schlaue Problemlöser (Studierende oder Berufseinsteiger), die gerne in Logik, Systeme und Randfälle eintauchen Eine Programmerfahrung ist nicht nötig. Entscheidend sind Neugier, intellektuelle Strenge und die Fähigkeit, komplexe Strukturen präzise zu bewerten. Was du tun wirst - Eigenverantwortliche Betreuung der QA-Pipeline für Agentenbewertungsaufgaben; - Überprüfung und Validierung von Aufgaben und Goldstandard-Pfaden, die von Szenario-Autoren und Experten erstellt wurden; - Erkennen logischer Inkonsistenzen, vager Anforderungen, versteckter Risiken und unrealistischer Annahmen; - Strukturierte Rückmeldungen geben und Qualität zwischen den Beteiligten abstimmen; - Neue QA-Teammitglieder schulen, onboarden und betreuen; - Zusammenarbeit mit Fachexperten, Delivery Managern und Ingenieuren zur Verbesserung von Testklarheit und Abdeckung; - Pflege und Optimierung von QA-Checklisten, SOPs und Prüfrichtlinien; - Mitwirkung bei Testplanung, Priorisierung und Qualitätsbenchmarks; - Eigeninitiative zeigen und neue Ansätze, Werkzeuge und Prozesse vorschlagen, die Validierung und Analyse skalieren
AI Studio
Amsterdam, Niederlande
100% Remoteanteil
Neu

KI-Agenten-Bewertungsanalyst

Für ein AI-Lab suchen wir einen KI-Agenten-Bewertungsanalysten, um ein KI-Modell (Large Language Model – LLM) zu trainieren. Du hilfst der KI, die Welt zu verstehen. Als Berater*in wirst du möglicherweise eingeladen, an Online-Projekten teilzunehmen, um das Modell in deinem Fachgebiet zu trainieren. Diese flexible Rolle eignet sich sowohl für Expert*innen, die eine Teilzeitbeschäftigung (mindestens einige Stunden pro Woche) suchen, als auch für diejenigen, die an Vollzeitmöglichkeiten interessiert sind - Bewertung von Evaluierungsaufgaben und Szenarien hinsichtlich Logik, Vollständigkeit und Realismus. - Identifizierung von Inkonsistenzen, fehlenden Annahmen oder unklaren Entscheidungspunkten. - Mithilfe bei der Definition klarer erwarteter Verhaltensweisen (Goldstandards) für KI-Agenten. - Markierung von Ursache-Wirkungs-Beziehungen, Denkpfaden und plausiblen Alternativen. - Durchdenken komplexer Systeme und Richtlinien wie ein Mensch, um sicherzustellen, dass Agenten richtig getestet werden. - Enge Zusammenarbeit mit QA, Autor*innen oder Entwickler*innen, um Verbesserungen oder die Abdeckung von Randfällen vorzuschlagen.
AI Lab
100% Remoteanteil
Neu

Freelance Datenannotator QA (Deutsch)

Für unseren Kunden suchen wir einen deutschsprachigen Spezialisten für Datenannotationen: Annotation hilft KI, die Welt zu verstehen. Als QA-Annotator kannst du eingeladen werden, an Online-Projekten teilzunehmen, z. B. KI-generierte Inhalte zu bewerten, die faktische Genauigkeit zu prüfen oder Antworten zu vergleichen – wenn Projekte verfügbar sind. Verantwortlichkeiten: - Gezielte Überprüfung bereitgestellter Daten (Text, Bilder oder Videos). - Kontrolle der vom Annotationsteam eingereichten Aufgaben und Sicherstellung der Qualitätssicherung/-kontrolle. - Kennzeichnung oder Klassifizierung von Inhalten gemäß Projektleitfäden. - Erkennen und Markieren faktisch falscher, sensibler, unangemessener oder unklarer Inhalte.
AI Studio
100% Remoteanteil

Freiberuflicher QA-Annotator (Japanisch)

Für unseren Kunden suchen wir eine japanischsprachige Spezialistin oder einen Spezialisten für Datenannotation: Annotation hilft KI dabei, die Welt zu verstehen. Als QA-Annotator:in wirst du eingeladen, an Online-Projekten teilzunehmen, wie z. B. dem Bewerten KI-erstellter Inhalte, dem Prüfen inhaltlicher Genauigkeit oder dem Vergleichen von Antworten – wenn Projekte verfügbar sind. Verantwortlichkeiten: - Sorgfältige Überprüfung bereitgestellter Daten (Text, Bilder oder Videos). - Kontrolle der Aufgaben, die vom Annotationsteam eingereicht werden, und Sicherstellung der Qualitätssicherung. - Kennzeichnung oder Klassifizierung von Inhalten gemäß Projektvorgaben. - Erkennen und Markieren von sachlich falschen, sensiblen, unangemessenen oder unklaren Inhalten.
AI Studio
100% Remoteanteil
Neu

Freiberuflicher Berater - KI-Schulung (portugiesischsprachig)

Für ein KI-Labor suchen wir portugiesischsprachige freiberufliche Berater, um ein KI-Modell (Large Language Model – LLM) in verschiedenen Bereichen zu trainieren: Du hilfst der KI, die Welt zu verstehen. Als Berater wirst du möglicherweise in Online-Projekten eingeladen, das Modell in deinem Fachgebiet zu trainieren. Diese flexible Rolle richtet sich sowohl an Expert:innen, die eine Teilzeitbeschäftigung (mindestens ein paar Stunden pro Woche) anstreben, als auch an diejenigen, die an Vollzeitchancen interessiert sind Verantwortlichkeiten: - Analysiere sorgfältig die vom KI bereitgestellten Daten in deinem Fachgebiet. - Verbessere das Modell in deinem Fachgebiet. - Überprüfe KI-Ergebnisse und stelle Qualitätssicherung/Qualitätskontrolle sicher. - Kennzeichne oder klassifiziere Inhalte gemäß den Projektvorgaben.
AI Lab
100% Remoteanteil
Neu

Freiberuflicher Datenannotator (Koreanisch) (m/w/d)

Für unseren Kunden suchen wir eine Data-Annotation-Spezialistin oder einen -Spezialisten mit Koreanischkenntnissen: Annotation hilft KI, die Welt zu verstehen. Als QA-Annotator/in nimmst du, wenn Projekte verfügbar sind, an Online-Projekten teil, z. B. bei der Bewertung von KI-generierten Inhalten, der Überprüfung der sachlichen Genauigkeit oder dem Vergleich von Antworten. Diese flexible Rolle richtet sich sowohl an Expertinnen und Experten, die eine Teilzeit-Tätigkeit (mindestens wenige Stunden pro Woche) suchen, als auch an Personen, die an Vollzeitmöglichkeiten interessiert sind. Verantwortlichkeiten: - Überprüfung der bereitgestellten Daten (Text, Bilder oder Videos). - Überprüfung der vom Annotationsteam eingereichten Aufgaben und Sicherstellung der Qualitätskontrolle/-sicherung. - Kennzeichnung oder Klassifizierung von Inhalten gemäß den Projektvorgaben. - Erkennen und Markieren von sachlich falschem, sensiblen, unangemessenen oder unklaren Material.
AI Studio
100% Remoteanteil

Freiberuflicher Maschinenbauingenieur (mit Python) - Qualitätssicherung (KI-Trainer)

Generative-KI-Modelle entwickeln sich derzeit sehr schnell und eines unserer Ziele ist es, sie in die Lage zu versetzen, spezialisierte Fragen zu beantworten und komplexe Denkprozesse zu meistern. Obwohl jedes Projekt einzigartig ist, könnten deine Aufgaben in der Regel sein: - Inhaltserstellung & Verfeinerung: Erstellen und Überarbeiten von Inhalten, um Genauigkeit und Relevanz in verschiedenen Bereichen der Physik zu gewährleisten, sowie Entwickeln von Referenzen und Beispielen für Aufgaben. - Gewinnung von Expert:innen: Prüfung der Qualifikationstests von Expert:innen, um ihre Kompetenz sicherzustellen. - Chat-Moderation: Unterstützung bei projektbezogenen Fragen anderer Expert:innen in Discord-Chats, insbesondere zu Projektleitfäden. - Überprüfung der Arbeit: Begutachtung und Bewertung von Aufgaben anderer Expert:innen, um deren Übereinstimmung mit den Projektleitfäden sicherzustellen. Konstruktives Feedback geben, fachbezogene Informationen prüfen und Inhalte bei Bedarf bearbeiten, um die Qualität zu verbessern.
AI Studio
100% Remoteanteil

Freiberuflicher Automotive-Ingenieur (mit Python) – Qualitätssicherung / KI-Trainer

Generative KI-Modelle verbessern sich sehr schnell, und eines unserer Ziele ist es, sie in die Lage zu versetzen, spezialisierte Fragen zu beantworten und komplexe Schlussfolgerungen zu ziehen. Obwohl jedes Projekt einzigartig ist, könnten deine Aufgaben typischerweise sein: - Inhaltserstellung & Verfeinerung: Erstellen und Überarbeiten von Inhalten, um Genauigkeit und Relevanz in verschiedenen Themen der Physik zu gewährleisten, und dabei Referenzen und Beispielsaufgaben entwickeln. - Expertenakquise: Bewertung von Qualifikationstests von Experten, um ihre Kompetenz sicherzustellen. - Chat-Moderation: Unterstützung bei projektbezogenen Fragen anderer Experten in Discord-Chats, besonders zu Projektleitlinien. - Prüfung der Arbeit: Durchsicht und Bewertung von Aufgaben anderer Experten, um sicherzustellen, dass sie den Projektleitlinien entsprechen. Konstruktives Feedback geben, fachliche Informationen prüfen und Inhalte bei Bedarf bearbeiten, um die Qualität zu verbessern.
AI Studio
100% Remoteanteil

Freiberuflicher Elektroingenieur (mit Python) - Qualitätssicherung / KI-Trainer

Generative KI-Modelle entwickeln sich sehr schnell, und eines unserer Ziele ist es, sie in die Lage zu versetzen, spezialisierte Fragen zu beantworten und komplexe Denkaufgaben zu meistern. Obwohl jedes Projekt einzigartig ist, könnten deine Aufgaben typischerweise sein: - Inhaltserstellung & -verfeinerung: Erstellen und Überarbeiten von Inhalten, um Genauigkeit und Relevanz in verschiedenen Themen der Physik sicherzustellen, und Entwickeln von Referenzen und Aufgabenbeispielen. - Expertenauswahl: Bewerten der Qualifikationstests von Experten, um deren Kompetenz sicherzustellen. - Chat-Moderation: Unterstützung, indem du projektbezogene Fragen anderer Experten in Discord-Chats beantwortest, insbesondere solche zu Projektleitfäden. - Aufgabenprüfung: Überprüfen und Bewerten von Aufgaben, die andere Experten abgeschlossen haben, um sicherzustellen, dass sie mit den Projektvorgaben übereinstimmen. Konstruktives Feedback geben, fachliche Informationen prüfen und Inhalte bei Bedarf bearbeiten, um die Qualität zu verbessern.
AI Studio
100% Remoteanteil
Neu

Freiberuflicher Rust-Entwickler (m/w/d)

Für ein AI-Lab suchen wir einen Rust-Entwickler, um ein KI-Modell (Large Language Model – LLM) zu trainieren. Du hilfst der KI, die Welt zu verstehen. Als Berater wirst du möglicherweise zu Online-Projekten eingeladen, um das Modell in deinem Fachbereich zu trainieren. Diese flexible Rolle eignet sich sowohl für Experten, die eine Teilzeittätigkeit (mindestens ein paar Stunden pro Woche) suchen, als auch für Interessierte an einer Vollzeitstelle. - Codegenerierung und Code-Review - Prompt-Bewertung und komplexe Datenannotation - Training und Evaluation von Large Language Models - Benchmarking und agentenbasierte Codeausführung in isolierten Umgebungen - Arbeit mit mehreren Programmiersprachen (Python, JavaScript/TypeScript, Rust, SQL usw.) - Anpassung von Richtlinien für neue Bereiche und Anwendungsfälle - Einhalten projekt­bezogener Richtlinien und Anforderungen - Zusammenarbeit mit Projektleitern, Solution Engineers und Supply Managern an komplexen oder experimentellen Projekten
AI Lab
100% Remoteanteil

Freiberuflicher Mathematik-Experte für KI-Modell-Training (m/w/d)

Ein KI-Labor sucht freiberufliche Mathematik-Experten, um KI-Modelle zu bewerten. Ziel des Projekts ist es, Leistung, Genauigkeit und Zuverlässigkeit von in mathematischen Bereichen eingesetzten KI-Modellen zu bewerten. Die Aufgabe umfasst die enge Zusammenarbeit mit dem Entwicklungsteam, um sicherzustellen, dass die Modelle Branchenstandards erfüllen und umsetzbare Erkenntnisse liefern. Dies ist eine remote Teilzeitstelle, die flexibel an deine Verfügbarkeit angepasst werden kann – von wenigen Stunden pro Woche bis hin zu Vollzeit. Hauptverantwortlichkeiten: - KI-Modelle für mathematische Anwendungen bewerten. - Modelloutputs analysieren und Feedback zur Verbesserung geben. - Mit dem Entwicklungsteam zusammenarbeiten, um die Einhaltung von Branchenstandards sicherzustellen. - Erkenntnisse und Empfehlungen zur Modelloptimierung dokumentieren. - Tests durchführen, um die Leistung und Zuverlässigkeit der Modelle zu prüfen.
AI Lab
100% Remoteanteil

Freiberufliche Chemie-Expertin / Chemie-Experte für KI-Modell-Training (m/w/d)

Ein KI-Labor sucht freiberufliche Chemie-Expertinnen oder Chemie-Experten, die KI-Modelle bewerten. Ziel des Projekts ist es, die Leistung, Genauigkeit und Zuverlässigkeit von KI-Modellen im chemischen Umfeld zu beurteilen. Die Rolle umfasst die enge Zusammenarbeit mit dem Entwicklungsteam, um sicherzustellen, dass die Modelle den Branchenstandards entsprechen und umsetzbare Erkenntnisse liefern. Dies ist eine Remote-Teilzeitstelle, die flexibel an deine Verfügbarkeit angepasst werden kann – von nur wenigen Stunden pro Woche bis hin zur Vollzeit. Wichtige Aufgaben: - KI-Modelle für chemische Anwendungen bewerten. - Modellausgaben analysieren und Feedback für Verbesserungen geben. - Mit dem Entwicklungsteam zusammenarbeiten, um die Einhaltung von Branchenstandards sicherzustellen. - Erkenntnisse und Empfehlungen zur Modelloptimierung dokumentieren. - Tests durchführen, um die Modellleistung und Zuverlässigkeit zu validieren.
AI Lab
100% Remoteanteil

Freiberuflicher Physikexperte für KI-Modelltraining (m/w/d)

Ein KI-Labor sucht freiberufliche Physikexpertinnen und -experten, um KI-Modelle zu bewerten. Ziel des Projekts ist es, die Leistung, Genauigkeit und Zuverlässigkeit von KI-Modellen in physikalischen Kontexten zu bewerten. Dabei arbeitest du eng mit dem Entwicklungsteam zusammen, um sicherzustellen, dass die Modelle den Branchenstandards entsprechen und umsetzbare Erkenntnisse liefern. Dies ist eine remote ausgeübte Teilzeitstelle, die flexibel an deine Verfügbarkeit angepasst werden kann – von nur wenigen Stunden pro Woche bis hin zu Vollzeit. Hauptaufgaben: - Modelle für physikalische Anwendungen bewerten. - Modellausgaben analysieren und Feedback zur Verbesserung geben. - Mit dem Entwicklungsteam zusammenarbeiten, um die Einhaltung von Branchenstandards sicherzustellen. - Ergebnisse und Empfehlungen zur Modelloptimierung dokumentieren. - Tests durchführen, um Leistung und Zuverlässigkeit der Modelle zu prüfen.
AI Lab
100% Remoteanteil

Freiberuflicher Elektroingenieur für KI-Modelltraining (m/w/d)

Ein Unternehmen sucht freiberufliche Elektroingenieure, um KI-Modelle zu bewerten. Ziel des Projekts ist es, die Leistung, Genauigkeit und Zuverlässigkeit von KI-Modellen in elektrotechnischen Anwendungen zu prüfen. Die Rolle umfasst die enge Zusammenarbeit mit dem Entwicklungsteam, um sicherzustellen, dass die Modelle den Industriestandards entsprechen und umsetzbare Erkenntnisse liefern. Wesentliche Aufgaben: - Bewertung von KI-Modellen für elektrotechnische Anwendungen. - Analyse der Modellausgaben und Feedback zur Verbesserung. - Zusammenarbeit mit dem Entwicklungsteam zur Einhaltung der Industriestandards. - Dokumentation der Ergebnisse und Empfehlungen zur Modelloptimierung. - Durchführung von Tests zur Validierung der Modellleistung und -zuverlässigkeit.
AI Lab
100% Remoteanteil

Freiberuflicher Maschinenbauingenieur für KI-Modell-Training (m/w/d)

Ein Unternehmen sucht freiberufliche Experten im Maschinenbau, um KI-Modelle zu evaluieren. Ziel des Projekts ist es, Leistung, Genauigkeit und Zuverlässigkeit von KI-Modellen in maschinenbaulichen Anwendungsbereichen zu bewerten. Die Rolle umfasst eine enge Zusammenarbeit mit dem Entwicklungsteam, um sicherzustellen, dass die Modelle den Industriestandards entsprechen und umsetzbare Erkenntnisse liefern. Hauptverantwortlichkeiten: - KI-Modelle für Anwendungen im Maschinenbau bewerten. - Modelergebnisse analysieren und Verbesserungsvorschläge geben. - Mit dem Entwicklungsteam zusammenarbeiten, um die Einhaltung der Industriestandards sicherzustellen. - Ergebnisse und Empfehlungen zur Modelloptimierung dokumentieren. - Tests durchführen, um die Leistung und Zuverlässigkeit der Modelle zu validieren.
AI Lab
100% Remoteanteil

Freiberufliche*r Bauingenieur*in für KI-Modell-Training (m/w/d)

Ein Unternehmen sucht freiberufliche Experten im Bauingenieurwesen, um KI-Modelle zu bewerten. Ziel des Projekts ist es, die Leistung, Genauigkeit und Zuverlässigkeit von KI-Modellen im Bereich des Bauingenieurwesens zu beurteilen. Die Rolle beinhaltet die enge Zusammenarbeit mit dem Entwicklungsteam, um sicherzustellen, dass die Modelle den Branchenstandards entsprechen und umsetzbare Erkenntnisse liefern. Key responsibilities: - KI-Modelle für bauingenieurtechnische Anwendungen bewerten. - Modelleergebnisse analysieren und Verbesserungsvorschläge geben. - Mit dem Entwicklungsteam zusammenarbeiten, um die Einhaltung von Branchenstandards zu gewährleisten. - Erkenntnisse und Empfehlungen zur Modelloptimierung dokumentieren. - Tests durchführen, um Modellleistung und -zuverlässigkeit zu validieren.
AI Lab
100% Remoteanteil
Neu

Freelance-Datenannotator (Chinesisch) (m/w/d)

Für ein AI-Studio suchen wir eine chinesischsprachige Fachkraft für Datenannotation: Annotation hilft der KI, die Welt zu verstehen. Als QA-Annotator*in wirst du eingeladen, an Online-Projekten teilzunehmen, wie z. B. die Bewertung von KI-generierten Inhalten, die Überprüfung der sachlichen Richtigkeit oder den Vergleich von Antworten – wenn Projekte verfügbar sind. Diese flexible Rolle eignet sich sowohl für Expert*innen, die eine Teilzeit-Tätigkeit (mindestens ein paar Stunden pro Woche) suchen, als auch für diejenigen, die Vollzeitoptionen bevorzugen. Aufgaben: - Sorgfältige Überprüfung der bereitgestellten Daten (Text, Bilder oder Videos). - Durchsicht der Aufgaben des Annotator-Teams und Sicherstellung der Qualität (QA/QC). - Kennzeichnung oder Klassifizierung von Inhalten gemäß Projektleitfäden. - Erkennen und Markieren von sachlich falschem, sensiblen, unangemessenem oder unklaren Material.
AI Studio
100% Remoteanteil

Leiter Elektronikentwicklung (m/w/d)

Ein Unternehmen sucht einen erfahrenen Head Of Electronic Development, der die fachliche und disziplinarische Führung eines Hardware- und Softwareentwicklungsteams übernimmt. Ziel des Projekts ist es, die Qualität der technischen Arbeitsprodukte sicherzustellen, strategische Vorentwicklungen zu planen und durchzuführen sowie bestehende Prozesse und Systeme zu optimieren. Die Rolle umfasst die Mitarbeit im agilen Projektmanagement, die Kostenermittlung und Angebotserstellung sowie die Team- und Kapazitätsplanung. Der Kandidat wird die fachliche Weiterentwicklung der Teammitglieder verantworten und eng mit Kunden und Lieferanten kommunizieren. Hauptaufgaben: - Fachliche und disziplinarische Führung eines HW+SW Entwicklungsteams - Mitarbeit im agilen Projektmanagement, Kostenermittlung und Angebotserstellung Team- und Kapazitätsplanung - Fachliche Weiterentwicklung der Teammitglieder - Verantwortung für die Qualität der formalen und technischen Arbeitsprodukte - Kalkulation und Preisermittlung von Produkten, insbesondere PCBA - Planung und Durchführung von strategischen Vorentwicklungen - Kommunikation mit Kunden und Lieferanten - Optimierung bestehender Prozesse und Systeme
Produktion
Frankfurt, Deutschland
100% Remoteanteil
Neu

Berater Unternehmensfinanzierung / M&A-Berater / Finanzen

Für ein AI-Labor suchen wir freiberufliche Finanzexperten, die ein KI-Modell (Large Language Model – LLM) in verschiedenen Bereichen trainieren: Sie helfen der KI, die Welt zu verstehen. Als Berater können Sie zu Online-Projekten eingeladen werden, um das Modell in Ihrem Fachgebiet zu schulen. Diese flexible Rolle richtet sich sowohl an Experten, die eine Teilzeitanstellung (mindestens ein paar Stunden pro Woche) suchen, als auch an solche, die an Vollzeitmöglichkeiten interessiert sind. Unterstützung bei einer oder mehreren der folgenden Aufgaben: - Finanzprognosen - Risikomanagement - Internationale Finanzen - Finanztechnik - Volkswirtschaft, Unternehmensfinanzierung - Investment Management, Mathematische Finanzen - Öffentliche Finanzen, Verhaltensfinanzen - Finanzmärkte und Institutionen - Finanztechnologie - Algorithmischer Handel
AI Lab
100% Remoteanteil
Neu

Freiberuflicher Kotlin-Entwickler (m/w/d)

Für ein AI-Labor suchen wir einen Kotlin-Entwickler, um ein AI-Modell (Large Language Model – LLM) zu trainieren. Du hilfst der KI, die Welt zu verstehen. Als Berater:in wirst du vielleicht zu Online-Projekten eingeladen, um das Modell in deinem Fachbereich zu trainieren. Diese flexible Rolle bietet sowohl Expert:innen, die eine Teilzeit-Tätigkeit (mindestens ein paar Stunden pro Woche) suchen, als auch diejenigen, die an Vollzeitangeboten interessiert sind. - Code-Generierung und Code-Review - Prompt-Bewertung und komplexe Datenannotation - Training und Evaluation von Large Language Models - Benchmarking und agentenbasierte Code-Ausführung in sandboxed Umgebungen - Arbeit mit mehreren Programmiersprachen - Anpassung von Richtlinien für neue Bereiche und Anwendungsfälle - Einhaltung projektspezifischer Rubriken und Anforderungen - Zusammenarbeit mit Projektleitungen, Solution Engineers und Supply Managern in komplexen oder experimentellen Projekten
AI Lab
100% Remoteanteil
Neu

Freelance Ruby-Entwickler (m/w/d)

Für ein AI Lab suchen wir Ruby-Entwickler, um ein KI-Modell (Large Language Model - LLM) zu trainieren. Du hilfst der KI, die Welt zu verstehen. Als Berater wirst du eventuell eingeladen, an Online-Projekten teilzunehmen, um das Modell in deinem Fachgebiet zu trainieren. Diese flexible Rolle richtet sich sowohl an Experten, die eine Teilzeit-Tätigkeit (mindestens wenige Stunden/Woche) suchen, als auch an diejenigen, die Vollzeitmöglichkeiten bevorzugen. - Code-Generierung und Code-Review - Prompt-Bewertung und komplexe Datenanotierung - Training und Evaluation großer Sprachmodelle - Benchmarking und agentenbasierte Code-Ausführung in abgesicherten Umgebungen - Arbeiten mit mehreren Programmiersprachen (Python, JavaScript/TypeScript, Rust, SQL usw.) - Anpassung von Richtlinien für neue Bereiche und Anwendungsfälle - Zusammenarbeit mit Projektleitern, Solution Engineers und Supply Managern an komplexen oder experimentellen Projekten
AI Lab
100% Remoteanteil

Frontend developer to HR platform with Angular experience

Reach out to us if you are interested in working with us on the project.
FRATCH
München
90% Remoteanteil
Registriere dich um Zugang zu weiteren spannenden Projekten zu erhalten, die deinen Fähigkeiten und Vorlieben entsprechen!

KI-Agent-Bewertungsanalyst (m/w/d)

Melde dich an, um die Anzahl der Bewerber zu sehen
Industrie
Informationstechnologie (IT)
Bereich
Qualitätssicherung

Projekt Info

  • Dauer
    10.11.2025 - 07.03.2026
  • Auslastung
    Ab 95%
  • Tagessatz
    200 - 320€
  • Standort
    Amsterdam, Niederlande
  • Sprachen
    Wichtig:
    • Deutsch
      (Verhandlungssicher)
    Wünschenswert:
    • Englisch
      (Verhandlungssicher)
  • Remoteanteil
    Ab 95%

Beschreibung

Wir suchen einen freiberuflichen Bewertungsanalysten für Agenten, der die Verantwortung für Qualität, Struktur und Erkenntnisse im Projekt übernimmt. Diese Rolle geht weit über reine Aufgabenprüfung hinaus – es geht um kritisches Denken, systematische Analyse und darum, Klarheit, Zuverlässigkeit und Konsistenz im großen Maßstab sicherzustellen. Du arbeitest sowohl als praktischer Evaluator als auch als Analyst und arbeitest dabei mit Fachexperten, Delivery Managern und Ingenieuren zusammen. Neben der Überprüfung der Ergebnisse sollst du das „Warum“ hinter der Arbeit verstehen, logische Lücken oder Inkonsistenzen erkennen und sinnvolle Verbesserungen vorschlagen.

Dies ist eine flexible, wirkungsorientierte Rolle, in der du Raum hast, dich weiterzuentwickeln, Ideen einzubringen und mitzugestalten, wie Evaluation und Qualität im Projekt skaliert werden.

Diese Rolle eignet sich besonders für:

Analysten, Forscher oder Berater mit starken Strukturierungs- und Argumentationsfähigkeiten Junior-Produktmanager oder Strategen, die neugierig auf KI und Evaluation sind Schlaue Problemlöser (Studierende oder Berufseinsteiger), die gerne in Logik, Systeme und Randfälle eintauchen

Eine Programmerfahrung ist nicht nötig. Entscheidend sind Neugier, intellektuelle Strenge und die Fähigkeit, komplexe Strukturen präzise zu bewerten.

Was du tun wirst

  • Eigenverantwortliche Betreuung der QA-Pipeline für Agentenbewertungsaufgaben;
  • Überprüfung und Validierung von Aufgaben und Goldstandard-Pfaden, die von Szenario-Autoren und Experten erstellt wurden;
  • Erkennen logischer Inkonsistenzen, vager Anforderungen, versteckter Risiken und unrealistischer Annahmen;
  • Strukturierte Rückmeldungen geben und Qualität zwischen den Beteiligten abstimmen;
  • Neue QA-Teammitglieder schulen, onboarden und betreuen;
  • Zusammenarbeit mit Fachexperten, Delivery Managern und Ingenieuren zur Verbesserung von Testklarheit und Abdeckung;
  • Pflege und Optimierung von QA-Checklisten, SOPs und Prüfrichtlinien;
  • Mitwirkung bei Testplanung, Priorisierung und Qualitätsbenchmarks;
  • Eigeninitiative zeigen und neue Ansätze, Werkzeuge und Prozesse vorschlagen, die Validierung und Analyse skalieren

Anforderungen

Was du wissen solltest / können musst

  • Ausgeprägte analytische und kritische Denkfähigkeiten;
  • Auge fürs Detail und Zuverlässigkeit – auf deine Arbeit kann man ohne Nachprüfen vertrauen;
  • Erfahrung in manueller QA, Szenario-Validierung oder ähnlicher analytischer Arbeit;
  • Sicherer Umgang mit strukturierten Formaten (JSON/YAML);
  • Klare schriftliche Kommunikation und Dokumentationsfähigkeiten;
  • Fähigkeit, konstruktives Feedback zu geben und andere anzuleiten;
  • Fähigkeit, mit einer breiten Palette von Stakeholdern zu arbeiten: von Ingenieuren bis hin zu Direktoren/VPs.

Nice to have

  • Erfahrung im szenariobasierten Testen, Testdesign oder in Annotation-Workflows;
  • Erfahrung mit KI/LLM-Evaluation, Prompt-Validierung oder Agenten-Verhaltenstests;
  • gewisse technische Unabhängigkeit (z.B. Python-Kenntnisse);
  • Vertrautheit mit MCP / werkzeuggestützter Aufgabenausführung;
  • Erfahrung in interdisziplinären Teams aus Produkt, Delivery und Technik.

Wer du bist

  • Detailverliebt, aber auch in der Lage, das große Ganze zu sehen;
  • Proaktiv, eigenständig und übernimmst echte Verantwortung für deine Arbeit;
  • Starker Kommunikator, der komplexe Erkenntnisse in umsetzbare Einsichten verwandeln kann;
  • Flexibel und motiviert, in verschiedenen Aufgaben und Projekten mitzuarbeiten;
  • Überzeugt, dass Qualität nicht nur aus der Kontrolle von Arbeit besteht, sondern das ganze Produkt besser macht.