Projektdetail

Empfohlene Projekte

Neu

KI-Agenten-Bewertungsanalyst

Für ein AI-Lab suchen wir einen KI-Agenten-Bewertungsanalysten, um ein KI-Modell (Large Language Model – LLM) zu trainieren. Du hilfst der KI, die Welt zu verstehen. Als Berater*in wirst du möglicherweise eingeladen, an Online-Projekten teilzunehmen, um das Modell in deinem Fachgebiet zu trainieren. Diese flexible Rolle eignet sich sowohl für Expert*innen, die eine Teilzeitbeschäftigung (mindestens einige Stunden pro Woche) suchen, als auch für diejenigen, die an Vollzeitmöglichkeiten interessiert sind - Bewertung von Evaluierungsaufgaben und Szenarien hinsichtlich Logik, Vollständigkeit und Realismus. - Identifizierung von Inkonsistenzen, fehlenden Annahmen oder unklaren Entscheidungspunkten. - Mithilfe bei der Definition klarer erwarteter Verhaltensweisen (Goldstandards) für KI-Agenten. - Markierung von Ursache-Wirkungs-Beziehungen, Denkpfaden und plausiblen Alternativen. - Durchdenken komplexer Systeme und Richtlinien wie ein Mensch, um sicherzustellen, dass Agenten richtig getestet werden. - Enge Zusammenarbeit mit QA, Autor*innen oder Entwickler*innen, um Verbesserungen oder die Abdeckung von Randfällen vorzuschlagen.
AI Lab
100% Remoteanteil
Neu

Freiberuflicher Kotlin-Entwickler (m/w/d)

Für ein AI-Labor suchen wir einen Kotlin-Entwickler, um ein AI-Modell (Large Language Model – LLM) zu trainieren. Du hilfst der KI, die Welt zu verstehen. Als Berater:in wirst du vielleicht zu Online-Projekten eingeladen, um das Modell in deinem Fachbereich zu trainieren. Diese flexible Rolle bietet sowohl Expert:innen, die eine Teilzeit-Tätigkeit (mindestens ein paar Stunden pro Woche) suchen, als auch diejenigen, die an Vollzeitangeboten interessiert sind. - Code-Generierung und Code-Review - Prompt-Bewertung und komplexe Datenannotation - Training und Evaluation von Large Language Models - Benchmarking und agentenbasierte Code-Ausführung in sandboxed Umgebungen - Arbeit mit mehreren Programmiersprachen - Anpassung von Richtlinien für neue Bereiche und Anwendungsfälle - Einhaltung projektspezifischer Rubriken und Anforderungen - Zusammenarbeit mit Projektleitungen, Solution Engineers und Supply Managern in komplexen oder experimentellen Projekten
AI Lab
100% Remoteanteil
Neu

Freiberuflicher Berater - KI-Schulung (portugiesischsprachig)

Für ein KI-Labor suchen wir portugiesischsprachige freiberufliche Berater, um ein KI-Modell (Large Language Model – LLM) in verschiedenen Bereichen zu trainieren: Du hilfst der KI, die Welt zu verstehen. Als Berater wirst du möglicherweise in Online-Projekten eingeladen, das Modell in deinem Fachgebiet zu trainieren. Diese flexible Rolle richtet sich sowohl an Expert:innen, die eine Teilzeitbeschäftigung (mindestens ein paar Stunden pro Woche) anstreben, als auch an diejenigen, die an Vollzeitchancen interessiert sind Verantwortlichkeiten: - Analysiere sorgfältig die vom KI bereitgestellten Daten in deinem Fachgebiet. - Verbessere das Modell in deinem Fachgebiet. - Überprüfe KI-Ergebnisse und stelle Qualitätssicherung/Qualitätskontrolle sicher. - Kennzeichne oder klassifiziere Inhalte gemäß den Projektvorgaben.
AI Lab
100% Remoteanteil
Neu

Freiberuflicher Rust-Entwickler (m/w/d)

Für ein AI-Lab suchen wir einen Rust-Entwickler, um ein KI-Modell (Large Language Model – LLM) zu trainieren. Du hilfst der KI, die Welt zu verstehen. Als Berater wirst du möglicherweise zu Online-Projekten eingeladen, um das Modell in deinem Fachbereich zu trainieren. Diese flexible Rolle eignet sich sowohl für Experten, die eine Teilzeittätigkeit (mindestens ein paar Stunden pro Woche) suchen, als auch für Interessierte an einer Vollzeitstelle. - Codegenerierung und Code-Review - Prompt-Bewertung und komplexe Datenannotation - Training und Evaluation von Large Language Models - Benchmarking und agentenbasierte Codeausführung in isolierten Umgebungen - Arbeit mit mehreren Programmiersprachen (Python, JavaScript/TypeScript, Rust, SQL usw.) - Anpassung von Richtlinien für neue Bereiche und Anwendungsfälle - Einhalten projekt­bezogener Richtlinien und Anforderungen - Zusammenarbeit mit Projektleitern, Solution Engineers und Supply Managern an komplexen oder experimentellen Projekten
AI Lab
100% Remoteanteil

Freiberuflicher Maschinenbauingenieur (mit Python) - Qualitätssicherung (KI-Trainer)

Generative-KI-Modelle entwickeln sich derzeit sehr schnell und eines unserer Ziele ist es, sie in die Lage zu versetzen, spezialisierte Fragen zu beantworten und komplexe Denkprozesse zu meistern. Obwohl jedes Projekt einzigartig ist, könnten deine Aufgaben in der Regel sein: - Inhaltserstellung & Verfeinerung: Erstellen und Überarbeiten von Inhalten, um Genauigkeit und Relevanz in verschiedenen Bereichen der Physik zu gewährleisten, sowie Entwickeln von Referenzen und Beispielen für Aufgaben. - Gewinnung von Expert:innen: Prüfung der Qualifikationstests von Expert:innen, um ihre Kompetenz sicherzustellen. - Chat-Moderation: Unterstützung bei projektbezogenen Fragen anderer Expert:innen in Discord-Chats, insbesondere zu Projektleitfäden. - Überprüfung der Arbeit: Begutachtung und Bewertung von Aufgaben anderer Expert:innen, um deren Übereinstimmung mit den Projektleitfäden sicherzustellen. Konstruktives Feedback geben, fachbezogene Informationen prüfen und Inhalte bei Bedarf bearbeiten, um die Qualität zu verbessern.
AI Studio
100% Remoteanteil

Freiberuflicher Automotive-Ingenieur (mit Python) – Qualitätssicherung / KI-Trainer

Generative KI-Modelle verbessern sich sehr schnell, und eines unserer Ziele ist es, sie in die Lage zu versetzen, spezialisierte Fragen zu beantworten und komplexe Schlussfolgerungen zu ziehen. Obwohl jedes Projekt einzigartig ist, könnten deine Aufgaben typischerweise sein: - Inhaltserstellung & Verfeinerung: Erstellen und Überarbeiten von Inhalten, um Genauigkeit und Relevanz in verschiedenen Themen der Physik zu gewährleisten, und dabei Referenzen und Beispielsaufgaben entwickeln. - Expertenakquise: Bewertung von Qualifikationstests von Experten, um ihre Kompetenz sicherzustellen. - Chat-Moderation: Unterstützung bei projektbezogenen Fragen anderer Experten in Discord-Chats, besonders zu Projektleitlinien. - Prüfung der Arbeit: Durchsicht und Bewertung von Aufgaben anderer Experten, um sicherzustellen, dass sie den Projektleitlinien entsprechen. Konstruktives Feedback geben, fachliche Informationen prüfen und Inhalte bei Bedarf bearbeiten, um die Qualität zu verbessern.
AI Studio
100% Remoteanteil

Freiberuflicher Elektroingenieur (mit Python) - Qualitätssicherung / KI-Trainer

Generative KI-Modelle entwickeln sich sehr schnell, und eines unserer Ziele ist es, sie in die Lage zu versetzen, spezialisierte Fragen zu beantworten und komplexe Denkaufgaben zu meistern. Obwohl jedes Projekt einzigartig ist, könnten deine Aufgaben typischerweise sein: - Inhaltserstellung & -verfeinerung: Erstellen und Überarbeiten von Inhalten, um Genauigkeit und Relevanz in verschiedenen Themen der Physik sicherzustellen, und Entwickeln von Referenzen und Aufgabenbeispielen. - Expertenauswahl: Bewerten der Qualifikationstests von Experten, um deren Kompetenz sicherzustellen. - Chat-Moderation: Unterstützung, indem du projektbezogene Fragen anderer Experten in Discord-Chats beantwortest, insbesondere solche zu Projektleitfäden. - Aufgabenprüfung: Überprüfen und Bewerten von Aufgaben, die andere Experten abgeschlossen haben, um sicherzustellen, dass sie mit den Projektvorgaben übereinstimmen. Konstruktives Feedback geben, fachliche Informationen prüfen und Inhalte bei Bedarf bearbeiten, um die Qualität zu verbessern.
AI Studio
100% Remoteanteil

Freiberuflicher Mathematik-Experte für KI-Modell-Training (m/w/d)

Ein KI-Labor sucht freiberufliche Mathematik-Experten, um KI-Modelle zu bewerten. Ziel des Projekts ist es, Leistung, Genauigkeit und Zuverlässigkeit von in mathematischen Bereichen eingesetzten KI-Modellen zu bewerten. Die Aufgabe umfasst die enge Zusammenarbeit mit dem Entwicklungsteam, um sicherzustellen, dass die Modelle Branchenstandards erfüllen und umsetzbare Erkenntnisse liefern. Dies ist eine remote Teilzeitstelle, die flexibel an deine Verfügbarkeit angepasst werden kann – von wenigen Stunden pro Woche bis hin zu Vollzeit. Hauptverantwortlichkeiten: - KI-Modelle für mathematische Anwendungen bewerten. - Modelloutputs analysieren und Feedback zur Verbesserung geben. - Mit dem Entwicklungsteam zusammenarbeiten, um die Einhaltung von Branchenstandards sicherzustellen. - Erkenntnisse und Empfehlungen zur Modelloptimierung dokumentieren. - Tests durchführen, um die Leistung und Zuverlässigkeit der Modelle zu prüfen.
AI Lab
100% Remoteanteil

Freiberufliche Chemie-Expertin / Chemie-Experte für KI-Modell-Training (m/w/d)

Ein KI-Labor sucht freiberufliche Chemie-Expertinnen oder Chemie-Experten, die KI-Modelle bewerten. Ziel des Projekts ist es, die Leistung, Genauigkeit und Zuverlässigkeit von KI-Modellen im chemischen Umfeld zu beurteilen. Die Rolle umfasst die enge Zusammenarbeit mit dem Entwicklungsteam, um sicherzustellen, dass die Modelle den Branchenstandards entsprechen und umsetzbare Erkenntnisse liefern. Dies ist eine Remote-Teilzeitstelle, die flexibel an deine Verfügbarkeit angepasst werden kann – von nur wenigen Stunden pro Woche bis hin zur Vollzeit. Wichtige Aufgaben: - KI-Modelle für chemische Anwendungen bewerten. - Modellausgaben analysieren und Feedback für Verbesserungen geben. - Mit dem Entwicklungsteam zusammenarbeiten, um die Einhaltung von Branchenstandards sicherzustellen. - Erkenntnisse und Empfehlungen zur Modelloptimierung dokumentieren. - Tests durchführen, um die Modellleistung und Zuverlässigkeit zu validieren.
AI Lab
100% Remoteanteil

Freiberuflicher Physikexperte für KI-Modelltraining (m/w/d)

Ein KI-Labor sucht freiberufliche Physikexpertinnen und -experten, um KI-Modelle zu bewerten. Ziel des Projekts ist es, die Leistung, Genauigkeit und Zuverlässigkeit von KI-Modellen in physikalischen Kontexten zu bewerten. Dabei arbeitest du eng mit dem Entwicklungsteam zusammen, um sicherzustellen, dass die Modelle den Branchenstandards entsprechen und umsetzbare Erkenntnisse liefern. Dies ist eine remote ausgeübte Teilzeitstelle, die flexibel an deine Verfügbarkeit angepasst werden kann – von nur wenigen Stunden pro Woche bis hin zu Vollzeit. Hauptaufgaben: - Modelle für physikalische Anwendungen bewerten. - Modellausgaben analysieren und Feedback zur Verbesserung geben. - Mit dem Entwicklungsteam zusammenarbeiten, um die Einhaltung von Branchenstandards sicherzustellen. - Ergebnisse und Empfehlungen zur Modelloptimierung dokumentieren. - Tests durchführen, um Leistung und Zuverlässigkeit der Modelle zu prüfen.
AI Lab
100% Remoteanteil
Neu

Freelance Ruby-Entwickler (m/w/d)

Für ein AI Lab suchen wir Ruby-Entwickler, um ein KI-Modell (Large Language Model - LLM) zu trainieren. Du hilfst der KI, die Welt zu verstehen. Als Berater wirst du eventuell eingeladen, an Online-Projekten teilzunehmen, um das Modell in deinem Fachgebiet zu trainieren. Diese flexible Rolle richtet sich sowohl an Experten, die eine Teilzeit-Tätigkeit (mindestens wenige Stunden/Woche) suchen, als auch an diejenigen, die Vollzeitmöglichkeiten bevorzugen. - Code-Generierung und Code-Review - Prompt-Bewertung und komplexe Datenanotierung - Training und Evaluation großer Sprachmodelle - Benchmarking und agentenbasierte Code-Ausführung in abgesicherten Umgebungen - Arbeiten mit mehreren Programmiersprachen (Python, JavaScript/TypeScript, Rust, SQL usw.) - Anpassung von Richtlinien für neue Bereiche und Anwendungsfälle - Zusammenarbeit mit Projektleitern, Solution Engineers und Supply Managern an komplexen oder experimentellen Projekten
AI Lab
100% Remoteanteil

Freiberuflicher Elektroingenieur für KI-Modelltraining (m/w/d)

Ein Unternehmen sucht freiberufliche Elektroingenieure, um KI-Modelle zu bewerten. Ziel des Projekts ist es, die Leistung, Genauigkeit und Zuverlässigkeit von KI-Modellen in elektrotechnischen Anwendungen zu prüfen. Die Rolle umfasst die enge Zusammenarbeit mit dem Entwicklungsteam, um sicherzustellen, dass die Modelle den Industriestandards entsprechen und umsetzbare Erkenntnisse liefern. Wesentliche Aufgaben: - Bewertung von KI-Modellen für elektrotechnische Anwendungen. - Analyse der Modellausgaben und Feedback zur Verbesserung. - Zusammenarbeit mit dem Entwicklungsteam zur Einhaltung der Industriestandards. - Dokumentation der Ergebnisse und Empfehlungen zur Modelloptimierung. - Durchführung von Tests zur Validierung der Modellleistung und -zuverlässigkeit.
AI Lab
100% Remoteanteil

Freiberuflicher Maschinenbauingenieur für KI-Modell-Training (m/w/d)

Ein Unternehmen sucht freiberufliche Experten im Maschinenbau, um KI-Modelle zu evaluieren. Ziel des Projekts ist es, Leistung, Genauigkeit und Zuverlässigkeit von KI-Modellen in maschinenbaulichen Anwendungsbereichen zu bewerten. Die Rolle umfasst eine enge Zusammenarbeit mit dem Entwicklungsteam, um sicherzustellen, dass die Modelle den Industriestandards entsprechen und umsetzbare Erkenntnisse liefern. Hauptverantwortlichkeiten: - KI-Modelle für Anwendungen im Maschinenbau bewerten. - Modelergebnisse analysieren und Verbesserungsvorschläge geben. - Mit dem Entwicklungsteam zusammenarbeiten, um die Einhaltung der Industriestandards sicherzustellen. - Ergebnisse und Empfehlungen zur Modelloptimierung dokumentieren. - Tests durchführen, um die Leistung und Zuverlässigkeit der Modelle zu validieren.
AI Lab
100% Remoteanteil

Freiberufliche*r Bauingenieur*in für KI-Modell-Training (m/w/d)

Ein Unternehmen sucht freiberufliche Experten im Bauingenieurwesen, um KI-Modelle zu bewerten. Ziel des Projekts ist es, die Leistung, Genauigkeit und Zuverlässigkeit von KI-Modellen im Bereich des Bauingenieurwesens zu beurteilen. Die Rolle beinhaltet die enge Zusammenarbeit mit dem Entwicklungsteam, um sicherzustellen, dass die Modelle den Branchenstandards entsprechen und umsetzbare Erkenntnisse liefern. Key responsibilities: - KI-Modelle für bauingenieurtechnische Anwendungen bewerten. - Modelleergebnisse analysieren und Verbesserungsvorschläge geben. - Mit dem Entwicklungsteam zusammenarbeiten, um die Einhaltung von Branchenstandards zu gewährleisten. - Erkenntnisse und Empfehlungen zur Modelloptimierung dokumentieren. - Tests durchführen, um Modellleistung und -zuverlässigkeit zu validieren.
AI Lab
100% Remoteanteil

KI-Agent-Bewertungsanalyst (m/w/d)

Wir suchen einen freiberuflichen Bewertungsanalysten für Agenten, der die Verantwortung für Qualität, Struktur und Erkenntnisse im Projekt übernimmt. Diese Rolle geht weit über reine Aufgabenprüfung hinaus – es geht um kritisches Denken, systematische Analyse und darum, Klarheit, Zuverlässigkeit und Konsistenz im großen Maßstab sicherzustellen. Du arbeitest sowohl als praktischer Evaluator als auch als Analyst und arbeitest dabei mit Fachexperten, Delivery Managern und Ingenieuren zusammen. Neben der Überprüfung der Ergebnisse sollst du das „Warum“ hinter der Arbeit verstehen, logische Lücken oder Inkonsistenzen erkennen und sinnvolle Verbesserungen vorschlagen. Dies ist eine flexible, wirkungsorientierte Rolle, in der du Raum hast, dich weiterzuentwickeln, Ideen einzubringen und mitzugestalten, wie Evaluation und Qualität im Projekt skaliert werden. Diese Rolle eignet sich besonders für: Analysten, Forscher oder Berater mit starken Strukturierungs- und Argumentationsfähigkeiten Junior-Produktmanager oder Strategen, die neugierig auf KI und Evaluation sind Schlaue Problemlöser (Studierende oder Berufseinsteiger), die gerne in Logik, Systeme und Randfälle eintauchen Eine Programmerfahrung ist nicht nötig. Entscheidend sind Neugier, intellektuelle Strenge und die Fähigkeit, komplexe Strukturen präzise zu bewerten. Was du tun wirst - Eigenverantwortliche Betreuung der QA-Pipeline für Agentenbewertungsaufgaben; - Überprüfung und Validierung von Aufgaben und Goldstandard-Pfaden, die von Szenario-Autoren und Experten erstellt wurden; - Erkennen logischer Inkonsistenzen, vager Anforderungen, versteckter Risiken und unrealistischer Annahmen; - Strukturierte Rückmeldungen geben und Qualität zwischen den Beteiligten abstimmen; - Neue QA-Teammitglieder schulen, onboarden und betreuen; - Zusammenarbeit mit Fachexperten, Delivery Managern und Ingenieuren zur Verbesserung von Testklarheit und Abdeckung; - Pflege und Optimierung von QA-Checklisten, SOPs und Prüfrichtlinien; - Mitwirkung bei Testplanung, Priorisierung und Qualitätsbenchmarks; - Eigeninitiative zeigen und neue Ansätze, Werkzeuge und Prozesse vorschlagen, die Validierung und Analyse skalieren
AI Studio
Amsterdam, Niederlande
100% Remoteanteil
Neu

Freelance-Datenannotator (Chinesisch) (m/w/d)

Für ein AI-Studio suchen wir eine chinesischsprachige Fachkraft für Datenannotation: Annotation hilft der KI, die Welt zu verstehen. Als QA-Annotator*in wirst du eingeladen, an Online-Projekten teilzunehmen, wie z. B. die Bewertung von KI-generierten Inhalten, die Überprüfung der sachlichen Richtigkeit oder den Vergleich von Antworten – wenn Projekte verfügbar sind. Diese flexible Rolle eignet sich sowohl für Expert*innen, die eine Teilzeit-Tätigkeit (mindestens ein paar Stunden pro Woche) suchen, als auch für diejenigen, die Vollzeitoptionen bevorzugen. Aufgaben: - Sorgfältige Überprüfung der bereitgestellten Daten (Text, Bilder oder Videos). - Durchsicht der Aufgaben des Annotator-Teams und Sicherstellung der Qualität (QA/QC). - Kennzeichnung oder Klassifizierung von Inhalten gemäß Projektleitfäden. - Erkennen und Markieren von sachlich falschem, sensiblen, unangemessenem oder unklaren Material.
AI Studio
100% Remoteanteil
Neu

Freiberuflicher Datenannotator (Koreanisch) (m/w/d)

Für unseren Kunden suchen wir eine Data-Annotation-Spezialistin oder einen -Spezialisten mit Koreanischkenntnissen: Annotation hilft KI, die Welt zu verstehen. Als QA-Annotator/in nimmst du, wenn Projekte verfügbar sind, an Online-Projekten teil, z. B. bei der Bewertung von KI-generierten Inhalten, der Überprüfung der sachlichen Genauigkeit oder dem Vergleich von Antworten. Diese flexible Rolle richtet sich sowohl an Expertinnen und Experten, die eine Teilzeit-Tätigkeit (mindestens wenige Stunden pro Woche) suchen, als auch an Personen, die an Vollzeitmöglichkeiten interessiert sind. Verantwortlichkeiten: - Überprüfung der bereitgestellten Daten (Text, Bilder oder Videos). - Überprüfung der vom Annotationsteam eingereichten Aufgaben und Sicherstellung der Qualitätskontrolle/-sicherung. - Kennzeichnung oder Klassifizierung von Inhalten gemäß den Projektvorgaben. - Erkennen und Markieren von sachlich falschem, sensiblen, unangemessenen oder unklaren Material.
AI Studio
100% Remoteanteil
Neu

Freelance Datenannotator QA (Deutsch)

Für unseren Kunden suchen wir einen deutschsprachigen Spezialisten für Datenannotationen: Annotation hilft KI, die Welt zu verstehen. Als QA-Annotator kannst du eingeladen werden, an Online-Projekten teilzunehmen, z. B. KI-generierte Inhalte zu bewerten, die faktische Genauigkeit zu prüfen oder Antworten zu vergleichen – wenn Projekte verfügbar sind. Verantwortlichkeiten: - Gezielte Überprüfung bereitgestellter Daten (Text, Bilder oder Videos). - Kontrolle der vom Annotationsteam eingereichten Aufgaben und Sicherstellung der Qualitätssicherung/-kontrolle. - Kennzeichnung oder Klassifizierung von Inhalten gemäß Projektleitfäden. - Erkennen und Markieren faktisch falscher, sensibler, unangemessener oder unklarer Inhalte.
AI Studio
100% Remoteanteil

Freiberuflicher QA-Annotator (Japanisch)

Für unseren Kunden suchen wir eine japanischsprachige Spezialistin oder einen Spezialisten für Datenannotation: Annotation hilft KI dabei, die Welt zu verstehen. Als QA-Annotator:in wirst du eingeladen, an Online-Projekten teilzunehmen, wie z. B. dem Bewerten KI-erstellter Inhalte, dem Prüfen inhaltlicher Genauigkeit oder dem Vergleichen von Antworten – wenn Projekte verfügbar sind. Verantwortlichkeiten: - Sorgfältige Überprüfung bereitgestellter Daten (Text, Bilder oder Videos). - Kontrolle der Aufgaben, die vom Annotationsteam eingereicht werden, und Sicherstellung der Qualitätssicherung. - Kennzeichnung oder Klassifizierung von Inhalten gemäß Projektvorgaben. - Erkennen und Markieren von sachlich falschen, sensiblen, unangemessenen oder unklaren Inhalten.
AI Studio
100% Remoteanteil

Freiberufliche/r Biologie-Experte/in für KI-Modelltraining (m/w/d)

Ein KI-Labor sucht freiberufliche Biologie-Expertinnen und -Experten zur Bewertung von KI-Modellen. Ziel des Projekts ist es, die Leistung, Genauigkeit und Zuverlässigkeit von KI-Modellen in biologischen Anwendungsbereichen (alle Bereiche) zu beurteilen. Die Rolle umfasst die enge Zusammenarbeit mit dem Entwicklungsteam, um sicherzustellen, dass die Modelle Branchenstandards entsprechen und umsetzbare Erkenntnisse liefern. Dies ist eine flexible, remote Teilzeitstelle, die sich nach deiner Verfügbarkeit richten lässt – von nur wenigen Stunden pro Woche bis hin zu Vollzeit. Wesentliche Aufgaben: - Bewertung von KI-Modellen für biologische Anwendungen. - Analyse der Modellausgaben und Rückmeldung zur Verbesserung. - Zusammenarbeit mit dem Entwicklungsteam, um die Einhaltung der Branchenstandards sicherzustellen. - Dokumentation der Ergebnisse und Empfehlungen zur Modelloptimierung. - Durchführung von Tests zur Validierung der Modellleistung und -zuverlässigkeit.
AI Lab
100% Remoteanteil
Neu

Freiberuflicher Java-Entwickler (m/w/d)

Für ein KI-Labor suchen wir einen Java-Entwickler, um ein KI-Modell (Large Language Model – LLM) zu trainieren. Sie helfen der KI, die Welt zu verstehen. Als Berater können Sie eingeladen werden, an Online-Projekten teilzunehmen, um das Modell in Ihrem Fachgebiet zu trainieren. Diese flexible Rolle richtet sich sowohl an Experten, die eine Teilzeit-Tätigkeit (mindestens wenige Stunden pro Woche) suchen, als auch an alle, die an einer Vollzeitstelle interessiert sind. - Code-Generierung und Code-Review - Prompt-Bewertung und komplexe Datenannotationen - Training und Evaluation großer Sprachmodelle - Benchmarking und agentenbasierte Codeausführung in isolierten Umgebungen - Arbeiten mit verschiedenen Programmiersprachen - Anpassen von Richtlinien für neue Fachgebiete und Anwendungsfälle - Einhaltung projektspezifischer Vorgaben und Anforderungen - Zusammenarbeit mit Projektleitern, Solution Engineers und Supply Managern bei komplexen oder experimentellen Projekten
AI Lab
100% Remoteanteil

Frontend developer to HR platform with Angular experience

Reach out to us if you are interested in working with us on the project.
FRATCH
München
90% Remoteanteil
Registriere dich um Zugang zu weiteren spannenden Projekten zu erhalten, die deinen Fähigkeiten und Vorlieben entsprechen!

KI-Agenten-Bewertungsanalyst

Neu
Melde dich an, um die Anzahl der Bewerber zu sehen
Industrie
Informationstechnologie (IT)
Bereichen
Forschung und Entwicklung (F&E)
Produktentwicklung
Qualitätssicherung

Projekt Info

  • Dauer
    10.11.2025 - 07.01.2026
  • Auslastung
    Ab 5%
  • Tagessatz
    120 - 360€
  • Sprache
    • Englisch
      (Verhandlungssicher)
  • Remoteanteil
    Ab 95%

Beschreibung

Für ein AI-Lab suchen wir einen KI-Agenten-Bewertungsanalysten, um ein KI-Modell (Large Language Model – LLM) zu trainieren.

Du hilfst der KI, die Welt zu verstehen. Als Berater*in wirst du möglicherweise eingeladen, an Online-Projekten teilzunehmen, um das Modell in deinem Fachgebiet zu trainieren.

Diese flexible Rolle eignet sich sowohl für Expert*innen, die eine Teilzeitbeschäftigung (mindestens einige Stunden pro Woche) suchen, als auch für diejenigen, die an Vollzeitmöglichkeiten interessiert sind

  • Bewertung von Evaluierungsaufgaben und Szenarien hinsichtlich Logik, Vollständigkeit und Realismus.
  • Identifizierung von Inkonsistenzen, fehlenden Annahmen oder unklaren Entscheidungspunkten.
  • Mithilfe bei der Definition klarer erwarteter Verhaltensweisen (Goldstandards) für KI-Agenten.
  • Markierung von Ursache-Wirkungs-Beziehungen, Denkpfaden und plausiblen Alternativen.
  • Durchdenken komplexer Systeme und Richtlinien wie ein Mensch, um sicherzustellen, dass Agenten richtig getestet werden.
  • Enge Zusammenarbeit mit QA, Autorinnen oder Entwicklerinnen, um Verbesserungen oder die Abdeckung von Randfällen vorzuschlagen.

Anforderungen

  • Hervorragendes analytisches Denken: Kann komplexe Systeme, Szenarien und logische Implikationen durchdenken.
  • Hohe Detailgenauigkeit: Erkennt Widersprüche, Unklarheiten und vage Anforderungen.
  • Vertrautheit mit strukturierten Datenformaten: Kann JSON/YAML lesen, muss aber nicht unbedingt schreiben können.
  • Kann Szenarien ganzheitlich beurteilen: Was fehlt, was ist unrealistisch, was könnte schiefgehen?
  • Erfahrung mit Policy-Evaluierungen, Logikrätseln, Fallstudien oder strukturiertem Szenariodesign.
  • Hintergrund in Beratung, Wissenschaft, Olympiaden (z.B. Logik/Mathematik/Informatik) oder Forschung.
  • Erfahrung mit LLMs, Prompt Engineering oder KI-generierten Inhalten.
  • Vertrautheit mit QA oder Testfall-Denken (Randfälle, Fehlerfälle, "was könnte schiefgehen").

Bewerbungsprozess:

  • Wenn du ausgewählt wirst, wirst du von Mindrift zu einem Interview eingeladen.