Projektdetail

Empfohlene Projekte

Neu

Autor für Evaluierungsszenarien (m/w/d)

Wir suchen jemanden, der realistische und strukturierte Evaluierungsszenarien für auf LLM basierende Agenten entwerfen kann. Du erstellst Testfälle, die menschliche Aufgaben simulieren, und definierst eine Gold-Standard-Verhaltensweise, mit der Agentenaktionen verglichen werden. Du sorgst dafür, dass jedes Szenario klar definiert, gut bewertet und einfach auszuführen sowie wiederzuverwenden ist. Du brauchst einen scharfen analytischen Verstand, Aufmerksamkeit fürs Detail und Interesse daran, wie KI-Agenten Entscheidungen treffen. Obwohl jedes Projekt einzigartig ist, umfasst deine Arbeit typischerweise: - Strukturierte Testszenarien basierend auf realen Aufgaben entwerfen - Den goldenen Pfad und akzeptables Agentenverhalten festlegen - Arbeitsschritte, erwartete Ausgaben und Randfälle annotieren - Mit Entwicklern zusammenarbeiten, um deine Szenarien zu testen und zu verbessern - Agentenausgaben überprüfen und Tests entsprechend anpassen
100% Remoteanteil
Neu

KI-Agent Evaluationsanalyst (m/w/d)

Wir suchen QA-Tester für autonome KI-Agenten in einem neuen Projekt, das sich auf Validierung und Verbesserung komplexer Aufgabenstrukturen, Richtlinienlogik und Bewertungsrahmen für Agenten konzentriert. Im Verlauf des Projekts musst du Qualitätssicherung, Recherche und logisches Problemlösen in Einklang bringen. Diese Projektmöglichkeit eignet sich besonders für Menschen, die Systeme ganzheitlich betrachten und Szenarien, Folgen und Randfälle durchdenken. Du brauchst keinen Programmierhintergrund, musst aber neugierig, intellektuell gründlich und in der Lage sein, die Schlüssigkeit und Konsistenz komplexer Setups zu bewerten. Wenn du jemals in Bereichen wie Beratung, Quizshows (CHGK), Olympiaden, Falllösungen oder Systemdenken erfolgreich warst, könntest du gut zu uns passen. Was du tun wirst: - Bewertung von Aufgaben und Szenarien auf Logik, Vollständigkeit und Realismus. - Aufdecken von Inkonsistenzen, fehlenden Annahmen oder unklaren Entscheidungsstellen. - Mitwirkung bei der Definition klarer Erwartungsverhalten (Goldstandards) für KI-Agenten. - Markierung von Ursache-Wirkungs-Beziehungen, Gedankengängen und plausiblen Alternativen. - Durchdenken komplexer Systeme und Richtlinien aus menschlicher Perspektive, um sicherzustellen, dass Agenten richtig getestet werden. - Enge Zusammenarbeit mit QA, Autoren oder Entwicklern, um Verfeinerungen oder Randfallabdeckung vorzuschlagen.
100% Remoteanteil

AI-Evaluationsberater (m/w/d)

Wir suchen eine analytische und technisch denkende Fachkraft, die: - KI-Ergebnisse und -Prozesse bewertet - Qualität, Genauigkeit und Zuverlässigkeit sichert - Logische Fehler, Risiken und strukturelle Inkonsistenzen erkennt - Dem Team umsetzbare Erkenntnisse und Empfehlungen liefert Ideale Kandidaten: - Berater, Auditoren, Analysten, Datenforscher oder Business-/Technik-Analysten mit starkem logischem Denken - Profis, die neugierig auf KI, Prozessverbesserung und Qualitätsbewertung sind - Problemlöser, die es genießen, komplexe Systeme, Logiken und Szenarien zu analysieren Hauptverantwortlichkeiten: - Leitung der Bewertung von KI-Ergebnissen und zugehörigen Prozessen - Abgleich von Aufgaben mit erwarteten/idealen Szenarien; Lücken und Risiken identifizieren - Strukturierte, umsetzbare Empfehlungen für Entwickler, Fachexperten und Manager geben - Pflege und Verbesserung von Bewertungsrichtlinien, Checklisten und SOPs - Vorschlag neuer Ansätze, Tools und Prozesse zur Verbesserung der KI-Bewertung
AI Labs
100% Remoteanteil

Freiberuflicher Elektroingenieur mit Python-Erfahrung (m/w/d)

Generative KI-Modelle entwickeln sich sehr schnell, und eines unserer Ziele ist es, sie in die Lage zu versetzen, spezialisierte Fragen zu beantworten und komplexe Denkaufgaben zu bewältigen. Obwohl jedes Projekt einzigartig ist, könnten Ihre Aufgaben typischerweise sein: - Inhaltserstellung & Verfeinerung: Erstellen und Überarbeiten von Inhalten, um Genauigkeit und Relevanz in verschiedenen physikalischen Themen sicherzustellen, und Entwickeln von Referenzen und Beispielaufgaben. - Expertengewinnung: Bewerten der Qualifikationstests von Experten und Sicherstellen ihrer Kompetenz. - Chat-Moderation: Unterstützung bei projektbezogenen Fragen anderer Experten in Discord-Chats, besonders zu Projektleitlinien. - Arbeitsprüfung: Überprüfen und Bewerten von Aufgaben anderer Experten, um sicherzustellen, dass sie den Projektleitlinien entsprechen. Konstruktives Feedback geben, fachliche Informationen prüfen und Inhalte bei Bedarf bearbeiten, um die Qualität zu verbessern.
AI Studio
100% Remoteanteil

Freiberuflicher Fahrzeugingenieur (mit Python) – Qualitätssicherung / KI-Trainer

Generative AI-Modelle entwickeln sich sehr schnell weiter, und eines unserer Ziele ist es, sie in die Lage zu versetzen, spezialisierte Fragen zu beantworten und komplexe Denkfähigkeiten zu erreichen. Obwohl jedes Projekt einzigartig ist, umfasst deine Tätigkeit typischerweise: - Inhaltserstellung & -aufbereitung: Erstelle und überarbeite Inhalte, um Genauigkeit und Relevanz über verschiedene Themen der Physik hinweg zu gewährleisten, und entwickle dabei Referenzen und Beispielaufgaben. - Expertengewinnung: Bewerte Qualifikationstests von Experten und stelle ihre Kompetenz sicher. - Chat-Moderation: Unterstütze das Team, indem du projektbezogene Fragen anderer Experten in Discord-Chats beantwortest, insbesondere solche im Zusammenhang mit den Projektvorgaben. - Prüfung der Arbeit: Überprüfe und bewerte von anderen Experten erledigte Aufgaben und stelle sicher, dass sie den Projektvorgaben entsprechen. Gib konstruktives Feedback, überprüfe fachliche Informationen und bearbeite Inhalte bei Bedarf, um die Qualität zu verbessern.
AI Studio
100% Remoteanteil

Freiberuflicher Maschinenbauingenieur mit Python-Erfahrung (m/w/d)

Für ein KI-Labor suchen wir einen Maschinenbauingenieur mit Python-Erfahrung, um ein KI-Modell (Large Language Model – LLM) zu trainieren. GenAI-Modelle verbessern sich sehr schnell, und eines unserer Ziele ist es, sie in die Lage zu versetzen, spezialisierte Fragen zu beantworten und komplexe Schlussfolgerungen zu ziehen. Wenn du mitarbeitest, hast du die Möglichkeit, an diesen Projekten mitzuwirken. Obwohl jedes Projekt einzigartig ist, könntest du typischerweise: - Inhaltserstellung & -verfeinerung: Erstelle und verfeinere Inhalte, um Genauigkeit und Relevanz in verschiedenen Themen des Maschinenbaus sicherzustellen und entwickle dabei Referenzen und Beispiele für Aufgaben. - Expertenakquise: Prüfe die Qualifikationstests von Experten und stelle ihre Kompetenz sicher. - Chat-Moderation: Unterstütze, indem du projektbezogene Fragen anderer Experten in Discord-Chats beantwortest, insbesondere solche zu Projekt-Richtlinien. - Arbeit prüfen: Überprüfe und bewerte Aufgaben, die von anderen Experten abgeschlossen wurden, um sicherzustellen, dass sie den Projekt-Richtlinien entsprechen. Gib konstruktives Feedback, verifiziere fachbezogene Informationen und bearbeite Inhalte nach Bedarf, um die Qualität zu verbessern.
AI Studio
100% Remoteanteil

Freiberuflicher Ruby-Entwickler (m/w/d)

Für ein AI-Labor suchen wir einen Ruby-Entwickler, um ein KI-Modell (Large Language Model - LLM) zu trainieren. Du hilfst der KI, die Welt zu verstehen. Als Berater wirst du möglicherweise zu Online-Projekten eingeladen, um das Modell in deinem Fachgebiet zu trainieren. Diese flexible Rolle richtet sich sowohl an Experten, die eine Teilzeittätigkeit (mindestens ein paar Stunden pro Woche) suchen, als auch an diejenigen, die sich für eine Vollzeitstelle interessieren. - Code-Generierung und Code-Review - Auswertung von Prompts und komplexe Datenannotation - Training und Evaluation großer Sprachmodelle - Benchmarking und agentenbasierte Codeausführung in isolierten Umgebungen - Arbeiten mit mehreren Programmiersprachen (Python, JavaScript/TypeScript, Rust, SQL usw.) - Anpassung von Richtlinien für neue Fachgebiete und Anwendungsfälle - Zusammenarbeit mit Projektleitern, Solution Engineers und Supply Managern bei komplexen oder experimentellen Projekten
AI Lab
100% Remoteanteil

Freiberuflicher Chemie-Experte für KI-Modell-Training (m/w/d)

Ein KI-Labor sucht freiberufliche Chemie-Experten, um KI-Modelle zu bewerten. Ziel des Projekts ist es, die Leistung, Genauigkeit und Zuverlässigkeit von KI-Modellen im Chemiekontext zu beurteilen. Die Rolle beinhaltet eine enge Zusammenarbeit mit dem Entwicklungsteam, um sicherzustellen, dass die Modelle den Branchenstandards entsprechen und umsetzbare Erkenntnisse liefern. Dies ist eine Remote-Teilzeitstelle, die flexibel an Ihre Verfügbarkeit angepasst werden kann – von nur wenigen Stunden pro Woche bis hin zu Vollzeit. Hauptverantwortlichkeiten: - KI-Modelle für chemische Anwendungen bewerten. - Modellausgaben analysieren und Feedback zur Verbesserung geben. - Mit dem Entwicklungsteam zusammenarbeiten, um die Einhaltung der Branchenstandards sicherzustellen. - Ergebnisse und Empfehlungen zur Modelloptimierung dokumentieren. - Tests durchführen, um die Leistung und Zuverlässigkeit des Modells zu validieren.
AI Lab
100% Remoteanteil
Neu

MCP- & Tools-Python-Entwickler (m/w/d)

Wir suchen tatkräftige Python-Entwickler für ein neues Projekt zur Entwicklung von Model Context Protocol (MCP)-Servern und internen Tools zum Ausführen und Auswerten von Agentenverhalten. Du implementierst Basismethoden zur Verifikation von Agentenaktionen, integrierst dich in interne und Kunden-Infrastrukturen und hilfst dabei, Tools-Lücken im Team zu schließen. Was dich erwartet: - Entwicklung und Wartung von MCP-kompatiblen Evaluierungsservern - Implementierung von Logik zur Überprüfung von Agentenaktionen anhand von Szenariodefinitionen - Erstellung oder Erweiterung von Tools, die von Autoren und QA-Teams zum Testen von Agenten genutzt werden - Enge Zusammenarbeit mit Infrastruktur-Ingenieuren zur Sicherstellung der Kompatibilität - Gelegentliche Unterstützung beim Schreiben von Tests oder in Debug-Sessions, wenn nötig Obwohl wir für dieses Projekt aktuell nur Experten suchen, erhalten Mitwirkende mit durchgehend hochwertigen Beiträgen möglicherweise eine Einladung für eine langfristige Zusammenarbeit an zukünftigen Projekten.
100% Remoteanteil

Freiberuflicher Physik-Experte (mit Python) – Qualitätssicherung / KI-Trainer

Generative KI-Modelle verbessern sich sehr schnell, und eines unserer Ziele ist es, sie in die Lage zu versetzen, spezialisierte Fragen zu beantworten und komplexe Denkprozesse zu meistern. Auch wenn jedes Projekt einzigartig ist, könnten deine typischen Aufgaben sein: - Inhaltserstellung & -aufbereitung: Erstelle und überarbeite Inhalte, um Genauigkeit und Relevanz in verschiedenen Bereichen der Physik sicherzustellen, und entwickle dabei auch Referenzen und Aufgabenbeispiele. - Expertengewinnung: Bewertung der Qualifikationstests von Experten, um ihre Kompetenz sicherzustellen. - Chatmoderation: Unterstützung durch Beantwortung projektbezogener Fragen anderer Experten in Discord-Chats, insbesondere zu den Projektleitlinien. - Überprüfung der Arbeit: Durchsicht und Bewertung der von anderen Experten erledigten Aufgaben, um sicherzustellen, dass sie den Projektleitlinien entsprechen. Konstruktives Feedback geben, fachspezifische Informationen prüfen und Inhalte bei Bedarf bearbeiten, um die Qualität zu verbessern.
AI Studio
100% Remoteanteil

Freiberuflicher Bauingenieur mit Python-Erfahrung (m/w/d)

Ein Unternehmen sucht freiberufliche Bauingenieure, die KI-Modelle bewerten. Ziel des Projekts ist es, Leistung, Genauigkeit und Zuverlässigkeit von KI-Modellen im Bauwesen zu prüfen. Die Rolle umfasst eine enge Zusammenarbeit mit dem Entwicklungsteam, um sicherzustellen, dass die Modelle den Branchenstandards entsprechen und umsetzbare Erkenntnisse liefern. Hauptverantwortlichkeiten: - Bewertung von KI-Modellen für Bauingenieur-Anwendungen. - Analyse der Modellausgaben und Feedback zur Verbesserung. - Zusammenarbeit mit dem Entwicklungsteam zur Einhaltung der Branchenstandards. - Dokumentation von Ergebnissen und Empfehlungen zur Modelloptimierung. - Durchführung von Tests zur Überprüfung der Modellleistung und -zuverlässigkeit.
AI Lab
100% Remoteanteil

KI-Berater - Machine Learning (m/w/d)

Für ein KI-Labor suchen wir Experten für Machine Learning, die ein KI-Modell (Large Language Model - LLM) trainieren. GenAI-Modelle entwickeln sich sehr schnell weiter, und eines unserer Ziele ist es, sie in die Lage zu versetzen, spezialisierte Fragen zu beantworten und komplexe Schlussfolgerungen zu ziehen. Wenn Sie dazukommen, haben Sie die Möglichkeit, an diesen Projekten mitzuwirken. Auch wenn jedes Projekt einzigartig ist, könnten Sie typischerweise: - Originelle rechnerische STEM-Aufgaben entwerfen, die reale wissenschaftliche Arbeitsabläufe simulieren - Aufgaben erstellen, die eine Lösung per Python-Programmierung erfordern - Sicherstellen, dass die Aufgaben rechenintensiv sind und sich nicht manuell in angemessener Zeit (Tage/Wochen) lösen lassen - Aufgaben entwickeln, die nicht-triviale Schlussfolgerungsketten und kreative Lösungsansätze erfordern - Lösungen mithilfe von Python mit Standardbibliotheken (numpy, pandas, scipy, sklearn) überprüfen - Problemstellungen klar dokumentieren und verifizierte korrekte Antworten bereitstellen
AI Lab
100% Remoteanteil

KI-Berater für Vibe Coding (m/w/d)

Ein AI Lab sucht einen AI-Trainer für Vibe Coding. In dieser Rolle geht es darum, in verschiedenen Bereichen genaue, fundierte Ergebnisse zu liefern und dabei Automatisierung und KI-Tools zu nutzen. Die Position erfordert Expertise im Programmieren und Optimieren von Python-Skripten, im Umgang mit großen Datensätzen, in der Verbesserung KI-generierter Inhalte sowie im Formatieren und der Fehlersuche in technischen Workflows. Dies ist eine remote Teilzeitstelle, die flexibel an deine Verfügbarkeit angepasst werden kann – von nur wenigen Stunden pro Woche bis hin zu Vollzeit. Schlüsselverantwortlichkeiten: - Führe fortgeschrittene Webrecherche und Datenanalyse durch, nutze mehrere Tools, um Informationen aus offiziellen Quellen zu finden und zu extrahieren. Verwende LLMs und fortgeschrittene Prompts, um Suchstrategien zu verfeinern und die Daten durch Abgleich mit vertrauenswürdigen Quellen zu validieren. - Führe Web-Scraping und Datenerfassung durch, indem du komplexe Webseitenstrukturen und mehrstufige Seiten (Regionen → Unternehmen → Detailseiten) navigierst. Verarbeite dynamische Inhalte, Archivseiten und verschiedene HTML-Formate und organisiere die extrahierten Daten in sauberen, gut formatierten CSV-Dateien. - Schreibe und optimiere Python-Skripte für Datenverarbeitung und Analyse mit Bibliotheken wie pandas, BeautifulSoup, Selenium und matplotlib. Wandle Rohdaten in strukturierte Formate (CSV, JSON, Tabellen) um und erstelle bei Bedarf Visualisierungen. - Führe Datenverarbeitung und Qualitätssicherung durch: bereinige, validiere und strukturiere Datensätze. Sorge für Datenintegrität über mehrere Quellen hinweg, wende Formatvorgaben an und führe Prüfungen durch, um eine hohe Ausgabequalität zu gewährleisten. - Nutze ausgeprägte Problemlösungsfähigkeiten und Organisationsvermögen, um komplexe Workflows zu zerlegen, technische Probleme eigenständig zu lösen und rasch zwischen verschiedenen Bereichen und Aufgabentypen zu wechseln – mit minimaler Betreuung. - Erstelle klare Dokumentationen und hochwertige Ergebnisse, die exakt den Vorgaben für Dateiformate, Benennungskonventionen und Datenstruktur entsprechen. Pflege reproduzierbare Workflows und gut organisierten Code.
AI Lab
100% Remoteanteil

Freelance Biologie-Experte für KI-Modelltraining (m/w/d)

Eine KI-Forschungsgruppe sucht freiberufliche Biologie-Expert*innen, um KI-Modelle zu bewerten. Ziel des Projekts ist es, die Leistung, Genauigkeit und Zuverlässigkeit von KI-Modellen in allen Bereichen der Biologie zu beurteilen. Die Rolle beinhaltet die enge Zusammenarbeit mit dem Entwicklungsteam, um sicherzustellen, dass die Modelle den Branchenstandards entsprechen und umsetzbare Erkenntnisse liefern. Dies ist eine Remote-Teilzeitstelle, die flexibel an deine Verfügbarkeit angepasst werden kann – von nur wenigen Stunden pro Woche bis hin zu Vollzeit. Hauptaufgaben: - KI-Modelle für biologische Anwendungen bewerten. - Modellausgaben analysieren und Verbesserungsvorschläge geben. - Zusammenarbeit mit dem Entwicklungsteam, um Branchenstandards zu gewährleisten. - Ergebnisse und Empfehlungen zur Modelloptimierung dokumentieren. - Tests durchführen, um Leistung und Zuverlässigkeit der Modelle zu überprüfen.
AI Lab
100% Remoteanteil

Freiberuflicher Statistikexperte mit Python-Erfahrung (m/w/d)

Für ein AI-Lab suchen wir einen Statistikexperten mit Python-Erfahrung, um ein KI-Modell (Large Language Model – LLM) zu trainieren. GenAI-Modelle verbessern sich sehr schnell, und eines unserer Ziele ist, sie dazu zu bringen, spezialisierte Fragen zu beantworten und komplexe Schlussfolgerungen zu ziehen. Wenn Sie sich uns anschließen, haben Sie die Möglichkeit, an diesen Projekten mitzuwirken. Auch wenn jedes Projekt einzigartig ist, könnten Sie typischerweise: - Prompts erstellen, die die KI herausfordern. - Umfassende Bewertungskriterien festlegen, um die Genauigkeit der Antworten der KI zu beurteilen. - Die Antworten des Modells anhand Ihres fachspezifischen Wissens korrigieren.
AI Lab
100% Remoteanteil

Physiker mit Python-Erfahrung (m/w/d)

Für ein AI-Lab suchen wir Physiker mit Python-Erfahrung, um ein KI-Modell (Large Language Model - LLM) zu trainieren. GenAI-Modelle entwickeln sich sehr schnell weiter, und eines unserer Ziele ist, sie in die Lage zu versetzen, spezialisierte Fragen zu beantworten und komplexe Schlussfolgerungen zu ziehen. Wenn du dich der Plattform als Physiker anschließt, hast du die Möglichkeit, an diesen Projekten mitzuwirken. Obwohl jedes Projekt einzigartig ist, könntest du typischerweise: - Originelle computergestützte Physikaufgaben entwerfen, die reale Forschungsabläufe nachbilden. - Aufgaben erstellen, die zur Lösung Python-Programmierung erfordern (mit numpy, scipy, sympy). - Sicherstellen, dass die Aufgaben rechnerisch intensiv sind und sich nicht manuell in angemessener Zeit (Tage/Wochen) lösen lassen. - Aufgaben entwickeln, die nicht-triviale Argumentationsketten erfordern. - Aufgaben auf echten Forschungsherausforderungen oder praktischen Anwendungen aus der Physik basieren. - Lösungen mit Python und Standardbibliotheken überprüfen. - Aufgabenstellungen klar dokumentieren und verifizierte korrekte Antworten liefern.
AI Lab
100% Remoteanteil

Freiberuflicher Java-Entwickler (m/w/d)

Für ein AI Lab suchen wir einen Java-Entwickler, um ein KI-Modell (Large Language Model – LLM) zu trainieren. Du hilfst der KI, die Welt zu verstehen. Als Berater wirst du möglicherweise zu Online-Projekten eingeladen, um das Modell in deinem Fachgebiet zu trainieren. Diese flexible Rolle eignet sich sowohl für Experten, die eine Teilzeit-Tätigkeit anstreben (mindestens wenige Stunden pro Woche), als auch für Interessierte an Vollzeitmöglichkeiten. - Code-Erzeugung und Code-Review - Bewertung von Prompts und komplexe Datenannotation - Training und Bewertung großer Sprachmodelle - Benchmarking und agentenbasierte Code-Ausführung in geschützten Umgebungen - Arbeit mit mehreren Programmiersprachen - Anpassung von Richtlinien für neue Domänen und Anwendungsfälle - Einhaltung projektspezifischer Vorgaben und Anforderungen - Zusammenarbeit mit Projektleitern, Solution Engineers und Supply Managern bei komplexen oder experimentellen Projekten
AI Lab
100% Remoteanteil

Mathematiker mit Python-Erfahrung (m/w/d)

Für ein AI-Lab suchen wir Mathematiker mit Python-Erfahrung, um ein KI-Modell (Large Language Model – LLM) zu trainieren. Als Berater kannst du eingeladen werden, online an Projekten teilzunehmen, um das Modell in deinem Fachgebiet zu trainieren. Diese flexible Rolle richtet sich sowohl an Experten, die eine Teilzeitbeteiligung (mindestens ein paar Stunden pro Woche) suchen, als auch an Interessierte für Vollzeit. Obwohl jedes Projekt einzigartig ist, könntest du typischerweise: - Originale Aufgaben der computergestützten Mathematik entwerfen, die reale Forschungsabläufe simulieren. - Aufgaben erstellen, die eine Lösung mit Python-Programmierung erfordern (mit numpy, scipy, sympy). - Sicherstellen, dass die Aufgaben rechnerisch intensiv sind und nicht manuell in angemessener Zeit (Tage/Wochen) lösbar sind. - Aufgaben entwickeln, die nicht-triviale Schlussfolgerungsketten in Bereichen wie Zahlentheorie, Kombinatorik, Graphentheorie und numerischer Analysis erfordern. - Die Aufgaben auf echten Forschungsherausforderungen oder praktischen Anwendungen aus der mathematischen Praxis stützen. - Lösungen mit Python und gängigen mathematischen Bibliotheken überprüfen. - Problemstellungen klar dokumentieren und überprüfte korrekte Antworten liefern. Unterstützung in: - Zahlentheorie: Primfaktorzerlegung, diophantische Gleichungen, Modulare Arithmetik, kryptografische Berechnungen. - Kombinatorik: Aufzählungen, Partitionen, Erzeugende Funktionen, kombinatorische Optimierung. - Graphentheorie: Netzwerkanalyse, Wegfindung, Färbung von Graphen, Spannbäume. - Numerische Analysis: Nullstellensuche, numerische Integration, Differentialgleichungen, Matrixberechnungen. - Diskrete Mathematik: Rekursionsbeziehungen, algorithmische Komplexität, diskrete Optimierung. - Algebra: Polynomrechnung, Gruppentheorie-Berechnungen, Matrixzerlegungen.
AI Lab
100% Remoteanteil

Freiberuflicher Cybersecurity-Berater für AI Red Teaming

Für ein AI-Labor suchen wir Cybersecurity-Berater, um ein KI-Modell (Large Language Model – LLM) zu trainieren. Du hilfst der KI, die Welt zu verstehen. Als Berater wirst du möglicherweise zu Online-Projekten eingeladen, um das Modell in deinem Fachgebiet zu trainieren. Diese flexible Rolle richtet sich sowohl an Experten, die eine Teilzeit-Beteiligung (mindestens ein paar Stunden/Woche) suchen, als auch an solche, die sich für Vollzeitangebote interessieren - Bewerte und greife AI-Modelle, Agenten und Machine-Learning-Systeme auf Schwachstellen und Sicherheitsrisiken an. - Erstelle offline reproduzierbare und automatisch bewertbare Testfälle, um die Sicherheit und Leistungsfähigkeit von KI-Agenten zu prüfen. - Entwickle und implementiere Automatisierungsskripte, individuelle Tools, Umgebungen und Testumgebungen. - Führe Sicherheitsforschungsinitiativen, insbesondere im Bereich AI-Sicherheit, an oder leiste dazu Beiträge, indem du realistische und herausfordernde Angriffsszenarien für das Modell erstellst und umsetzt. - Berate zu Cybersecurity-Best-Practices und politischen Implikationen.
AI Lab
100% Remoteanteil

KI-Berater – Data Science (m/w/d)

Wir suchen erfahrene Data Scientists, die rechnerisch aufwendige Data-Science-Aufgaben für ein fortgeschrittenes KI-Evaluationsprojekt erstellen. Dies ist eine ortsunabhängige, projektbezogene Möglichkeit für Expert:innen, die herausfordernde Aufgaben entwerfen können, die rechnerische Methoden erfordern und den vollständigen Data-Science-Lebenszyklus abbilden – von Datenerfassung und -verarbeitung über statistische Analysen bis hin zu umsetzbaren Business-Insights. Was Sie tun werden - Entwerfen originelle, rechnerisch aufwendige Data-Science-Aufgaben, die realistische Analyse-Workflows aus verschiedenen Branchen simulieren (Telekommunikation, Finanzen, Verwaltung, E-Commerce, Gesundheitswesen) - Erstellen von Aufgaben, die zur Lösung Python-Programmierung erfordern (mit pandas, numpy, scipy, sklearn, statsmodels, matplotlib, seaborn) - Sicherstellen, dass die Aufgaben so rechenintensiv sind, dass sie manuell nicht in angemessener Zeit (Tage/Wochen) lösbar sind - Entwickeln von Aufgaben, die nicht-triviale Schlussfolgerungsketten in Datenverarbeitung, statistischer Analyse, Feature Engineering, prädiktiver Modellierung und Insight-Extraction erfordern - Erstellen deterministischer Aufgaben mit reproduzierbaren Antworten – Vermeiden stochastischer Elemente oder Festlegen fester Zufalls-Samen für exakte Reproduzierbarkeit - Basieren der Aufgaben auf echten Business-Herausforderungen: Kundenanalyse, Risikobewertung, Betrugserkennung, Forecasting, Optimierung und operative Effizienz - Entwerfen von End-to-End-Aufgaben, die die komplette Data-Science-Pipeline abdecken (Datenaufnahme → Bereinigung → EDA → Modellierung → Validierung → Deployment-Überlegungen) - Einbinden von Big-Data-Verarbeitungs-Szenarien, die skalierbare Rechenansätze erfordern - Überprüfen der Lösungen mit Python und gängigen Data-Science-Bibliotheken sowie statistischen Methoden - Klare Dokumentation der Aufgabenstellungen mit realistischen Business-Kontexten und Bereitstellung verifizierter, korrekter Antworten
AI Lab
München, Deutschland
100% Remoteanteil

Freiberuflicher Redakteur (m/f/d)

- Du erstellst Themenbriefings, recherchierst und verfasst fachlich fundierte (Ratgeber)Texte in einem anspruchsvollen Sprachstil und redigierst die Beiträge unserer freien Autor:innen - Die Themenbereiche umfassen die Zielgruppe der Hobbygärtner:innen im Garten- und Pflanzenbereich, sowie die Bereiche Wohnen und Einrichten, Design und Deko, Do it yourself, aber auch Kochen und Ernährung gehören zu Spektrum dazu - Im engen Austausch mit Kolleg:innen, Leser:innen und Expert:innen entwickelst du spannende Themen und bereitest diese zielgruppengerecht auf - Auch das Pflegen und Ausbauen von Pressekontakten, sowie das Bestellen von Fotomaterial im Garten-/Wohn- und Dekobereich zählt zu deinen Aufgaben - Optional werden Fotoproduktionen organisiert und durchgeführt sowie auch Pressetermine und Messebesuche wahrgenommen
Medienunternehmen
München, Deutschland
50% Remoteanteil

Entwickler für Consent Management Implementierung (m/w/d)

Für das Ersetzen der bislang durch Drittanbieter-CMPs durchgeführten Darstellung von ConsentLayern im Web für unsere internationalen Marken sollen diese Layer neu implementiert werden, um diesen im Haus weiter betreiben und ausspielen zu können. Hierzu sind fundierte Kenntnisse in Typescript, Vue.js und klassischen Web-Darstellungstechniken (HTML und CSS) erforderlich. Ziel ist die Lieferung von ausführbarem Code, der alle Requirements umsetzt und automatisierte Tests enthält, die die korrekte Funktion nachweisen. Was genau ist der Beauftragungsumfang: Der Leistungsschwerpunkt besteht in der Erarbeitung von Elementen zur Entscheidungsvorlage des Vorgehens und in der Umsetzung von Maßnahmen entlang des daraus gestalteten Projektverlaufs. Dies beinhaltet konkret die folgenden Leistungspakete: - Implementierung von Code - Implementierung von ausführbaren Tests, die zur Abgabe erfolgreich sein müssen, Testabdeckung >= 80% - Erstellung von Dokumentation zum Code - Erstellung markenspezifischer cmp-config-Dateien. - Erstellung eines Projekts (einschließlich Anforderungen an die Vermögensverwaltung) als Kopie der Consent-Management-Plattform. - Entfernung von netID-Referenzen. - Erstellung markenspezifischer Einstellungen und Dateien für benutzerdefinierte Zwecke/Anbieter. - Hinzufügen neuer markenspezifische CSS-Themes (Variablenwerte, Logos usw.). - Einbeziehung der erforderlichen offiziellen IAB-GVL-Übersetzungen (ES, FR) in die wöchentliche Synchronisierung mit GVL - Implementierung von I18n und Vorbereitung markenspezifischer Datenquellen - Implementierung von PMC2.0-Backend-Nutzungsmodulen - Implementierung der Playout-Logik - Implementierung des Layer-Initialisierungsprozesses (mode=default und mode=resurface) - CDN-Upload- und Freigabeprozess - Projektdokumentation Projektumsetzung: - das gewünschte Ergebnis soll in Typescript und Vue.js verfasst sein, Build per Vite, Tests per Vitest.
Telekommunikation
Karlsruhe, Deutschland
100% Remoteanteil

Chemiker mit Python-Erfahrung (m/w/d)

GenAI-Modelle verbessern sich sehr schnell, und eines unserer Ziele ist es, sie in die Lage zu versetzen, spezialisierte Fragen zu beantworten und komplexe Denkaufgaben zu bewältigen. Wenn Sie der Plattform als KI-Tutor im Bereich Chemie beitreten, haben Sie die Möglichkeit, an diesen Projekten mitzuarbeiten. Obwohl jedes Projekt einzigartig ist, könnten Sie typischerweise: - Prompts erstellen, die die KI herausfordern. - Umfassende Bewertungskriterien definieren, um die Genauigkeit der KI-Antworten zu prüfen. - Die Antworten des Modells anhand Ihres fachspezifischen Wissens korrigieren.
AI Lab
100% Remoteanteil
Neu

Anforderungs- Und Contentmanager (m/w/d)

Ein Unternehmen sucht Unterstützung für ein Projekt, das sich auf die Optimierung der Buy- und Leave-Strecke konzentriert, um die Kundenakquise und -bindung zu verbessern. Ziel ist es, die Effizienz in der Wertschöpfungskette zu steigern, die Markteinführung zu beschleunigen und die Total Cost of Ownership (TCO) zu reduzieren. Die Plattform Adobe Experience Manager (AEM) spielt dabei eine zentrale Rolle, insbesondere im Hinblick auf die Implementierung neuer Features wie Compositions, Templates und Micro-Frontends. Hauptaufgaben: - - Definition und Konzeption von Anforderungen im Bereich CMS Adobe Experience Manager, einschließlich der Festlegung der Entwicklungsreihenfolge von Compositions, Components, Templates und Micro-Frontends. - Unterstützung der Dokumentation und Feedbackschleifen mit Tools wie Jira und Confluence. Projektbezogene Beratung der Entwicklungsteams und Requirement Owner während der Entwicklungsphase. - Analyse der bestehenden CMS-Infrastruktur des Adobe Experience Managers und Ableitung von Handlungsempfehlungen zur Optimierung der Content- und Site-Struktur, der AEM-Interfaces sowie der Performance. - Erstellung von Dokumentationen zur Nutzung der bereitgestellten Compositions & Components und Bereitstellung dieser Informationen an interne Teams. - Fachliche Beratung der Fachabteilungen aus den Bereichen Business und Technology sowie externen Partnern im Rahmen des Change-Programms. - Beratung zu technischen Anforderungen, einschließlich Content Structure, Site Structure, Micro-Frontends, Product Data Modeling, Compositions & Components, Templates, Headless-CMS und AEM Interfaces. - Unterstützung bei Spezialthemen wie Accessibility, CIAM, Multilanguage, Personalisierung und Campaigning.
Telecommunication
München, Deutschland
100% Remoteanteil

Projektleiter Zeitschriften / Magazinerstellung (m/w/d)

- Verantwortung für die Koordination und Steuerung des gesamten Produktionsprozesses von Zeitschriftenmagazinen - Planung und Überwachung von Heftstruktur, Terminen, Anzeigen und Workflows - Enge Zusammenarbeit mit Redaktion, Verlagsleitung, Vermarktung, Technik, Marketing, Vertrieb, Druckerei und Dienstleister:innen - Qualitätssicherung bei Layouts, Texten und Druckfreigaben - Kalkulation und Organisation von Zusatzprodukten (z. B. Beileger, Poster, Erweiterungen) - Aktive Rolle in strategischen Projekten, Konferenzen und bei der Einführung neuer Formate
Medienunternehmen
München, Deutschland
50% Remoteanteil

Senior Projektmanager Kundeninteraktion

Ein Unternehmen sucht Unterstützung im Rahmen des Projektes zur Evaluation, Implementierung und Weiterentwicklung von Qualitätsbefragungen in digitalen Kanälen. Ziel des Projektes ist es, die Kundenzufriedenheit in digitalen Kanälen zu steigern, Befragungsmethoden zu evaluieren, zu implementieren und weiterzuentwickeln, um eine konsistente Erhebung der Kundenzufriedenheit über alle Kanäle zu ermöglichen. Dabei sollen Verbesserungspotenziale erkannt und umgesetzt werden. Die Rolle umfasst die Beratung, Entwicklung und Umsetzung von Maßnahmen zur Erhebung und Verbesserung der Kundenzufriedenheit in digitalen Kanälen. Hauptaufgaben: - Beratung zu Befragungsmethoden zur Erhebung von Kundenerfahrung und Qualität in digitalen Kanälen, Marktstandards, Benchmarks und Zukunftsausrichtung. - Entwicklung eines Zukunftsmodells zu Qualität in digitalen Kanälen, relevanten KPIs und Erhebungsmethoden sowie Standardprozessen. - Umsetzung der entschiedenen Maßnahmen inklusive Schnittstellenmanagement und Abstimmung mit Technologiepartnern und Sozialpartnern. - Testen von implementierten Maßnahmen zur Erhebung und Sicherstellung der erforderlichen Anforderungen. - Konsolidierung und Aufstellung der bestehenden und fehlenden Kundenbefragungsmethoden/Qualitäts-KPIs in allen verantworteten digitalen Kanälen. - Beratung bei der Erstellung von Entscheidungsvorlagen und Umsetzung der dazu erforderlichen Maßnahmen. - Identifikation von Verbesserungspotenzialen und Entwicklung eines Standardprozesses zur Transparenz und Umsetzung.
Telekommunikation
München, Deutschland
100% Remoteanteil

Senior Web-Entwickler (m/w/d)

- Du entwickelst moderne, performante Web-Frontends mit React, TypeScript, HTML und CSS - Du setzt responsive Designs unter Berücksichtigung von Accessibility und Performance um - Du planst und führst Unit- und Integrationstests (zum Beispiel mit Playwright) durch - Fehlerbehebung in Entwicklungs-, Test- oder Live-Umgebung
Medienunternehmen
München, Deutschland
100% Remoteanteil

Fullstack Engineer (m/f/d)

- Produkt- und Web-Entwicklung im datengetriebenen Bereich - Mitgestaltung der Softwarearchitektur für neue Datenprodukte - Zusammenarbeit in interdisziplinären Teams (u.a. mit Data Scientists und Business Developern)
Medienunternehmen
München, Deutschland
100% Remoteanteil

Biologe mit Python-Erfahrung (m/w/d)

GenAI-Modelle entwickeln sich sehr schnell, und eines unserer Ziele ist es, sie in die Lage zu versetzen, spezialisierte Fragen zu beantworten und komplexe Denkaufgaben zu lösen. Wenn du der Plattform als KI-Tutor im Bereich Biologie beitrittst, hast du die Möglichkeit, an diesen Projekten mitzuwirken. Obwohl jedes Projekt einzigartig ist, könntest du typischerweise: - Prompts erstellen, die die KI herausfordern. - Umfassende Bewertungskriterien festlegen, um die Genauigkeit der KI-Antworten zu prüfen. - Die Antworten des Modells mithilfe deines Fachwissens korrigieren.
AI Lab
100% Remoteanteil

Adobe Experience Cloud Consultant (m/w/d)

Die Abteilung Digital Analytics nutzt die Adobe Experience Cloud zur Umsetzung personalisierter Nutzererlebnisse. Ziel ist die Steigerung der Conversion Rates und Verbesserung der Customer Experience durch gezielte Personalisierung und Testing. Die technische Umsetzung erfolgt eigenständig durch spezialisierte Consultants. - Ein zentraler Bestandteil der Aufgaben umfasst die Wartung der bereits bestehenden Implementierung innerhalb der Adobe Experience Plattform. Dazu zählen insbesondere die Überwachung der Daten sowie die Fehlerbehebung in den Quellkonnektoren. - Im Rahmen der Vorbereitung neuer Funktionen für die Nutzung in der Adobe Experience Plattform werden Anforderungen und Daten zunächst in das Experience Data Model von Adobe übersetzt. Dies beinhaltet die Erstellung von Entity-Relationship-Diagrammen (ERDs) sowie die Kontextualisierung der relevanten Daten. - Darauf aufbauend werden entsprechende Schemata innerhalb der Plattform angelegt und Datensätze zur weiteren Nutzung vorbereitet. - Zu den weiteren Tätigkeiten gehört die Konzeption und Einrichtung sowohl neuer Aktivierungskanäle als auch zusätzlicher Datenquellen. - Darüber hinaus werden neue, geschäftsrelevante Anwendungsfälle entlang der verschiedenen Phasen der Customer Journey entwickelt, um den geschäftlichen Mehrwert gezielt zu steigern. - Erstellung von Segmenten und Durchführung von Fehleranalysen mithilfe von gezielten SQL-Abfragen. - Beratung bei allen neu eingeführten Verarbeitungstätigkeiten, über die Einhaltung der geltenden Datenschutzbestimmungen, die erforderlichen internen Freigabeprozesse sowie über die Dokumentation der rechtlichen sowie technischen Spezifika.
Telekommunikation
München, Deutschland
100% Remoteanteil

IT Projektleiter ServiceNow (Senior)

- Ein Unternehmen aus der Energie- und Energiedienstleistungsbranche sucht einen erfahrenen IT Projektleiter für ein ServiceNow-Projekt. - Ziel des Projekts ist die Leitung und erfolgreiche Umsetzung eines Enterprise-ServiceNow-Projekts mit Fokus auf ITSM und Customer Service Management (CSM). - Die Rolle umfasst die Planung, Steuerung und Sicherstellung eines stabilen Projektablaufs in enger Zusammenarbeit mit internen und externen Stakeholdern. - Operatives & strategisches Service Management der ServiceNow-Plattform - Prozessverantwortung für ITSM und CSM (B2B & B2C) - Prozessdesign, Governance & kontinuierliche Optimierung - Steuerung externer Provider und Dienstleister - Monitoring, KPI-Analysen & Ableitung von Verbesserungen - Sicherstellung eines stabilen Plattformbetriebs
Energie
Deutschland
100% Remoteanteil

Frontend developer to HR platform with Angular experience

Reach out to us if you are interested in working with us on the project.
FRATCH
München
90% Remoteanteil
Registriere dich um Zugang zu weiteren spannenden Projekten zu erhalten, die deinen Fähigkeiten und Vorlieben entsprechen!

Autor für Evaluierungsszenarien (m/w/d)

Neu
Melde dich an, um die Anzahl der Bewerber zu sehen
Industrie
Informationstechnologie (IT)
Bereich
Qualitätssicherung

Projekt Info

  • Tagessatz
    290 - 640€
  • Sprache
    • Englisch
      (Verhandlungssicher)
  • Remoteanteil
    100%

Beschreibung

Wir suchen jemanden, der realistische und strukturierte Evaluierungsszenarien für auf LLM basierende Agenten entwerfen kann. Du erstellst Testfälle, die menschliche Aufgaben simulieren, und definierst eine Gold-Standard-Verhaltensweise, mit der Agentenaktionen verglichen werden. Du sorgst dafür, dass jedes Szenario klar definiert, gut bewertet und einfach auszuführen sowie wiederzuverwenden ist. Du brauchst einen scharfen analytischen Verstand, Aufmerksamkeit fürs Detail und Interesse daran, wie KI-Agenten Entscheidungen treffen.

Obwohl jedes Projekt einzigartig ist, umfasst deine Arbeit typischerweise:

  • Strukturierte Testszenarien basierend auf realen Aufgaben entwerfen
  • Den goldenen Pfad und akzeptables Agentenverhalten festlegen
  • Arbeitsschritte, erwartete Ausgaben und Randfälle annotieren
  • Mit Entwicklern zusammenarbeiten, um deine Szenarien zu testen und zu verbessern
  • Agentenausgaben überprüfen und Tests entsprechend anpassen

Anforderungen

  • Bachelor- und/oder Masterabschluss in Informatik, Software Engineering, Data Science / Datenanalyse, Künstliche Intelligenz / Machine Learning, Computerlinguistik / Natural Language Processing (NLP), Informationssysteme oder anderen verwandten Bereichen.
  • Erfahrung in QA, Softwaretests, Datenanalyse oder NLP-Annotation.
  • Gutes Verständnis von Testdesign-Prinzipien (z. B. Reproduzierbarkeit, Abdeckung, Randfälle).
  • Starke schriftliche Kommunikationsfähigkeiten in Englisch.
  • Sicher im Umgang mit strukturierten Formaten wie JSON/YAML zur Szenariobeschreibung.
  • Fähigkeit, erwartete Agentenverhalten (Gold-Pfade) und Bewertungslogik zu definieren.
  • Grundkenntnisse in Python und JS.
  • Neugierig und offen im Umgang mit KI-generierten Inhalten, Agenten-Logs und promptbasiertem Verhalten.
  • Du bist bereit, neue Methoden zu lernen, kannst schnell zwischen Aufgaben und Themen wechseln und manchmal mit herausfordernden, komplexen Richtlinien arbeiten.
  • Unser Freelance-Job ist vollständig remote, du brauchst nur Laptop, Internetverbindung, Zeit und Motivation für die Herausforderung.

Wünschenswert

  • Erfahrung im Schreiben manueller oder automatisierter Testfälle.
  • Vertrautheit mit LLM-Fähigkeiten und typischen Ausfallmodi.
  • Verständnis von Bewertungsmetriken (Precision, Recall, Coverage, Reward-Funktionen).