Projektdetail

Empfohlene Projekte

Neu

KI-Agent Evaluationsanalyst (m/w/d)

Wir suchen QA-Tester für autonome KI-Agenten in einem neuen Projekt, das sich auf Validierung und Verbesserung komplexer Aufgabenstrukturen, Richtlinienlogik und Bewertungsrahmen für Agenten konzentriert. Im Verlauf des Projekts musst du Qualitätssicherung, Recherche und logisches Problemlösen in Einklang bringen. Diese Projektmöglichkeit eignet sich besonders für Menschen, die Systeme ganzheitlich betrachten und Szenarien, Folgen und Randfälle durchdenken. Du brauchst keinen Programmierhintergrund, musst aber neugierig, intellektuell gründlich und in der Lage sein, die Schlüssigkeit und Konsistenz komplexer Setups zu bewerten. Wenn du jemals in Bereichen wie Beratung, Quizshows (CHGK), Olympiaden, Falllösungen oder Systemdenken erfolgreich warst, könntest du gut zu uns passen. Was du tun wirst: - Bewertung von Aufgaben und Szenarien auf Logik, Vollständigkeit und Realismus. - Aufdecken von Inkonsistenzen, fehlenden Annahmen oder unklaren Entscheidungsstellen. - Mitwirkung bei der Definition klarer Erwartungsverhalten (Goldstandards) für KI-Agenten. - Markierung von Ursache-Wirkungs-Beziehungen, Gedankengängen und plausiblen Alternativen. - Durchdenken komplexer Systeme und Richtlinien aus menschlicher Perspektive, um sicherzustellen, dass Agenten richtig getestet werden. - Enge Zusammenarbeit mit QA, Autoren oder Entwicklern, um Verfeinerungen oder Randfallabdeckung vorzuschlagen.
100% Remoteanteil
Neu

Autor für Evaluierungsszenarien (m/w/d)

Wir suchen jemanden, der realistische und strukturierte Evaluierungsszenarien für auf LLM basierende Agenten entwerfen kann. Du erstellst Testfälle, die menschliche Aufgaben simulieren, und definierst eine Gold-Standard-Verhaltensweise, mit der Agentenaktionen verglichen werden. Du sorgst dafür, dass jedes Szenario klar definiert, gut bewertet und einfach auszuführen sowie wiederzuverwenden ist. Du brauchst einen scharfen analytischen Verstand, Aufmerksamkeit fürs Detail und Interesse daran, wie KI-Agenten Entscheidungen treffen. Obwohl jedes Projekt einzigartig ist, umfasst deine Arbeit typischerweise: - Strukturierte Testszenarien basierend auf realen Aufgaben entwerfen - Den goldenen Pfad und akzeptables Agentenverhalten festlegen - Arbeitsschritte, erwartete Ausgaben und Randfälle annotieren - Mit Entwicklern zusammenarbeiten, um deine Szenarien zu testen und zu verbessern - Agentenausgaben überprüfen und Tests entsprechend anpassen
100% Remoteanteil

AI-Evaluationsberater (m/w/d)

Wir suchen eine analytische und technisch denkende Fachkraft, die: - KI-Ergebnisse und -Prozesse bewertet - Qualität, Genauigkeit und Zuverlässigkeit sichert - Logische Fehler, Risiken und strukturelle Inkonsistenzen erkennt - Dem Team umsetzbare Erkenntnisse und Empfehlungen liefert Ideale Kandidaten: - Berater, Auditoren, Analysten, Datenforscher oder Business-/Technik-Analysten mit starkem logischem Denken - Profis, die neugierig auf KI, Prozessverbesserung und Qualitätsbewertung sind - Problemlöser, die es genießen, komplexe Systeme, Logiken und Szenarien zu analysieren Hauptverantwortlichkeiten: - Leitung der Bewertung von KI-Ergebnissen und zugehörigen Prozessen - Abgleich von Aufgaben mit erwarteten/idealen Szenarien; Lücken und Risiken identifizieren - Strukturierte, umsetzbare Empfehlungen für Entwickler, Fachexperten und Manager geben - Pflege und Verbesserung von Bewertungsrichtlinien, Checklisten und SOPs - Vorschlag neuer Ansätze, Tools und Prozesse zur Verbesserung der KI-Bewertung
AI Labs
100% Remoteanteil

Freiberuflicher Chemie-Experte für KI-Modell-Training (m/w/d)

Ein KI-Labor sucht freiberufliche Chemie-Experten, um KI-Modelle zu bewerten. Ziel des Projekts ist es, die Leistung, Genauigkeit und Zuverlässigkeit von KI-Modellen im Chemiekontext zu beurteilen. Die Rolle beinhaltet eine enge Zusammenarbeit mit dem Entwicklungsteam, um sicherzustellen, dass die Modelle den Branchenstandards entsprechen und umsetzbare Erkenntnisse liefern. Dies ist eine Remote-Teilzeitstelle, die flexibel an Ihre Verfügbarkeit angepasst werden kann – von nur wenigen Stunden pro Woche bis hin zu Vollzeit. Hauptverantwortlichkeiten: - KI-Modelle für chemische Anwendungen bewerten. - Modellausgaben analysieren und Feedback zur Verbesserung geben. - Mit dem Entwicklungsteam zusammenarbeiten, um die Einhaltung der Branchenstandards sicherzustellen. - Ergebnisse und Empfehlungen zur Modelloptimierung dokumentieren. - Tests durchführen, um die Leistung und Zuverlässigkeit des Modells zu validieren.
AI Lab
100% Remoteanteil

Freelance Biologie-Experte für KI-Modelltraining (m/w/d)

Eine KI-Forschungsgruppe sucht freiberufliche Biologie-Expert*innen, um KI-Modelle zu bewerten. Ziel des Projekts ist es, die Leistung, Genauigkeit und Zuverlässigkeit von KI-Modellen in allen Bereichen der Biologie zu beurteilen. Die Rolle beinhaltet die enge Zusammenarbeit mit dem Entwicklungsteam, um sicherzustellen, dass die Modelle den Branchenstandards entsprechen und umsetzbare Erkenntnisse liefern. Dies ist eine Remote-Teilzeitstelle, die flexibel an deine Verfügbarkeit angepasst werden kann – von nur wenigen Stunden pro Woche bis hin zu Vollzeit. Hauptaufgaben: - KI-Modelle für biologische Anwendungen bewerten. - Modellausgaben analysieren und Verbesserungsvorschläge geben. - Zusammenarbeit mit dem Entwicklungsteam, um Branchenstandards zu gewährleisten. - Ergebnisse und Empfehlungen zur Modelloptimierung dokumentieren. - Tests durchführen, um Leistung und Zuverlässigkeit der Modelle zu überprüfen.
AI Lab
100% Remoteanteil

Freiberuflicher Bauingenieur mit Python-Erfahrung (m/w/d)

Ein Unternehmen sucht freiberufliche Bauingenieure, die KI-Modelle bewerten. Ziel des Projekts ist es, Leistung, Genauigkeit und Zuverlässigkeit von KI-Modellen im Bauwesen zu prüfen. Die Rolle umfasst eine enge Zusammenarbeit mit dem Entwicklungsteam, um sicherzustellen, dass die Modelle den Branchenstandards entsprechen und umsetzbare Erkenntnisse liefern. Hauptverantwortlichkeiten: - Bewertung von KI-Modellen für Bauingenieur-Anwendungen. - Analyse der Modellausgaben und Feedback zur Verbesserung. - Zusammenarbeit mit dem Entwicklungsteam zur Einhaltung der Branchenstandards. - Dokumentation von Ergebnissen und Empfehlungen zur Modelloptimierung. - Durchführung von Tests zur Überprüfung der Modellleistung und -zuverlässigkeit.
AI Lab
100% Remoteanteil

Freiberuflicher Fahrzeugingenieur (mit Python) – Qualitätssicherung / KI-Trainer

Generative AI-Modelle entwickeln sich sehr schnell weiter, und eines unserer Ziele ist es, sie in die Lage zu versetzen, spezialisierte Fragen zu beantworten und komplexe Denkfähigkeiten zu erreichen. Obwohl jedes Projekt einzigartig ist, umfasst deine Tätigkeit typischerweise: - Inhaltserstellung & -aufbereitung: Erstelle und überarbeite Inhalte, um Genauigkeit und Relevanz über verschiedene Themen der Physik hinweg zu gewährleisten, und entwickle dabei Referenzen und Beispielaufgaben. - Expertengewinnung: Bewerte Qualifikationstests von Experten und stelle ihre Kompetenz sicher. - Chat-Moderation: Unterstütze das Team, indem du projektbezogene Fragen anderer Experten in Discord-Chats beantwortest, insbesondere solche im Zusammenhang mit den Projektvorgaben. - Prüfung der Arbeit: Überprüfe und bewerte von anderen Experten erledigte Aufgaben und stelle sicher, dass sie den Projektvorgaben entsprechen. Gib konstruktives Feedback, überprüfe fachliche Informationen und bearbeite Inhalte bei Bedarf, um die Qualität zu verbessern.
AI Studio
100% Remoteanteil
Neu

Anforderungs- Und Contentmanager (m/w/d)

Ein Unternehmen sucht Unterstützung für ein Projekt, das sich auf die Optimierung der Buy- und Leave-Strecke konzentriert, um die Kundenakquise und -bindung zu verbessern. Ziel ist es, die Effizienz in der Wertschöpfungskette zu steigern, die Markteinführung zu beschleunigen und die Total Cost of Ownership (TCO) zu reduzieren. Die Plattform Adobe Experience Manager (AEM) spielt dabei eine zentrale Rolle, insbesondere im Hinblick auf die Implementierung neuer Features wie Compositions, Templates und Micro-Frontends. Hauptaufgaben: - - Definition und Konzeption von Anforderungen im Bereich CMS Adobe Experience Manager, einschließlich der Festlegung der Entwicklungsreihenfolge von Compositions, Components, Templates und Micro-Frontends. - Unterstützung der Dokumentation und Feedbackschleifen mit Tools wie Jira und Confluence. Projektbezogene Beratung der Entwicklungsteams und Requirement Owner während der Entwicklungsphase. - Analyse der bestehenden CMS-Infrastruktur des Adobe Experience Managers und Ableitung von Handlungsempfehlungen zur Optimierung der Content- und Site-Struktur, der AEM-Interfaces sowie der Performance. - Erstellung von Dokumentationen zur Nutzung der bereitgestellten Compositions & Components und Bereitstellung dieser Informationen an interne Teams. - Fachliche Beratung der Fachabteilungen aus den Bereichen Business und Technology sowie externen Partnern im Rahmen des Change-Programms. - Beratung zu technischen Anforderungen, einschließlich Content Structure, Site Structure, Micro-Frontends, Product Data Modeling, Compositions & Components, Templates, Headless-CMS und AEM Interfaces. - Unterstützung bei Spezialthemen wie Accessibility, CIAM, Multilanguage, Personalisierung und Campaigning.
Telecommunication
München, Deutschland
100% Remoteanteil

Freiberuflicher Physik-Experte (mit Python) – Qualitätssicherung / KI-Trainer

Generative KI-Modelle verbessern sich sehr schnell, und eines unserer Ziele ist es, sie in die Lage zu versetzen, spezialisierte Fragen zu beantworten und komplexe Denkprozesse zu meistern. Auch wenn jedes Projekt einzigartig ist, könnten deine typischen Aufgaben sein: - Inhaltserstellung & -aufbereitung: Erstelle und überarbeite Inhalte, um Genauigkeit und Relevanz in verschiedenen Bereichen der Physik sicherzustellen, und entwickle dabei auch Referenzen und Aufgabenbeispiele. - Expertengewinnung: Bewertung der Qualifikationstests von Experten, um ihre Kompetenz sicherzustellen. - Chatmoderation: Unterstützung durch Beantwortung projektbezogener Fragen anderer Experten in Discord-Chats, insbesondere zu den Projektleitlinien. - Überprüfung der Arbeit: Durchsicht und Bewertung der von anderen Experten erledigten Aufgaben, um sicherzustellen, dass sie den Projektleitlinien entsprechen. Konstruktives Feedback geben, fachspezifische Informationen prüfen und Inhalte bei Bedarf bearbeiten, um die Qualität zu verbessern.
AI Studio
100% Remoteanteil
Neu

Managementberatung (Senior-Level)

Ein Unternehmen sucht Unterstützung im Rahmen des Projektes "SOx way forward". Ziel des Projektes ist die Implementierung und Erweiterung von IT General Controls (ITGC), Access Management und Super User Monitoring in verschiedenen IT-Systemen. Die Aufgabe umfasst die Aufnahme, Detaillierung und Steuerung der Umsetzung der notwendigen Anforderungen. - Planung, Koordinierung und Aufnahme von SOx-relevanten Anforderungen - Aufnahme, Detaillierung und Dokumentation der Anforderungen sowie deren Umsetzung in die IT- und Netzwerkinfrastruktur - Unabhängige Steuerung der Analyse und Implementierung der Anforderungen - Überprüfung der entwickelten Designspezifikationen basierend auf den Anforderungen - Vorbereitung, Planung und Beratung während der Testphase
Telekommunikation
München, Deutschland
100% Remoteanteil

Business Analyst – SAP S/4HANA Output Management (m/w/d)

- Ein Unternehmen sucht einen erfahrenen Business Analysten, der die Transformation von SAP ECC zu S/4HANA Utilities unterstützt. - Ziel des Projekts ist die Analyse, Dokumentation und Optimierung von Output- und Archivierungsprozessen sowie die Erstellung von Fachkonzepten und Spezifikationen. - Der Analyst wird eng mit Product Ownern, IT und Fachbereichen zusammenarbeiten, um die Machbarkeit, den Aufwand und die Priorisierung von Anforderungen abzustimmen.
Energie
München, Deutschland
100% Remoteanteil

Senior Projektmanager Kundeninteraktion

Ein Unternehmen sucht Unterstützung im Rahmen des Projektes zur Evaluation, Implementierung und Weiterentwicklung von Qualitätsbefragungen in digitalen Kanälen. Ziel des Projektes ist es, die Kundenzufriedenheit in digitalen Kanälen zu steigern, Befragungsmethoden zu evaluieren, zu implementieren und weiterzuentwickeln, um eine konsistente Erhebung der Kundenzufriedenheit über alle Kanäle zu ermöglichen. Dabei sollen Verbesserungspotenziale erkannt und umgesetzt werden. Die Rolle umfasst die Beratung, Entwicklung und Umsetzung von Maßnahmen zur Erhebung und Verbesserung der Kundenzufriedenheit in digitalen Kanälen. Hauptaufgaben: - Beratung zu Befragungsmethoden zur Erhebung von Kundenerfahrung und Qualität in digitalen Kanälen, Marktstandards, Benchmarks und Zukunftsausrichtung. - Entwicklung eines Zukunftsmodells zu Qualität in digitalen Kanälen, relevanten KPIs und Erhebungsmethoden sowie Standardprozessen. - Umsetzung der entschiedenen Maßnahmen inklusive Schnittstellenmanagement und Abstimmung mit Technologiepartnern und Sozialpartnern. - Testen von implementierten Maßnahmen zur Erhebung und Sicherstellung der erforderlichen Anforderungen. - Konsolidierung und Aufstellung der bestehenden und fehlenden Kundenbefragungsmethoden/Qualitäts-KPIs in allen verantworteten digitalen Kanälen. - Beratung bei der Erstellung von Entscheidungsvorlagen und Umsetzung der dazu erforderlichen Maßnahmen. - Identifikation von Verbesserungspotenzialen und Entwicklung eines Standardprozesses zur Transparenz und Umsetzung.
Telekommunikation
München, Deutschland
100% Remoteanteil

Freiberuflicher Statistikexperte mit Python-Erfahrung (m/w/d)

Für ein AI-Lab suchen wir einen Statistikexperten mit Python-Erfahrung, um ein KI-Modell (Large Language Model – LLM) zu trainieren. GenAI-Modelle verbessern sich sehr schnell, und eines unserer Ziele ist, sie dazu zu bringen, spezialisierte Fragen zu beantworten und komplexe Schlussfolgerungen zu ziehen. Wenn Sie sich uns anschließen, haben Sie die Möglichkeit, an diesen Projekten mitzuwirken. Auch wenn jedes Projekt einzigartig ist, könnten Sie typischerweise: - Prompts erstellen, die die KI herausfordern. - Umfassende Bewertungskriterien festlegen, um die Genauigkeit der Antworten der KI zu beurteilen. - Die Antworten des Modells anhand Ihres fachspezifischen Wissens korrigieren.
AI Lab
100% Remoteanteil

Projektleiter Zeitschriften / Magazinerstellung (m/w/d)

- Verantwortung für die Koordination und Steuerung des gesamten Produktionsprozesses von Zeitschriftenmagazinen - Planung und Überwachung von Heftstruktur, Terminen, Anzeigen und Workflows - Enge Zusammenarbeit mit Redaktion, Verlagsleitung, Vermarktung, Technik, Marketing, Vertrieb, Druckerei und Dienstleister:innen - Qualitätssicherung bei Layouts, Texten und Druckfreigaben - Kalkulation und Organisation von Zusatzprodukten (z. B. Beileger, Poster, Erweiterungen) - Aktive Rolle in strategischen Projekten, Konferenzen und bei der Einführung neuer Formate
Medienunternehmen
München, Deutschland
50% Remoteanteil

Freiberuflicher Ruby-Entwickler (m/w/d)

Für ein AI-Labor suchen wir einen Ruby-Entwickler, um ein KI-Modell (Large Language Model - LLM) zu trainieren. Du hilfst der KI, die Welt zu verstehen. Als Berater wirst du möglicherweise zu Online-Projekten eingeladen, um das Modell in deinem Fachgebiet zu trainieren. Diese flexible Rolle richtet sich sowohl an Experten, die eine Teilzeittätigkeit (mindestens ein paar Stunden pro Woche) suchen, als auch an diejenigen, die sich für eine Vollzeitstelle interessieren. - Code-Generierung und Code-Review - Auswertung von Prompts und komplexe Datenannotation - Training und Evaluation großer Sprachmodelle - Benchmarking und agentenbasierte Codeausführung in isolierten Umgebungen - Arbeiten mit mehreren Programmiersprachen (Python, JavaScript/TypeScript, Rust, SQL usw.) - Anpassung von Richtlinien für neue Fachgebiete und Anwendungsfälle - Zusammenarbeit mit Projektleitern, Solution Engineers und Supply Managern bei komplexen oder experimentellen Projekten
AI Lab
100% Remoteanteil

Freiberuflicher Maschinenbauingenieur mit Python-Erfahrung (m/w/d)

Für ein KI-Labor suchen wir einen Maschinenbauingenieur mit Python-Erfahrung, um ein KI-Modell (Large Language Model – LLM) zu trainieren. GenAI-Modelle verbessern sich sehr schnell, und eines unserer Ziele ist es, sie in die Lage zu versetzen, spezialisierte Fragen zu beantworten und komplexe Schlussfolgerungen zu ziehen. Wenn du mitarbeitest, hast du die Möglichkeit, an diesen Projekten mitzuwirken. Obwohl jedes Projekt einzigartig ist, könntest du typischerweise: - Inhaltserstellung & -verfeinerung: Erstelle und verfeinere Inhalte, um Genauigkeit und Relevanz in verschiedenen Themen des Maschinenbaus sicherzustellen und entwickle dabei Referenzen und Beispiele für Aufgaben. - Expertenakquise: Prüfe die Qualifikationstests von Experten und stelle ihre Kompetenz sicher. - Chat-Moderation: Unterstütze, indem du projektbezogene Fragen anderer Experten in Discord-Chats beantwortest, insbesondere solche zu Projekt-Richtlinien. - Arbeit prüfen: Überprüfe und bewerte Aufgaben, die von anderen Experten abgeschlossen wurden, um sicherzustellen, dass sie den Projekt-Richtlinien entsprechen. Gib konstruktives Feedback, verifiziere fachbezogene Informationen und bearbeite Inhalte nach Bedarf, um die Qualität zu verbessern.
AI Studio
100% Remoteanteil

Produktmanager POS / Kassensysteme (m/w/d)

Ein Unternehmen sucht einen erfahrenen Produktmanager, idealerweise mit einem Hintergrund im Hospitality-Bereich. Ziel des Projekts ist es, innovative Produktlösungen zu entwickeln und bestehende Prozesse zu optimieren, um die Kundenerfahrung zu verbessern und die Marktposition des Unternehmens zu stärken. Der Produktmanager wird eine Schlüsselrolle bei der Entwicklung und Umsetzung von Produktstrategien spielen und eng mit internen Teams sowie externen Stakeholdern zusammenarbeiten. Reisekosten werden nicht übernommen, daher sollte der Kandidat vorzugsweise in Berlin ansässig sein oder bereit sein, die Kosten selbst zu tragen. - Leitung und Überwachung des gesamten Projektlebenszyklus im Bereich Cloud POS - Entwicklung und Umsetzung von Projektplänen, Zeitplänen und Budgets - Koordination zwischen verschiedenen Teams und Stakeholdern - Sicherstellung der Einhaltung von Projektzielen und -anforderungen - Identifikation und Management von Risiken und Problemen - Berichterstattung an die Geschäftsleitung und andere relevante Parteien
POS Startup
Berlin, Deutschland
100% Remoteanteil

ERP-Transformation Manager (m/w/d)

Ein Unternehmen sucht einen erfahrenen ERP-Transformation Manager, der die Gesamtverantwortung für die Planung und Steuerung eines umfassenden ERP-Transformationsprogramms übernimmt. Ziel des Projekts ist die Harmonisierung von Prozessen, die Einführung eines neuen ERP-Systems und die Umsetzung von IFRS-Anforderungen. Der ERP-Transformation Manager wird die kaufmännischen Kernprozesse im Tief- und Gleisbau analysieren, neugestalten und standardisieren. Dazu gehört die Übersetzung von IFRS-Anforderungen in systemseitige Strukturen und Buchungslogiken, die eng mit den Abteilungen Finance, Controlling, Projektmanagement und IT abgestimmt werden. Die Rolle umfasst die Steuerung der ERP-Einführung, einschließlich Fit-Gap-Analysen, Prozessdesign, Testmanagement und Migration. Zudem wird ein einheitliches Reporting- und KPI-Framework für Konzernabschlüsse und Projektsteuerung aufgebaut. Der Manager wird als zentrale Schnittstelle zwischen operativen Einheiten, Finance, Geschäftsführung und Konzern fungieren und ein nachhaltiges Change- und Trainingskonzept für Anwender etablieren. - Planung und Steuerung des ERP-Transformationsprogramms (IFRS-Transition, Prozessharmonisierung, ERP-Rollout) - Analyse, Neugestaltung und Standardisierung von kaufmännischen Kernprozessen - Übersetzung von IFRS-Anforderungen in systemseitige Strukturen und Buchungslogiken - Steuerung der ERP-Einführung inklusive Fit-Gap-Analysen, Prozessdesign, Testmanagement und Migration - Aufbau eines einheitlichen Reporting- und KPI-Frameworks - Stakeholder-Management und Sicherstellung einer reibungslosen Kommunikation - Leitung von interdisziplinären Projektteams sowie Steuerung externer Berater und Implementierungspartner - Etablierung eines nachhaltigen Change- und Trainingskonzepts - Sicherstellung einer messbaren Prozessoptimierung nach Einführung des ERP-Systems
Infrastrukturbau
Eisenach, Deutschland
70% Remoteanteil

Freiberuflicher Elektroingenieur mit Python-Erfahrung (m/w/d)

Generative KI-Modelle entwickeln sich sehr schnell, und eines unserer Ziele ist es, sie in die Lage zu versetzen, spezialisierte Fragen zu beantworten und komplexe Denkaufgaben zu bewältigen. Obwohl jedes Projekt einzigartig ist, könnten Ihre Aufgaben typischerweise sein: - Inhaltserstellung & Verfeinerung: Erstellen und Überarbeiten von Inhalten, um Genauigkeit und Relevanz in verschiedenen physikalischen Themen sicherzustellen, und Entwickeln von Referenzen und Beispielaufgaben. - Expertengewinnung: Bewerten der Qualifikationstests von Experten und Sicherstellen ihrer Kompetenz. - Chat-Moderation: Unterstützung bei projektbezogenen Fragen anderer Experten in Discord-Chats, besonders zu Projektleitlinien. - Arbeitsprüfung: Überprüfen und Bewerten von Aufgaben anderer Experten, um sicherzustellen, dass sie den Projektleitlinien entsprechen. Konstruktives Feedback geben, fachliche Informationen prüfen und Inhalte bei Bedarf bearbeiten, um die Qualität zu verbessern.
AI Studio
100% Remoteanteil

Freiberuflicher Cybersecurity-Berater für AI Red Teaming

Für ein AI-Labor suchen wir Cybersecurity-Berater, um ein KI-Modell (Large Language Model – LLM) zu trainieren. Du hilfst der KI, die Welt zu verstehen. Als Berater wirst du möglicherweise zu Online-Projekten eingeladen, um das Modell in deinem Fachgebiet zu trainieren. Diese flexible Rolle richtet sich sowohl an Experten, die eine Teilzeit-Beteiligung (mindestens ein paar Stunden/Woche) suchen, als auch an solche, die sich für Vollzeitangebote interessieren - Bewerte und greife AI-Modelle, Agenten und Machine-Learning-Systeme auf Schwachstellen und Sicherheitsrisiken an. - Erstelle offline reproduzierbare und automatisch bewertbare Testfälle, um die Sicherheit und Leistungsfähigkeit von KI-Agenten zu prüfen. - Entwickle und implementiere Automatisierungsskripte, individuelle Tools, Umgebungen und Testumgebungen. - Führe Sicherheitsforschungsinitiativen, insbesondere im Bereich AI-Sicherheit, an oder leiste dazu Beiträge, indem du realistische und herausfordernde Angriffsszenarien für das Modell erstellst und umsetzt. - Berate zu Cybersecurity-Best-Practices und politischen Implikationen.
AI Lab
100% Remoteanteil

Entwickler für Consent Management Implementierung (m/w/d)

Für das Ersetzen der bislang durch Drittanbieter-CMPs durchgeführten Darstellung von ConsentLayern im Web für unsere internationalen Marken sollen diese Layer neu implementiert werden, um diesen im Haus weiter betreiben und ausspielen zu können. Hierzu sind fundierte Kenntnisse in Typescript, Vue.js und klassischen Web-Darstellungstechniken (HTML und CSS) erforderlich. Ziel ist die Lieferung von ausführbarem Code, der alle Requirements umsetzt und automatisierte Tests enthält, die die korrekte Funktion nachweisen. Was genau ist der Beauftragungsumfang: Der Leistungsschwerpunkt besteht in der Erarbeitung von Elementen zur Entscheidungsvorlage des Vorgehens und in der Umsetzung von Maßnahmen entlang des daraus gestalteten Projektverlaufs. Dies beinhaltet konkret die folgenden Leistungspakete: - Implementierung von Code - Implementierung von ausführbaren Tests, die zur Abgabe erfolgreich sein müssen, Testabdeckung >= 80% - Erstellung von Dokumentation zum Code - Erstellung markenspezifischer cmp-config-Dateien. - Erstellung eines Projekts (einschließlich Anforderungen an die Vermögensverwaltung) als Kopie der Consent-Management-Plattform. - Entfernung von netID-Referenzen. - Erstellung markenspezifischer Einstellungen und Dateien für benutzerdefinierte Zwecke/Anbieter. - Hinzufügen neuer markenspezifische CSS-Themes (Variablenwerte, Logos usw.). - Einbeziehung der erforderlichen offiziellen IAB-GVL-Übersetzungen (ES, FR) in die wöchentliche Synchronisierung mit GVL - Implementierung von I18n und Vorbereitung markenspezifischer Datenquellen - Implementierung von PMC2.0-Backend-Nutzungsmodulen - Implementierung der Playout-Logik - Implementierung des Layer-Initialisierungsprozesses (mode=default und mode=resurface) - CDN-Upload- und Freigabeprozess - Projektdokumentation Projektumsetzung: - das gewünschte Ergebnis soll in Typescript und Vue.js verfasst sein, Build per Vite, Tests per Vitest.
Telekommunikation
Karlsruhe, Deutschland
100% Remoteanteil

Freiberuflicher Java-Entwickler (m/w/d)

Für ein AI Lab suchen wir einen Java-Entwickler, um ein KI-Modell (Large Language Model – LLM) zu trainieren. Du hilfst der KI, die Welt zu verstehen. Als Berater wirst du möglicherweise zu Online-Projekten eingeladen, um das Modell in deinem Fachgebiet zu trainieren. Diese flexible Rolle eignet sich sowohl für Experten, die eine Teilzeit-Tätigkeit anstreben (mindestens wenige Stunden pro Woche), als auch für Interessierte an Vollzeitmöglichkeiten. - Code-Erzeugung und Code-Review - Bewertung von Prompts und komplexe Datenannotation - Training und Bewertung großer Sprachmodelle - Benchmarking und agentenbasierte Code-Ausführung in geschützten Umgebungen - Arbeit mit mehreren Programmiersprachen - Anpassung von Richtlinien für neue Domänen und Anwendungsfälle - Einhaltung projektspezifischer Vorgaben und Anforderungen - Zusammenarbeit mit Projektleitern, Solution Engineers und Supply Managern bei komplexen oder experimentellen Projekten
AI Lab
100% Remoteanteil
Neu

Commissioning & Qualification (C&Q) Ingenieur (m/w/d)

Ein Unternehmen sucht einen erfahrenen Commissioning & Qualification (C&Q) Engineer, um Produktionsanlagen gemäß GMP-Standards zu qualifizieren und in Betrieb zu nehmen. Ziel des Projekts ist es, die technischen und organisatorischen Voraussetzungen für die GMP-konforme Qualifizierung der Produktionsanlagen sicherzustellen. - Eigenständige Durchführung von Commissioning- und Qualification-Aktivitäten, insbesondere im Bereich IOQ - Bedienung von PCS7-Systemen - Arbeit mit Single-Use-Equipment - Durchführung von Commissioning- und Qualification-Aktivitäten für Produktionsanlagen - Sicherstellung aller technischen und organisatorischen Voraussetzungen für C&Q - GMP-konforme Qualifizierung der zugehörigen Produktionsanlagen
Pharma
München, Deutschland
100% Remoteanteil

Freiberuflicher Redakteur (m/f/d)

- Du erstellst Themenbriefings, recherchierst und verfasst fachlich fundierte (Ratgeber)Texte in einem anspruchsvollen Sprachstil und redigierst die Beiträge unserer freien Autor:innen - Die Themenbereiche umfassen die Zielgruppe der Hobbygärtner:innen im Garten- und Pflanzenbereich, sowie die Bereiche Wohnen und Einrichten, Design und Deko, Do it yourself, aber auch Kochen und Ernährung gehören zu Spektrum dazu - Im engen Austausch mit Kolleg:innen, Leser:innen und Expert:innen entwickelst du spannende Themen und bereitest diese zielgruppengerecht auf - Auch das Pflegen und Ausbauen von Pressekontakten, sowie das Bestellen von Fotomaterial im Garten-/Wohn- und Dekobereich zählt zu deinen Aufgaben - Optional werden Fotoproduktionen organisiert und durchgeführt sowie auch Pressetermine und Messebesuche wahrgenommen
Medienunternehmen
München, Deutschland
50% Remoteanteil

KI-Berater – Data Science (m/w/d)

Wir suchen erfahrene Data Scientists, die rechnerisch aufwendige Data-Science-Aufgaben für ein fortgeschrittenes KI-Evaluationsprojekt erstellen. Dies ist eine ortsunabhängige, projektbezogene Möglichkeit für Expert:innen, die herausfordernde Aufgaben entwerfen können, die rechnerische Methoden erfordern und den vollständigen Data-Science-Lebenszyklus abbilden – von Datenerfassung und -verarbeitung über statistische Analysen bis hin zu umsetzbaren Business-Insights. Was Sie tun werden - Entwerfen originelle, rechnerisch aufwendige Data-Science-Aufgaben, die realistische Analyse-Workflows aus verschiedenen Branchen simulieren (Telekommunikation, Finanzen, Verwaltung, E-Commerce, Gesundheitswesen) - Erstellen von Aufgaben, die zur Lösung Python-Programmierung erfordern (mit pandas, numpy, scipy, sklearn, statsmodels, matplotlib, seaborn) - Sicherstellen, dass die Aufgaben so rechenintensiv sind, dass sie manuell nicht in angemessener Zeit (Tage/Wochen) lösbar sind - Entwickeln von Aufgaben, die nicht-triviale Schlussfolgerungsketten in Datenverarbeitung, statistischer Analyse, Feature Engineering, prädiktiver Modellierung und Insight-Extraction erfordern - Erstellen deterministischer Aufgaben mit reproduzierbaren Antworten – Vermeiden stochastischer Elemente oder Festlegen fester Zufalls-Samen für exakte Reproduzierbarkeit - Basieren der Aufgaben auf echten Business-Herausforderungen: Kundenanalyse, Risikobewertung, Betrugserkennung, Forecasting, Optimierung und operative Effizienz - Entwerfen von End-to-End-Aufgaben, die die komplette Data-Science-Pipeline abdecken (Datenaufnahme → Bereinigung → EDA → Modellierung → Validierung → Deployment-Überlegungen) - Einbinden von Big-Data-Verarbeitungs-Szenarien, die skalierbare Rechenansätze erfordern - Überprüfen der Lösungen mit Python und gängigen Data-Science-Bibliotheken sowie statistischen Methoden - Klare Dokumentation der Aufgabenstellungen mit realistischen Business-Kontexten und Bereitstellung verifizierter, korrekter Antworten
AI Lab
München, Deutschland
100% Remoteanteil
Neu

Senior Faktor 10 Entwickler (IPS / IPM) (m/w/d)

Ein Versicherungsunternehmen in Nürnberg sucht einen Senior Faktor 10 Entwickler mit Expertise in IPS und IPM. Das Projekt umfasst die Entwicklung und Optimierung von Softwarelösungen im Versicherungsbereich, mit Fokus auf hohe Performance und Zuverlässigkeit. Die Rolle erfordert fundierte Kenntnisse in Faktor 10 und dessen Anwendungen im Versicherungssektor. Hauptaufgaben: - Entwicklung und Optimierung von Anwendungen mit Faktor 10, insbesondere in den Bereichen IPS und IPM. - Zusammenarbeit mit interdisziplinären Teams, um eine nahtlose Integration und Funktionalität sicherzustellen. - Analyse und Behebung komplexer technischer Probleme. - Technische Anleitung und Mentoring von Junior-Entwicklern. - Sicherstellung der Einhaltung von Branchenstandards und Best Practices.
Versicherung
Nürnberg, Deutschland
100% Remoteanteil

IT Projektleiter ServiceNow (Senior)

- Ein Unternehmen aus der Energie- und Energiedienstleistungsbranche sucht einen erfahrenen IT Projektleiter für ein ServiceNow-Projekt. - Ziel des Projekts ist die Leitung und erfolgreiche Umsetzung eines Enterprise-ServiceNow-Projekts mit Fokus auf ITSM und Customer Service Management (CSM). - Die Rolle umfasst die Planung, Steuerung und Sicherstellung eines stabilen Projektablaufs in enger Zusammenarbeit mit internen und externen Stakeholdern. - Operatives & strategisches Service Management der ServiceNow-Plattform - Prozessverantwortung für ITSM und CSM (B2B & B2C) - Prozessdesign, Governance & kontinuierliche Optimierung - Steuerung externer Provider und Dienstleister - Monitoring, KPI-Analysen & Ableitung von Verbesserungen - Sicherstellung eines stabilen Plattformbetriebs
Energie
Deutschland
100% Remoteanteil

Chemiker mit Python-Erfahrung (m/w/d)

GenAI-Modelle verbessern sich sehr schnell, und eines unserer Ziele ist es, sie in die Lage zu versetzen, spezialisierte Fragen zu beantworten und komplexe Denkaufgaben zu bewältigen. Wenn Sie der Plattform als KI-Tutor im Bereich Chemie beitreten, haben Sie die Möglichkeit, an diesen Projekten mitzuarbeiten. Obwohl jedes Projekt einzigartig ist, könnten Sie typischerweise: - Prompts erstellen, die die KI herausfordern. - Umfassende Bewertungskriterien definieren, um die Genauigkeit der KI-Antworten zu prüfen. - Die Antworten des Modells anhand Ihres fachspezifischen Wissens korrigieren.
AI Lab
100% Remoteanteil

Senior Web-Entwickler (m/w/d)

- Du entwickelst moderne, performante Web-Frontends mit React, TypeScript, HTML und CSS - Du setzt responsive Designs unter Berücksichtigung von Accessibility und Performance um - Du planst und führst Unit- und Integrationstests (zum Beispiel mit Playwright) durch - Fehlerbehebung in Entwicklungs-, Test- oder Live-Umgebung
Medienunternehmen
München, Deutschland
100% Remoteanteil

Sales Manager für ein Medienunternehmen (m/f/d)

- Eigenständige Vermarktung unseres Markenportfolios durch innovative Lizenz-, Marken- und Lifestyle-Kooperationen zur Schaffung einzigartiger Markenerlebnisse - Verantwortung für definierte Branchen im Vertriebsteam, einschließlich der strategischen Weiterentwicklung, Identifizierung und Ansprache von Zielkunden sowie fortlaufender Markt- und Trendanalysen - Aufbau neuer Partnerschaften durch die Gewinnung neuer Lizenzpartner und die Betreuung sowie Weiterentwicklung bestehender Lizenznehmer - Planung, Steuerung und Kontrolle des Budgets für die verantworteten Branchen mit einem strategischen Fokus - Teilnahme an relevanten Branchenmessen um Trends aufzunehmen und potenzielle Partner zu akquirieren - Anpassung von Vermarktungsunterlagen und Angeboten, um sie gezielt auf individuelle Kundenbedürfnisse zuzuschneiden - Funktion als Schnittstelle & erste:r Ansprechpartner:in für externe Sales-Partner, inklusive Bewertung und Abstimmung von Verkaufspotentialen - Förderung einer effektiven Zusammenarbeit zwischen Sales und Brand Management - Pflege und Nutzung des CRM-Systems sowie von Potentialübersichten
Medienunternehmen
Hamburg, Deutschland
100% Remoteanteil

Biologe mit Python-Erfahrung (m/w/d)

GenAI-Modelle entwickeln sich sehr schnell, und eines unserer Ziele ist es, sie in die Lage zu versetzen, spezialisierte Fragen zu beantworten und komplexe Denkaufgaben zu lösen. Wenn du der Plattform als KI-Tutor im Bereich Biologie beitrittst, hast du die Möglichkeit, an diesen Projekten mitzuwirken. Obwohl jedes Projekt einzigartig ist, könntest du typischerweise: - Prompts erstellen, die die KI herausfordern. - Umfassende Bewertungskriterien festlegen, um die Genauigkeit der KI-Antworten zu prüfen. - Die Antworten des Modells mithilfe deines Fachwissens korrigieren.
AI Lab
100% Remoteanteil

Frontend developer to HR platform with Angular experience

Reach out to us if you are interested in working with us on the project.
FRATCH
München
90% Remoteanteil
Registriere dich um Zugang zu weiteren spannenden Projekten zu erhalten, die deinen Fähigkeiten und Vorlieben entsprechen!

KI-Agent Evaluationsanalyst (m/w/d)

Neu
Melde dich an, um die Anzahl der Bewerber zu sehen
Industrie
Informationstechnologie (IT)
Bereichen
Forschung und Entwicklung (F&E)
Qualitätssicherung

Projekt Info

  • Tagessatz
    Ab 280€
  • Sprache
    • Englisch
      (Verhandlungssicher)
  • Remoteanteil
    100%

Beschreibung

Wir suchen QA-Tester für autonome KI-Agenten in einem neuen Projekt, das sich auf Validierung und Verbesserung komplexer Aufgabenstrukturen, Richtlinienlogik und Bewertungsrahmen für Agenten konzentriert. Im Verlauf des Projekts musst du Qualitätssicherung, Recherche und logisches Problemlösen in Einklang bringen. Diese Projektmöglichkeit eignet sich besonders für Menschen, die Systeme ganzheitlich betrachten und Szenarien, Folgen und Randfälle durchdenken.

Du brauchst keinen Programmierhintergrund, musst aber neugierig, intellektuell gründlich und in der Lage sein, die Schlüssigkeit und Konsistenz komplexer Setups zu bewerten. Wenn du jemals in Bereichen wie Beratung, Quizshows (CHGK), Olympiaden, Falllösungen oder Systemdenken erfolgreich warst, könntest du gut zu uns passen.

Was du tun wirst:

  • Bewertung von Aufgaben und Szenarien auf Logik, Vollständigkeit und Realismus.
  • Aufdecken von Inkonsistenzen, fehlenden Annahmen oder unklaren Entscheidungsstellen.
  • Mitwirkung bei der Definition klarer Erwartungsverhalten (Goldstandards) für KI-Agenten.
  • Markierung von Ursache-Wirkungs-Beziehungen, Gedankengängen und plausiblen Alternativen.
  • Durchdenken komplexer Systeme und Richtlinien aus menschlicher Perspektive, um sicherzustellen, dass Agenten richtig getestet werden.
  • Enge Zusammenarbeit mit QA, Autoren oder Entwicklern, um Verfeinerungen oder Randfallabdeckung vorzuschlagen.

Anforderungen

  • Ausgeprägtes analytisches Denkvermögen: Kann komplexe Systeme, Szenarien und logische Folgen durchdenken.
  • Höchste Genauigkeit: Erkennt Widersprüche, Unklarheiten und vage Anforderungen.
  • Vertrautheit mit strukturierten Datenformaten: Kann JSON/YAML lesen (Schreiben nicht erforderlich).
  • Ganzheitliche Bewertung von Szenarien: Was fehlt, was ist unrealistisch, wo können Probleme auftreten?
  • Gute Kommunikationsfähigkeiten und klare Schreibweise (auf Englisch), um deine Ergebnisse zu dokumentieren.

Wir schätzen außerdem Bewerber mit:

  • Erfahrung in Richtlinienbewertung, Logikrätseln, Fallstudien oder strukturiertem Szenariodesign.
  • Hintergrund in Beratung, Wissenschaft, Olympiaden (z.B. Logik/Mathe/Informatik) oder Forschung.
  • Erfahrung mit LLMs, Prompt Engineering oder KI-generierten Inhalten.
  • Vertrautheit mit QA oder Testfalldenken (Randfälle, Ausfallmodi, "Was könnte schiefgehen").
  • Grundkenntnisse darüber, wie Bewertung oder Scoring in Agententests funktioniert (Präzision, Abdeckung usw.).