Christine Haehner-Murdock
KI-Bewertungs-Fallstudie – Versagen bei der Überschreibung von Beschränkungen
Erfahrungen
KI-Bewertungs-Fallstudie – Versagen bei der Überschreibung von Beschränkungen
- Entwurf und Durchführung eines strukturierten Testgerüsts zur Überprüfung, ob explizite Antwortmodus-Beschränkungen in mehrstufigen LLM-Interaktionen bestehen bleiben
- 42 experimentelle Durchläufe mit mehreren Spitzenmodellen
- Vergleich von frühzeitigem gegenüber spätem Einfügen der Beschränkungen
- Analyse des Driftbeginns, des Erfolgs der Überschreibung und stilistischer Abweichungen
- Reproduzierbarer Datensatz und dokumentiertes Evaluationsprotokoll
- Fokus: Robustheit der Instruktionshierarchie bei der Ansammlung von Gesprächszuständen
Unabhängiger Forscher
Selbstständig
- Laufende Entwicklung von Bewertungsexperimenten und Datensätzen zur Dokumentation des Modellverhaltens unter strukturierten Interaktionsbeschränkungen
Senior-Dozent – Sozialwissenschaften & Wirtschaft
Selbstständig
- Unterrichtet und Lehrpläne entwickelt in Soziologie, Wirtschaftswissenschaften, Politikwissenschaft und Philosophie
- Schwerpunktbereiche:
- Institutionelle Systeme
- Governance-Strukturen
- Wirtschaftliche Entscheidungsrahmen
Zusammenfassung
Unabhängiger KI-Evaluationsforscher mit Schwerpunkt auf Verhaltenstests großer Sprachmodelle in strukturierten Gesprächsszenarien. Entwirft Testgerüste zur Analyse der Persistenz von Beschränkungen, der Robustheit der Instruktionshierarchie und der Stabilität der Antwortmodi in mehrstufigen Interaktionen.
Hintergrund in Sozialwissenschaften und Wirtschaft mit Schwerpunkt auf sozio-technischen Systemen, institutionellen Dynamiken und Entscheidungsrahmen.
Interesse an Modellevaluation, Sicherheitstests, Analyse der Prompt-Robustheit und an Rahmenwerken zur Mensch-KI-Interaktion.
Unabhängige Forschung zu KI-Evaluationsmethoden und Mensch-KI-Interaktionssystemen.
Laufende Entwicklung von Bewertungsexperimenten und Datensätzen zur Dokumentation des Modellverhaltens unter strukturierten Interaktionsbeschränkungen.
Fähigkeiten
Ki-evaluation
- Entwurf Von Prompt-testgerüsten Für Verhaltensprüfungen Von Modellen
- Bewertung Von Mehrstufigen Interaktionen
- Analyse Der Instruktionshierarchie
- Prompt-robustheitstests
- Entwurf Von Evaluationsprotokollen
- Strukturierte Experimentdokumentation
Technische Kenntnisse
- Git/github-workflow
- Protokollierung Von Experimenten In Json/csv
- Entwurf Strukturierter Datensätze
- Prompt-engineering
Analytische Bereiche
- Sozio-technische Systeme
- Institutionenanalyse
- Governance-rahmenwerke
- Ökonomische Anreizstrukturen
Sprachen
Ausbildung
Masterabschluss · Sozialwissenschaften
Profil
Frequently asked questions
Sie haben Fragen? Hier finden Sie weitere Informationen.
Wo ist Christine ansässig?
Welche Sprachen spricht Christine?
Für welche Rollen wäre Christine am besten geeignet?
Was ist das neueste Projekt von Christine?
Was ist die Ausbildung von Christine?
Wie ist die Verfügbarkeit von Christine?
Wie hoch ist der Stundensatz von Christine?
Wie kann man Christine beauftragen?
Durchschnittlicher Tagessatz für ähnliche Positionen
Die Tagessätze basieren auf aktuellen Projekten und enthalten keine FRATCH-Marge.
Ähnliche Freelancer
Entdecken Sie andere Experten mit ähnlichen Qualifikationen und Erfahrungen
Experten, die kürzlich an ähnlichen Projekten gearbeitet haben
Freelancer mit praktischer Erfahrung in vergleichbaren Projekten als KI-Bewertungs-Fallstudie – Versagen bei der Überschreibung von Beschränkungen
Freelancer in der Nähe
Fachkräfte, die in oder in der Nähe von Siegen, Deutschland arbeiten