LLM-Trainer und Spezialist für Reasoning mit über 3 Jahren Erfahrung in der Erstellung hochpräziser Prompts, Bewertungsrichtlinien und Goldstandard-Benchmarks in Wissenschaft/Technik, Rechtsgrundsätzen, Gesundheit & Lifestyle.
Ich übersetze komplexe, stark policy-geprägte Anweisungen in klare, prüfbare Arbeitsabläufe – einschließlich Begründungsnotizen, Entscheidungsbäumen, Kalibrierungssätzen für Gutachter und Fehler-Taxonomien – die die Übereinstimmung erhöhen, Nacharbeit verringern und den Durchsatz steigern.
Nachweisliche Qualitätsleistung im großen Maßstab: 98,85% bestandene QA-Audits über 815 überprüfte Aufgaben, zuverlässige SLA-Einhaltung in vollständig entfernten, schnell iterierenden Umgebungen. Meine Stärken liegen im Reasoning-zentrierten Prompt-Design (gestufte Varianten, Einschränkungen, Unsicherheitssprache), Evaluationsprozessen (analytische/holistische Rubriken, Teil-Punkt-Logik, Schwere-Tagging, AQL-Stichproben) und Governance zu Sicherheit/Faktentreue (Bias-/Fairness-Screenings, Non-Advice-Formulierungen, evidenzbeschränkte Prompts).
Ich arbeite eng mit Forschung und Evaluationsleitern zusammen, um Modellfehleranalysen in abgeleitete Prompts, adversariale Testsätze, klarere Akzeptanzkriterien und versionierte SOPs mit vollständigen Audit-Trails zu überführen. Versiert im Umgang mit unternehmensweiten Annotations- und QA-Plattformen; akribisch in Bezug auf Metadaten-Hygiene, Vorlagenwiederverwendung und Dokumentation, die über Gutachter und Projekte hinweg skaliert.
Entdecken Sie andere Experten mit ähnlichen Qualifikationen und Erfahrungen.
2025 © FRATCH.IO GmbH. All rights reserved.