Verbesserte die Reaktionsfähigkeit des Sprachassistenten im Fahrzeug durch Optimierung technischer Lösungen für die Audio-Datenverarbeitung.
Verbesserte die Qualität der Datensätze und die Robustheit der Modelle durch Erzeugung synthetischer Daten aus Hugging Face-Quellen.
Erhöhte die kontextuelle Relevanz der Antworten des Sprachassistenten durch optimiertes KI-Prompt-Engineering.
Reduzierte Transkriptionsfehler durch Behebung von Inkonsistenzen zwischen Audioeingaben und Abschriften.
Steigerte die Teamproduktivität und die Software-Liefergeschwindigkeit durch Automatisierung von Workflows und aktive Mitgestaltung von Agile-Updates.
Erfasste Intents in verschiedenen Datensätzen und standardisierte die Daten mit JSON.
Erstellte Annotationsrichtlinien und bewertete die Qualität der Annotatoren.
Erzeugte vielfältige synthetische Äußerungen mit LLMs, einschließlich Koreanisch.
Nutzte Clustering, um Äußerungen Intents zuzuordnen und Sub-Intents zu identifizieren.
Identifizierte und entfernte verrauschte oder doppelte Äußerungen mithilfe von LLMs.
Erstellte Visualisierungen zur Datenanalyse und Verbesserung der Datensatzqualität.
März 2023 - Aug. 2024
1 Jahr 6 Monaten
Wissenschaftliche Hilfskraft
Max-Planck-Institut für Bildungsforschung
Ermöglichte fortgeschrittene Analysen großer Datensätze durch Entwicklung einer Text-Cluster-Lösung mit BERT, distilBERT, RoBERTa und text-embedding-ada-002.
Bewältigte Vertrauensprobleme von Informationen in Krisenszenarien durch Entwicklung von Suchmaschinenmodulen mit Elasticsearch in Docker.
Erweiterte die Forschungsdatenquellen durch Automatisierung von API-Aufrufskripten zum Abrufen von YouTube-Transkripten und -Kommentaren.
Erleichterte die Forschungszusammenarbeit durch Leitung virtueller Workshops mit strukturierten Diskussionen und Teilnehmerabstimmungen.
Führte wissenschaftliche Literaturrecherchen durch.
Führte Datenpflege und -verarbeitung mit Excel und Python-Datenpipelines durch und berichtete sowie präsentierte Ergebnisse.
Implementierte eine Analyse von Text-Cluster-Methoden mit BERT-basierten Transformern.
Entwickelte einen Prototyp einer Suchmaschine für eine Wissensdatenbank zu COVID-19 Social-Media-Daten mit Python, Docker, Jupyter und ElasticSearch.
Implementierte Python-Skripte zur Datenbeschaffung von YouTube und Preprint-Servern.
Unterstützte die interne Dokumentation technischer Abläufe, wie Richtlinien zum GPU-Zugriff in der Abteilung.
Moderierte und unterstützte die Organisation des virtuellen SciBeh-Workshops 2024 zum Thema Epistemic Trespassing.
Sprachen
Koreanisch
Muttersprache
Englisch
Verhandlungssicher
Deutsch
Fortgeschritten
Ausbildung
Okt. 2021 - Aug. 2025
Freie Universität Berlin
Master in Data Science · Data Science · Berlin, Deutschland · 1.9
März 2016 - Aug. 2021
Sungkyunkwan University
Bachelor in Volkswirtschaftslehre · Volkswirtschaftslehre · Korea, Republik · 1.6
März 2013 - Feb. 2016
Jung-hwa Girls Highschool
Daegu, Korea, Republik · 1.2
Sie suchen Freelancer?Passende Kandidaten in Sekunden!