Entwickelte ein RAG-System zur Automatisierung von Studentenanfragen mit 96% Genauigkeit. Implementiert mit FastAPI und LangChain, auf dem Universitätsserver mit Docker bereitgestellt.
Bewertete die Leistung mit RAGAS, verglich LLMs (Llama3.3, Llama3.1, GPT-4o-mini), Vektor-Embeddings und verschiedene Retrieval-Techniken innerhalb der RAG-Pipeline.
Führte Multi-Label-Klassifikation auf einem Datensatz von Elektromagnetspulen durch und erreichte einen F1-Score von 0,94.
Untersuchte Stable Diffusion img2img- und Dreambooth txt2img-Techniken zur Datenaugmentation auf dem Elektromagnetspulen-Datensatz und erzielte mit der img2img-Technik eine Verbesserung des F1-Scores um 2,1%.
Führte Datenvorverarbeitung für Marketingdaten durch, einschließlich Bereinigung, Transformation und Normalisierung, sicherte die Analysebereitschaft und reduzierte den manuellen Aufwand um 45%.
Verwendete SQL und Excel zur Analyse von Einladungen, die an Interessenten für eine Online-Marketing-Veranstaltung gesendet wurden.
Technische Fähigkeiten: Python, SQL, Selenium, Beautiful Soup, Power BI, Excel
Juni 2019 - Dez. 2020
1 Jahr 7 Monaten
Noida, Indien
Data Scientist
Samsung Research Institute
Leitete ein Team von vier Ingenieuren beim Aufbau skalierbarer AI/ML-Lösungen und Proof of Concepts (PoCs).
Entwickelte ML-Lösungen für Samsung-Smartphones zur Verbesserung des Log-Debuggings und der Hate-Speech-Klassifikation.
Entwickelte und setzte ML-Modelle als REST-APIs mit Python, Flask und Docker um.
Implementierte ML-Modelle auf AWS Lambda und SageMaker für Echtzeit- und Batch-Inferenz.
Entwarf CI/CD-Pipelines für die Bereitstellung und Integration von Modellen mit GitHub Actions und AWS-Services.
Implementierte ein prädiktives Kühlsystem für Samsung-Smartphones, das die Gerätetemperatur bis zu 15 Sekunden im Voraus mit einem RMSE von 1,17 °C vorhersagt, unter Verwendung von Zeitreihenmodellierungstechniken.