Arbeitete an der Schulung des Gemini-Modells von Google für Data Science- und Datenanalyseaufgaben mit maßgeschneiderten SFT- und RLHF-Techniken und verbesserte so die Modellantworten um 60%
Half bei der Definition und Lösung von Geschäftsproblemen, eines davon sparte bis zu 100.000 USD monatlich ein, indem nach gründlichen datenbasierten Erkenntnissen eine menschliche Ebene entfernt wurde
Erstellte hochwertige Notebooks mit BigQuery und Python, die direkt zum Training des KI-Coding-Assistenten von Google Colab beitrugen und die Effizienz der Datenwissenschaftler um 50% steigerten
Erstellte robuste Datenpipelines in Hex, beseitigte Inkonsistenzen, was die Datenqualität um 7–8% verbesserte
Automatisierte Berichtserstellung und den Versand per E-Mail, wodurch pro Bericht im Durchschnitt 2,5 Stunden Arbeit eingespart wurden
Erstellte, pflegte und optimierte Datenpipelines und SQL-Abfragen, wodurch die gesamte Ausführungszeit von 2 Stunden auf 3 Minuten verkürzt wurde.
März 2023 - Apr. 2024
1 Jahr 2 Monaten
Islamabad, Pakistan
Associate Datenanalyst
Global Rescue LLC
Führte Datenmanipulation und Automatisierung mit Python durch und sparte so im Durchschnitt 5–6 Stunden pro Tag
Nutzte Python und SQL zur Datenanalyse von Reisedaten, fand Muster, die dem Unternehmen halfen, in der Hochsaison mehr Abonnements zu verkaufen, was rund 15% mehr Umsatz bei Abonnements brachte
Entwickelte ein Streamlit-Dashboard, das dabei half, Datenprobleme zu erfassen und zu beheben, und innerhalb von Sekunden Berichte generierte, wodurch die manuelle Arbeit entfiel und die Effizienz um 90% stieg
Arbeitete im Data- und BizOps-Team, um Kosten zu senken, wovon eins dem Unternehmen 12.000 USD pro Monat einsparte
Entdeckte und reparierte einen Datenparser, der seit 2 Monaten wegen eines falschen Datenfelds ausgefallen war und über 1.000 Reisende betraf.
Juli 2021 - Apr. 2024
2 Jahren 10 Monaten
Datenwissenschaftler – Level II
Fiverr
Entwickelte einen XGBoost-Klassifikator, der 98% der betrügerischen Transaktionen erkannte (vorherige Genauigkeit 90%), und half so der Bank, jährlich 500.000 USD Verluste zu vermeiden. Baute ein komplettes System mit Zwei-Stufen-Verifizierung
Führte Hypothesentests mit Online-Taxidaten durch und steigerte dadurch die Einnahmen der Fahrer um 30%, indem empfohlen wurde, Kartenzahlung statt Bargeld anzubieten, da Kunden Karten bevorzugten
Entwickelte einen Random-Forest-Klassifikator mit 88% Genauigkeit, trainiert und evaluiert an einem großen Datensatz von Tweets zur Erkennung von Hass- und beleidigenden Tweets mithilfe verschiedener NLP-Techniken, und baute eine Streamlit-Web-App, um das Melden markierter Tweets zu erleichtern
Entwickelte einen interaktiven PDF-Q&A-Chatbot mit LangChain und OpenAI, nutzte chromaDB als Vektorspeicher für Retrieval Augmentation Generation (RAG) und Streamlit für ein Interface, das PDFs als Eingabe erfordert, und setzte Prompt-Engineering ein, um basierend auf der PDF 100% korrekte Antworten zu liefern.
Sprachen
Urdu
Muttersprache
Englisch
Verhandlungssicher
Ausbildung
Okt. 2018 - Juni 2022
IUB
Bachelor of Engineering · Computersystemtechnik · Bahawalpur, Pakistan · 3,69/4,0
Zertifikate & Bescheinigungen
Data Scientist Associate
DataCamp
Einführung in Docker
Einführung in MLOps & End-to-End Machine Learning
Einführung in SQL & Data Warehousing
Sie suchen Freelancer?Passende Kandidaten in Sekunden!