Momin Q.

Gründungs-GenAI-Ingenieur

Lahore, Pakistan

Erfahrungen

Juli 2025 - Bis heute
4 Monaten
Kanada

Gründungs-GenAI-Ingenieur

Tyce.ai

  • Mitwirkung als einer von drei Kernentwicklern beim Aufbau und Skalieren des KI-gestützten Dokumentenassistenten von Tyce.
  • Implementierung des „Tyce Agent“ mit PydanticAI, einschließlich Feintuning des Agentenverhaltens, Design der Agenten-Tools, Streaming der Antworten und Optimierung.
  • Optimierung der agentischen RAG-Suche durch kontextbasiertes Retrieval.
  • Entwicklung eines eigenen HTML-Splitters für stabileres und stilbewusstes Dokumenten-Chunking.
  • Skalierung der Data-Ingestion-Pipeline zur Verarbeitung von über 100.000 Dokumenten in wenigen Minuten durch Verlagerung der Ingestion auf AWS Lambda.
  • Einsatz fortschrittlicher Techniken wie Chunking-Optimierung, parallele Verarbeitung und selektive Verarbeitung zur Reduzierung der Kosten und Verarbeitungszeit um 20–90 %, je nach Dokument.
  • Teilnahme an Produkt-Roadmap- und Architektur-Diskussionen, um technische Ausrichtung und Nutzererfahrung mitzugestalten.
  • Stack: Pydantic AI, FastAPI, Python, PostgreSQL, AWS Lambda, SST, OpenAI API, Docker, CI/CD
Sept. 2022 - Juli 2025
2 Jahren 11 Monaten
Vereinigte Staaten

Softwareentwickler / Teamleiter

Turing

  • Entwurf von Datenpipelines, die über 10.000 multimodale Samples (2 Mio.+ Tokens) kuratierten und transformierten, um hochmoderne LLMs mit den neuesten Trainingsformaten (RLHF, SFT, DPO, ORPO etc.) zu trainieren.
  • Fine-Tuning und Evaluierung von Code-Generierungs- und Chat-Modellen mit Hugging Face Transformers, Erhöhung der Pass-@-1-Genauigkeit auf 70 % und Reduzierung von Halluzinationen um 18 %.
  • Aufbau eines automatisierten Evaluierungsharness, das die Modellvalidierungszyklen um 40 % verkürzte.
  • Einführung halbüberwachter Active-Learning-Workflows und Auto-Labeling-Pipelines, wodurch der manuelle QA-Aufwand um das Fünffache reduziert wurde.
  • Leitung eines funktionsübergreifenden Teams von 12 Data Engineers, Mentoring in Prompt Engineering, Datensatzdesign und skalierbaren MLOps-Best Practices.
  • Implementierung robuster PII- und Toxizitätserkennung in Python & SQL mit 99,2 % Präzision und Sicherstellung der SOC-2- und GDPR-Konformität.
  • Deployment von GenAI-Services auf Kubernetes mit GitOps-Praktiken über GitHub-CI/CD-Pipelines, um Rollouts und Rollbacks in der Produktion zu optimieren.
  • Integration von Modellen in externe Plattformen wie ServiceNow zur Ermöglichung von Echtzeit-KI-gestützten Workflows.
  • Bereitstellung der Cloud-Infrastruktur auf AWS, GCP und Azure mittels Infrastructure as Code (IaC) zum Bereitstellen und Verwalten von GenAI-Trainings-Tools – einschließlich Evaluierungsharness, Datenpipelines und Model Serving – bei einer SLA von 99,99 %.
  • Stack: Python, PyTorch, Hugging Face, SQL, Airflow, Docker, Kubernetes, GitHub, GitOps, Terraform, AWS, GCP, Azure, ServiceNow
Juli 2021 - Aug. 2022
1 Jahr 2 Monaten
Lahore, Pakistan

Softwareentwickler

Arbisoft

  • Schlüsselrolle bei der Entwicklung und Wartung robuster, cloudbasierter ETL-Pipelines für eine führende Fashion-Analytics-Plattform, wodurch ein zuverlässiger Fluss von über 4 TB Rohdaten pro Tag sichergestellt wurde.
  • Zusammenarbeit mit einem vollständig Remote arbeitenden Team über 3 Zeitzonen hinweg, Nutzung von Sprint-Ritualen und klarer Dokumentation zur termingerechten Erreichung von 95 % der Roadmap-Meilensteine.
  • Überarbeitung der Extraktionskomponente einer Fashion-Analytics-Pipeline (über 20.000 Codezeilen), Reduzierung der täglichen Laufzeit um 36 % und Einsparung von 45.000 $ pro Jahr bei den Compute-Kosten.
  • Entwicklung und Wartung von Full-Stack-Features: React-Dashboards für Merchandising-Teams, unterstützt von Django-REST-API-Endpunkten und AWS API Gateway.
  • Sicherstellung der Datenintegrität und Performance durch automatisierte Tests (PyTest + Cypress), Erreichen von 85 % Testabdeckung und täglichen CI-Läufen.
  • Deployment von Micro-Frontends und Python-Services via Docker/Kubernetes und Terraform, Ermöglichung von Blue-Green-Releases mit weniger als 5 Minuten Rollback.
  • Stack: Django, React, Scrapy, AWS (EC2, DynamoDB, Redshift, Lambda, Glue), Airflow, GitLab, Kubernetes
Juni 2019 - Aug. 2019
3 Monaten
Lahore, Pakistan

Praktikant Webentwicklung

Women In Struggle for Empowerment (WISE)

  • Verbesserung der API-Antwortzeiten um 55 % und Erhöhung der Verfügbarkeit auf 99,8 % durch Refactoring von Django-ORM-Abfragen.
  • Migration des Hostings und der Datenbank der Website von Shared cPanel zu AWS EC2 und Amazon RDS, Steigerung von Zuverlässigkeit und Skalierbarkeit.
  • Stack: Python, Django, MySQL, AWS EC2, AWS RDS, cPanel
Jan. 2019 - Juli 2021
2 Jahren 7 Monaten

Datenwissenschaft & Spieleentwicklung

Freiberuflicher Berater

  • Umsetzung von über 100 Aufträgen von prädiktiver Analyse bis Indie-Spielen.
  • Aufbau einer Echtzeit-Analytics-Plattform auf GCP für 60.000 Events/Sekunde; Reduzierung der Abfrage-Latenz von 2 s auf 200 ms.
  • Optimierung von PySpark-Pipelines zur Senkung der Clusterkosten um 22 % durch verbesserte Partitionierung.
  • Stack: Python, C++, Rust, Go, JavaScript, C#, Java, Unity, PySpark, AWS, GCP

KI-Tool zur Bildkolorierung

  • Mitentwickelt ein Modell, das 100 hochauflösende Landschaftsbilder pro Minute koloriert und dabei einen um 30 % höheren SSIM als die Baseline erzielt.

Film-Empfehlungssystem

  • Entworfen und aufgebaut einen chatbasierten LLM-Filmempfehler mit Python, Hugging Face Transformers, Mistral-7B, LoRA/PEFT und SQLite (FTS5 + Vector-Blobs); über 1 Mio. TMDb- und IMDb-Titel mit Handlungen, Genres und Embeddings importiert für semantische Suche mit niedriger Latenz und Empfehlungen mit mehreren Filtern.
  • Katalog über eine Mistral-basierte Function-Calling-API mit FastAPI freigegeben, sodass das Modell JSON-Abfragen automatisch ausfüllt und Treffer priorisiert.
  • Mit Docker containerisiert und die Inferenz auf GroqCloud bereitgestellt, Streaming mit über 3 k Tokens/s; Token-Level-Logging, Kostenüberwachung und CI/CD-Skripte für automatische Modellaktualisierungen hinzugefügt.

Phonon – plattformübergreifender Bildbetrachter

  • Einen hochperformanten Betrachter entwickelt (<200 ms Kaltstart, <50 MB RAM) für Win/Linux/macOS.
  • Von Freunden für Design-Workflows übernommen; für Geschwindigkeit und minimalistische UI gelobt.

Veritas – Android-E-Book-Reader

  • MVP in 90 Tagen entwickelt; UX-Studie mit 20 Pilotnutzern durchgeführt.
  • KI-basierte Buchempfehlungen hinzugefügt, die die Lesedauer um 20 % steigerten.

Zusammenfassung

Ergebnisorientierter Fullstack-Entwickler mit über 5 Jahren Erfahrung in der Softwareentwicklung, darunter Python, JavaScript, C++ und moderne Webframeworks (React, Next.js, Django, FastAPI, Flask). Erfahren in der Leitung von Engineering-Teams (bis zu 12 Mitglieder) zur Erzielung signifikanter Leistungssteigerungen. Leidenschaftlich für saubere Architektur und schnelles Prototyping zur Entwicklung von GenAI-Lösungen. Versiert im Umgang mit Cloud-Plattformen und Container-Orchestrierung, liefert stets robuste und skalierbare Systeme, die bereit für KI-Integration sind.

Erfahren im Fine-Tuning und der Evaluierung von LLMs.

Sprachen

Englisch
Muttersprache
Urdu
Muttersprache
Hindi
Verhandlungssicher
Panjabi
Verhandlungssicher
Japanisch
Grundkenntnisse

Ausbildung

Aug. 2017 - Aug. 2021

FAST-NU Lahore

Bachelor of Science · Informatik · Lahore, Pakistan

Sie suchen Freelancer?Passende Kandidaten in Sekunden!
FRATCH GPT testen
Weitere Aktionen