Momin Q.

Zur Website

Lahore, Pakistan

Erfahrungen

Juli 2025 - Bis heute

4 Monaten

Kanada

Gründungs-GenAI-Ingenieur

Tyce.ai

Mitwirkung als einer von drei Kernentwicklern beim Aufbau und Skalieren des KI-gestützten Dokumentenassistenten von Tyce.
Implementierung des „Tyce Agent“ mit PydanticAI, einschließlich Feintuning des Agentenverhaltens, Design der Agenten-Tools, Streaming der Antworten und Optimierung.
Optimierung der agentischen RAG-Suche durch kontextbasiertes Retrieval.
Entwicklung eines eigenen HTML-Splitters für stabileres und stilbewusstes Dokumenten-Chunking.
Skalierung der Data-Ingestion-Pipeline zur Verarbeitung von über 100.000 Dokumenten in wenigen Minuten durch Verlagerung der Ingestion auf AWS Lambda.
Einsatz fortschrittlicher Techniken wie Chunking-Optimierung, parallele Verarbeitung und selektive Verarbeitung zur Reduzierung der Kosten und Verarbeitungszeit um 20–90 %, je nach Dokument.
Teilnahme an Produkt-Roadmap- und Architektur-Diskussionen, um technische Ausrichtung und Nutzererfahrung mitzugestalten.
Stack: Pydantic AI, FastAPI, Python, PostgreSQL, AWS Lambda, SST, OpenAI API, Docker, CI/CD

Sept. 2022 - Juli 2025

2 Jahren 11 Monaten

Vereinigte Staaten

Softwareentwickler / Teamleiter

Turing

Entwurf von Datenpipelines, die über 10.000 multimodale Samples (2 Mio.+ Tokens) kuratierten und transformierten, um hochmoderne LLMs mit den neuesten Trainingsformaten (RLHF, SFT, DPO, ORPO etc.) zu trainieren.
Fine-Tuning und Evaluierung von Code-Generierungs- und Chat-Modellen mit Hugging Face Transformers, Erhöhung der Pass-@-1-Genauigkeit auf 70 % und Reduzierung von Halluzinationen um 18 %.
Aufbau eines automatisierten Evaluierungsharness, das die Modellvalidierungszyklen um 40 % verkürzte.
Einführung halbüberwachter Active-Learning-Workflows und Auto-Labeling-Pipelines, wodurch der manuelle QA-Aufwand um das Fünffache reduziert wurde.
Leitung eines funktionsübergreifenden Teams von 12 Data Engineers, Mentoring in Prompt Engineering, Datensatzdesign und skalierbaren MLOps-Best Practices.
Implementierung robuster PII- und Toxizitätserkennung in Python & SQL mit 99,2 % Präzision und Sicherstellung der SOC-2- und GDPR-Konformität.
Deployment von GenAI-Services auf Kubernetes mit GitOps-Praktiken über GitHub-CI/CD-Pipelines, um Rollouts und Rollbacks in der Produktion zu optimieren.
Integration von Modellen in externe Plattformen wie ServiceNow zur Ermöglichung von Echtzeit-KI-gestützten Workflows.
Bereitstellung der Cloud-Infrastruktur auf AWS, GCP und Azure mittels Infrastructure as Code (IaC) zum Bereitstellen und Verwalten von GenAI-Trainings-Tools – einschließlich Evaluierungsharness, Datenpipelines und Model Serving – bei einer SLA von 99,99 %.
Stack: Python, PyTorch, Hugging Face, SQL, Airflow, Docker, Kubernetes, GitHub, GitOps, Terraform, AWS, GCP, Azure, ServiceNow

Juli 2021 - Aug. 2022

1 Jahr 2 Monaten

Lahore, Pakistan

Softwareentwickler

Arbisoft

Schlüsselrolle bei der Entwicklung und Wartung robuster, cloudbasierter ETL-Pipelines für eine führende Fashion-Analytics-Plattform, wodurch ein zuverlässiger Fluss von über 4 TB Rohdaten pro Tag sichergestellt wurde.
Zusammenarbeit mit einem vollständig Remote arbeitenden Team über 3 Zeitzonen hinweg, Nutzung von Sprint-Ritualen und klarer Dokumentation zur termingerechten Erreichung von 95 % der Roadmap-Meilensteine.
Überarbeitung der Extraktionskomponente einer Fashion-Analytics-Pipeline (über 20.000 Codezeilen), Reduzierung der täglichen Laufzeit um 36 % und Einsparung von 45.000 $ pro Jahr bei den Compute-Kosten.
Entwicklung und Wartung von Full-Stack-Features: React-Dashboards für Merchandising-Teams, unterstützt von Django-REST-API-Endpunkten und AWS API Gateway.
Sicherstellung der Datenintegrität und Performance durch automatisierte Tests (PyTest + Cypress), Erreichen von 85 % Testabdeckung und täglichen CI-Läufen.
Deployment von Micro-Frontends und Python-Services via Docker/Kubernetes und Terraform, Ermöglichung von Blue-Green-Releases mit weniger als 5 Minuten Rollback.
Stack: Django, React, Scrapy, AWS (EC2, DynamoDB, Redshift, Lambda, Glue), Airflow, GitLab, Kubernetes

Juni 2019 - Aug. 2019

3 Monaten

Lahore, Pakistan

Praktikant Webentwicklung

Women In Struggle for Empowerment (WISE)

Verbesserung der API-Antwortzeiten um 55 % und Erhöhung der Verfügbarkeit auf 99,8 % durch Refactoring von Django-ORM-Abfragen.
Migration des Hostings und der Datenbank der Website von Shared cPanel zu AWS EC2 und Amazon RDS, Steigerung von Zuverlässigkeit und Skalierbarkeit.
Stack: Python, Django, MySQL, AWS EC2, AWS RDS, cPanel

Jan. 2019 - Juli 2021

2 Jahren 7 Monaten

Datenwissenschaft & Spieleentwicklung

Freiberuflicher Berater

Umsetzung von über 100 Aufträgen von prädiktiver Analyse bis Indie-Spielen.
Aufbau einer Echtzeit-Analytics-Plattform auf GCP für 60.000 Events/Sekunde; Reduzierung der Abfrage-Latenz von 2 s auf 200 ms.
Optimierung von PySpark-Pipelines zur Senkung der Clusterkosten um 22 % durch verbesserte Partitionierung.
Stack: Python, C++, Rust, Go, JavaScript, C#, Java, Unity, PySpark, AWS, GCP

KI-Tool zur Bildkolorierung

Mitentwickelt ein Modell, das 100 hochauflösende Landschaftsbilder pro Minute koloriert und dabei einen um 30 % höheren SSIM als die Baseline erzielt.

Film-Empfehlungssystem

Entworfen und aufgebaut einen chatbasierten LLM-Filmempfehler mit Python, Hugging Face Transformers, Mistral-7B, LoRA/PEFT und SQLite (FTS5 + Vector-Blobs); über 1 Mio. TMDb- und IMDb-Titel mit Handlungen, Genres und Embeddings importiert für semantische Suche mit niedriger Latenz und Empfehlungen mit mehreren Filtern.
Katalog über eine Mistral-basierte Function-Calling-API mit FastAPI freigegeben, sodass das Modell JSON-Abfragen automatisch ausfüllt und Treffer priorisiert.
Mit Docker containerisiert und die Inferenz auf GroqCloud bereitgestellt, Streaming mit über 3 k Tokens/s; Token-Level-Logging, Kostenüberwachung und CI/CD-Skripte für automatische Modellaktualisierungen hinzugefügt.

Phonon – plattformübergreifender Bildbetrachter

Einen hochperformanten Betrachter entwickelt (<200 ms Kaltstart, <50 MB RAM) für Win/Linux/macOS.
Von Freunden für Design-Workflows übernommen; für Geschwindigkeit und minimalistische UI gelobt.

Veritas – Android-E-Book-Reader

MVP in 90 Tagen entwickelt; UX-Studie mit 20 Pilotnutzern durchgeführt.
KI-basierte Buchempfehlungen hinzugefügt, die die Lesedauer um 20 % steigerten.

Zusammenfassung

Ergebnisorientierter Fullstack-Entwickler mit über 5 Jahren Erfahrung in der Softwareentwicklung, darunter Python, JavaScript, C++ und moderne Webframeworks (React, Next.js, Django, FastAPI, Flask). Erfahren in der Leitung von Engineering-Teams (bis zu 12 Mitglieder) zur Erzielung signifikanter Leistungssteigerungen. Leidenschaftlich für saubere Architektur und schnelles Prototyping zur Entwicklung von GenAI-Lösungen. Versiert im Umgang mit Cloud-Plattformen und Container-Orchestrierung, liefert stets robuste und skalierbare Systeme, die bereit für KI-Integration sind.

Erfahren im Fine-Tuning und der Evaluierung von LLMs.

Sprachen

Englisch

Muttersprache

Urdu

Muttersprache

Hindi

Verhandlungssicher

Panjabi

Verhandlungssicher

Japanisch

Grundkenntnisse

Ausbildung

Aug. 2017 - Aug. 2021

FAST-NU Lahore

Bachelor of Science · Informatik · Lahore, Pakistan

Sie suchen Freelancer?Passende Kandidaten in Sekunden!

FRATCH GPT testen

Gründungs-GenAI-Ingenieur

Erfahrungen

Gründungs-GenAI-Ingenieur

Tyce.ai

Softwareentwickler / Teamleiter

Turing

Softwareentwickler

Arbisoft

Praktikant Webentwicklung

Women In Struggle for Empowerment (WISE)

Datenwissenschaft & Spieleentwicklung

Freiberuflicher Berater

KI-Tool zur Bildkolorierung

Film-Empfehlungssystem

Phonon – plattformübergreifender Bildbetrachter

Veritas – Android-E-Book-Reader

Zusammenfassung

Sprachen

Ausbildung

FAST-NU Lahore

Bachelor of Science · Informatik · Lahore, Pakistan

Ähnliche Freelancer

Senior Data Scientist | KI- und STEM-Forschungsingenieur | Dozent

AR/VR/XR-Architekt

Solution-Architekt

Data-Science-Experte und KI-Stratege

Tech Lead Kundenbasisdokumentation Automatisierung

Data Scientist & KI Ingenieur & KI Architekt

KI-Ingenieur, Cloud-Lösungsarchitekt, Backend-Entwickler

KI-Lösungsarchitekt

Einstellungsanforderung

MLOps Engineer

Masterarbeit - LLM-basiertes RAG-System

Full-Stack Data Scientist | KI-Berater | Technischer Leiter

Product Owner F&E-Software

Senior Data/ML-Berater & Technischer Leiter

aiCTO & Mitgründer