Muhammad U.
Wissenschaftliche Hilfskraft
Erfahrungen
Okt. 2024 - Juli 2025
10 MonatenWissenschaftliche Hilfskraft
Universität des Saarlandes
- Einsatz KI-getriebener CADD-Methoden zur Optimierung biosynthetischer Wege und Molekülscreenings.
- Integration synthetischer Biologie und rechnergestützter Chemie-Workflows für schnelle In-silico-Experimente.
- Automatisierte ML-Pipelines mit Python, PyTorch und Scikit-learn unter Linux, was zu verbesserten Modelltests und höherer Reproduzierbarkeit führte.
Juni 2024 - Bis heute
1 Jahr 7 MonatenMachine-Learning- und Bioinformatik-Ingenieur
Myria Biosciences
- Verarbeitung und Analyse von über 1.000 genomischen und proteomischen Proben, wodurch die Laufzeit der Pipeline mithilfe von Workflow-Managern und HPC-Clustern um 35 % reduziert wurde.
- Benchmarking von Variant-Calling-Pipelines, was die Empfindlichkeit der SNP-Erkennung im Vergleich zu Referenzdatensätzen um 8 % erhöhte.
- Aufbau von ETL-Workflows (Python, Pandas, SQL) zur Verwaltung von 50 GB Multi-Omics-Daten pro Woche mit einer Fehlerquote von < 2 %, was eine effiziente Datenintegration ermöglichte.
- Aufbau eines Neo4j-Wissensgraphen mit über 10.000 biologischen Entitäten, was die Abfragegeschwindigkeit in F&E um 50 % steigerte.
- Bereitstellung von über 30 interaktiven Dashboards und reproduzierbaren Berichten, wodurch Forschungsentscheidungen in drei klinischen Programmen beschleunigt wurden.
- Entwicklung und Containerisierung reproduzierbarer NGS- und ML-Pipelines mit Docker, Git und CI/CD zur Steigerung der Zuverlässigkeit und Automatisierung von Workflows.
Juni 2024 - Dez. 2024
7 MonatenData Scientist in der Arzneimittel-Bioinformatik
Helmholtz-Institut (HIPS)
- Analysierte und integrierte NGS- und LC-MS/MS-Proteomik-Datensätze und trug damit zur Entdeckung von 15 neuen biosynthetischen Genclustern bei.
- Entwickelte ML-Modelle, die die Genauigkeit der Vorhersage der Expressions-Effizienz um 22 % steigerten.
- Einsatz graphbasierter Data Science zur Entdeckung von Stoffwechselwegen; drei rechnerische Vorhersagen experimentell validiert.
- Aufbau von Snakemake-Pipelines mit Versionskontrolle, wodurch monatlich über 40 Stunden manuelle Bearbeitungszeit eingespart wurden.
- Bereitstellung reproduzierbarer Bioinformatik-Pipelines, die nun von mehreren Forschungsgruppen für genomische und biochemische Analysen genutzt werden.
Dez. 2022 - Sept. 2024
1 Jahr 10 MonatenWissenschaftliche Hilfskraft
KIST Europe
- Unterstützung sequenzierungsgetriebener synthetischer Biologieprojekte durch Validierung von über 100 Klonierungs-Experimenten.
- Leitete die Schulung von Studierenden und die Standardisierung von Workflows, wodurch die Einarbeitungszeit um 30 % verkürzt wurde.
- Durchführung und Analyse von ELISA-, Klonierungs-Workflows und Phagen-Wirt-Interaktionsstudien zur Unterstützung der Bakteriophagen-Entwicklung.
- Durchführung sequenzierungsbasierter Validierungen zur Sicherstellung der Integrität von Konstrukten und der Zuverlässigkeit experimenteller Daten.
Zusammenfassung
Bioinformatiker und DevOps-orientierter Machine-Learning-Ingenieur mit Erfahrung in der Bereitstellung skalierbarer Lösungen in den Bereichen Genomik, Transkriptomik und Proteomik.
Erfahren in der Entwicklung reproduzierbarer NGS-/ML-Pipelines, Workflow-Automatisierung und CI/CD-gestützter Bereitstellung in Linux- und HPC-Umgebungen.
Fundierter Hintergrund in Python, R und C++, mit Expertise in Multi-Omics-Datenintegration, ETL-Workflows, Wissensgraphen (Neo4j) und der Entwicklung von Dashboards und Datenprodukten für Forschungs- und klinische Entscheidungsunterstützung.
Fähigkeiten
- Ngs & Bioinformatik: Wgs, Wes, Rna-seq (Bulk & Einzelzell), Methylom, Variant Calling, Annotation, Bioconductor
- Ml & Data Science: Scikit-learn, Pytorch, Pca/umap/t-sne, Clustering, Random Forest, Svm, Xgboost, Shap, Gnnexplainer, Graph Ml
- Devops & Infrastruktur: Docker, Git, Bash, Linux-server-management, Ci/cd, Workflow-automatisierung, Cloud-deployment
- Pipelines & Tools: Snakemake, Nextflow (Grundlagen), Biopython, Pandas, Numpy, Jupyter, Flask
- Datenengineering & Datenbanken: Sql, Etl/elt, Api-pipelines, Neo4j-wissensgraphen, Datenmodellierung
- Visualisierung: Plotly, R Shiny, Jupyter-dashboards, Rmarkdown, Interaktive Berichte
Sprachen
Englisch
VerhandlungssicherDeutsch
FortgeschrittenAusbildung
Okt. 2022 - Bis heute
Universität des Saarlandes
M.Sc. Bioinformatik · Bioinformatik · Saarbrücken, Deutschland
Okt. 2018 - Aug. 2022
UET Lahore
B.Sc. Biomedizinische Technik · Biomedizinische Technik · Lahore, Pakistan · Notendurchschnitt: 3,721/4,0
Zertifikate & Bescheinigungen
ETL und ELT in Python
(Kurzkurs)
Neo4j Certified Professional
GraphAcademy
Neo4j Graph Data Science Certification
GraphAcademy
Sie suchen Freelancer?Passende Kandidaten in Sekunden!
FRATCH GPT testenWeitere Aktionen
Ähnliche Freelancer
Entdecken Sie andere Experten mit ähnlichen Qualifikationen und Erfahrungen.