Leite den vollständigen Datenlebenszyklus für Protein-Expressionsprojekte, indem ich kontinuierlich ein wachsendes Datenset integriere und pflege (derzeit ca. 4.500 Einträge).
Implementiere die Datenerfassung von 3D-Proteinstrukturen mit AlphaFold, um nachgelagerte strukturbasierte Analysen durch Spezialisten für Molekulardynamik zu ermöglichen.
Erstellte reproduzierbare Trainings- und Inferenz-Pipelines in Python, verwaltete Code-Versionierung und Continuous Integration über GitHub in Zusammenarbeit mit Experten für maschinelles Lernen.
Arbeite eng mit Laborwissenschaftlern (Molekularbiologen und Chemikern) zusammen, um gemeinsam Ad-hoc-Experimente nach den Prinzipien des Versuchsdesigns zu entwerfen, mit dem Ziel, Modellvorhersagen zu validieren und zu verfeinern.
Erleichterte die bereichsübergreifende Zusammenarbeit, indem ich Projekt-Updates einem Team von Laborwissenschaftlern präsentierte, komplexe technische Konzepte vereinfachte und Feedback einarbeitete, um die Modellvorhersagen zu optimieren, was zu einer Effizienzsteigerung von 20 % führte.
Sicherte die Zustimmung der Geschäftsleitung, in ein wichtiges ML-Projekt zu investieren, indem ich Ergebnisse präsentierte und dessen strategischen Wert aufzeigte.
Entwickle eine benutzerfreundliche Streamlit-Webanwendung, die Laborwissenschaftlern ermöglicht, Vorhersagen selbstständig durchzuführen und Ergebnisse zu prüfen, und so die direkte Integration von ML-Ergebnissen in Laborabläufe unterstützt, wodurch das Modelldesign und die Benutzerfreundlichkeit verbessert werden.
Sept. 2021 - Aug. 2022
1 Jahr
Siena, Italien
Praktikant - Impfstoff-F&E
GSK
Startete und führte die Datenaufbereitung des Protein-Expressions-Datensatzes durch, indem ich Datensätze aus verschiedenen Abteilungen und Ländern (einschließlich Teams in Belgien und den USA) zusammenführte und standardisierte.
Arbeitete eigenständig mit Experten aus unterschiedlichen Bereichen – Molekularbiologen, Chemikern und Datenteams – zusammen, um ihre Forschungsbedürfnisse zu verstehen, Projektziele abzustimmen und diese Anforderungen in einen harmonisierten und ML-fähigen Datensatz für Anwendungen in der computergestützten Biologie umzusetzen.
Führte exploratives Modell-Prototyping mit Microsoft Azure AutoML durch, um Algorithmen zu bewerten und die Modellauswahl zu beschleunigen.
Sprachen
Italienisch
Muttersprache
Englisch
Fortgeschritten
Ausbildung
Sept. 2021 - Okt. 2022
Universität Padua
Postgraduiertenkurs · Maschinelles Lernen & Big Data für Präzisionsmedizin