Recommended expert

Martin Ratajczak

Senior LLM-Forschungswissenschaftler

Martin Ratajczak
München, Deutschland

Erfahrungen

Mai 2025 - Bis heute
9 Monaten
Vereinigte Staaten

Senior LLM-Forschungswissenschaftler

BYO Inc.

  • Erforsche und entwickle Modelle für Chatbots, NLP und LLMs (z. B. Llama, Qwen, OpenAI)
  • Verbessere Chatbots mit RAG und In-Context-Learning
  • Überwachtes Fine-Tuning (PEFT, LoRA) mit Huggingface oder Unsloth
  • Fortgeschrittene Trainingsmethoden: Test-Time-Training, (transduktives) aktives Lernen, verstärkendes Lernen
  • High-Throughput-Serving mit vLLM
  • Anwenden von Embedding-Modellen (z. B. SentenceTransformers), Ähnlichkeits-/Vektorsuche, Vektor-Datenbanken oder Ranking (z. B. LlamaIndex, Faiss, LangChain)
  • Generieren und Filtern synthetischer Daten, Clustering
  • Erkennen von Halluzinationen
  • Evaluierung von Chatbot-Modellen (ROUGE, BLEU, F1-Score, Recall, Precision)
  • Visualisierung von Experimenten (matplotlib)
Jan. 2019 - Mai 2025
6 Jahren 5 Monaten
San Francisco, Vereinigte Staaten

Senior KI-Forschungswissenschaftler

Rev.com

  • Erforschung und Entwicklung von Modellarchitekturen für Spracherkennungssysteme (ASR), große Sprachmodelle (LLM), natürliche Sprachverarbeitung (NLP), Sprecherdiarisierung, Sprechererkennung, Textformatierung, Zusammenfassung und Chatbots
  • Training und Feinabstimmung neuronaler Netze und probabilistischer Modelle: CTC, Transducer, HMM, Segmental-CRF, Conformer, Transformer, CNNs, RNNs
  • Training auf Multi-GPU-Knoten und großen Datensätzen
  • Optimierung von Modellen für Genauigkeit, Größe (z. B. Quantisierung, Pruning) und Geschwindigkeit
  • Implementierung und Optimierung von Decodierungsalgorithmen
  • Datenaufbereitung: trainierter Tokenizer, erzwungene Ausrichtung, Skripte zur Datenbereinigung
  • Beratung zu Roadmaps und Quartalsplanung, Erstellen von Epics und Tickets, Betreuung von Junior Researchern und Entwicklern
  • Entwicklung eines Open-Source-ASR-Modells als Kernmitglied des Forschungsteams
  • Veröffentlichung als Erstautor auf der Interspeech 2025 zu Spracherkennung und Machine Learning
Nov. 2018 - Feb. 2019
4 Monaten
München, Deutschland

Machine-Learning-Ingenieur

e-bot7 - AI for Customer Service

  • Implementiert und trainiert Chatbots mit neuronalen Netzen und NLP-Methoden
März 2017 - Mai 2018
1 Jahr 3 Monaten
Graz, Österreich

Machine-Learning-Ingenieur

iTranslate

  • Implementiert und trainiert ein Spracherkennungssystem (ASR) für Mobiltelefone
  • Trainierte neuronale Netze auf einem Multi-GPU-System
März 2013 - Apr. 2017
4 Jahren 2 Monaten
Graz, Österreich

Wissenschaftlicher Projektassistent

Technische Universität Graz

  • Erforschung von neuronalen Netzen und probabilistischen Modellen für Sequenzen
  • Durchführung von Forschungen im Bereich Machine Learning (ML), Spracherkennung (ASR) und Sprachmodellierung (LM)
  • Innovation, Implementierung, Training und Veröffentlichung von Arbeiten zu rekurrenten neuronalen Netzen (RNNs), bedingten Zufallsfeldern (CRFs), Sum-Product-Netzwerken, neuen Regularisierungsmethoden und Verlustfunktionen, Berechnung und Codierung von Gradienten für benutzerdefinierte Modelle sowie segmentalen CRFs
  • Betreuung eines Masterstudentenprojekts in Machine Learning und ASR
  • Analyse von Ca-Imaging-Aufnahmen neuronaler Aktivität an anesthesierten und wachen Mäusen
  • Klassifizierung und Visualisierung von Gehirnzustandsverläufen mithilfe von Dimensionsreduktion (PCA, LDA), Support Vector Machines (SVM), Kalman-Filter/-Glätter, Clustering, Regression und Zeitreihenprognosen
Sept. 2008 - Dez. 2011
3 Jahren 4 Monaten
Aachen, Deutschland

Projektassistent Forschung

RWTH Aachen Universität

  • Implementierte und trainierte ein End-to-End-Maschinenübersetzungssystem basierend auf Conditional Random Fields (CRFs) von Grund auf inklusive Gradienten und Verlustfunktionen für ein verteiltes Multi-Node-CPU-Grid
  • Trainierte phrasenbasierte statistische Maschinenübersetzungssysteme inklusive Sprachmodelle (LM)
  • Trainierte und implementierte log-lineare Modelle für Textklassifikation, Wortartbestimmung, Named-Entity-Erkennung und Syntaxanalyse
  • Lehrte Seminar- und Übungskurse in maschinellem Lernen und Mustererkennung einschließlich neuronaler Netze, statistischer Maschinenübersetzung und Spracherkennung (ASR)
Sept. 2007 - Aug. 2008
1 Jahr
München, Deutschland

Softwareentwickler

GAF AG

  • Implementierte Software für Geoinformationssysteme, Backend-Server-Anwendungen und Webkartendienste
Dez. 2006 - Feb. 2007
3 Monaten
München, Deutschland

Wissenschaftliche Hilfskraft

Ludwig-Maximilians-Universität München

  • Analysierte und implementierte Online-Lernregeln in neuronalen Netzen
Feb. 2004 - Aug. 2004
7 Monaten
München, Deutschland

Praktikum als Softwareentwickler

Max-Planck-Institut für Physik

  • Implementierte eine Anwendung zur Visualisierung von Lernprozessen (Varianten der Hebb’schen Lernregel) und Selbstorganisation in neuronalen Netzen (Hopfield-Netzwerk, assoziatives Gedächtnis, Vektorquantisierung, Clustering, Boltzmann-Maschine) für Lehrzwecke
  • Implementierte Skripte in Fortran, Perl und C++, um Experimente des Large Hadron Collider (CERN) zu visualisieren
Aug. 2003 - Okt. 2003
3 Monaten
München, Deutschland

Praktikum als Softwareentwickler

Siemens

  • Implementierte ein Netzwerk biologisch inspirierter Spiking-Neuronen

Zusammenfassung

  • 17 Jahre Erfahrung im Machine Learning (ML), davon 7,5 Jahre in Technologieunternehmen
  • Spezialisierung auf neuronale Netze und probabilistische Modelle für Sequenzen: Spracherkennung (ASR), Verarbeitung natürlicher Sprache (NLP), große Sprachmodelle (LLM) und generative KI, Zeitreihenprognosen, klassisches Machine Learning und Statistik, Regression, Klassifikation, Clustering, Sequence-to-Sequence-Modelle, überwachtes/unüberwachtes Lernen, Anomalieerkennung, Betrugserkennung
  • Löse komplexe algorithmische Probleme, entwickle neue Architekturen, erstelle Prototypen
  • Trainiere Modelle und führe Feinabstimmungen durch, optimiere Genauigkeit, Geschwindigkeit und Größe
  • Integriere und deploye in der Cloud oder lokal (CPU, GPU, auf Gerät, Embedded)
  • Entwickle in Python (15 J.), PyTorch (6,5 J.), TensorFlow (4 J.), Java, C++
  • Forschungserfahrung im Machine Learning in Universitätslabors und Tech-Unternehmen
  • Lass uns reden: als Freelancer, im Auftrag einer Firma oder als Angestellter arbeiten
  • Veröffentliche Fachartikel, halte Vorträge auf Konferenzen und präsentiere Poster

Sprachen

Deutsch
Muttersprache
Englisch
Verhandlungssicher
Latein
Verhandlungssicher
Polnisch
Verhandlungssicher

Ausbildung

März 2013 - Apr. 2017

Technische Universität Graz

Promotionsstudium (Labor verlassen) · Maschinelles Lernen · Graz, Österreich

Sept. 2004 - Jan. 2005

Queen's University Belfast

Erasmus-Studienaustausch · Physik und Informatik · Belfast, Vereinigtes Königreich

Okt. 2000 - Sept. 2006

Ludwig-Maximilians Universität München (LMU)

Diplom Physik (Master-Äquivalent) · Physik · München, Deutschland

...und 1 Weitere

Zertifikate & Bescheinigungen

Großes Latinum

Märkisches Gymnasium

Sie suchen Freelancer?Passende Kandidaten in Sekunden!
FRATCH GPT testen
Weitere Aktionen

Ähnliche Freelancer

Entdecken Sie andere Experten mit ähnlichen Qualifikationen und Erfahrungen.

Martin Musiol
Martin Musiol

Product Owner für AI-Lernplattform

Profil ansehen
Ursula Maria mayer
Ursula Maria mayer

Business-Mentor

Profil ansehen
Philipp Grunert
Philipp Grunert

Data Scientist und Data Engineer

Profil ansehen
Lino Giefer
Lino Giefer

Leitender Data Scientist

Profil ansehen
Jürgen Fey
Jürgen Fey

AR/VR/XR-Architekt

Profil ansehen
Maciej Tatarek
Maciej Tatarek

Selbstständiger Auftragnehmer

Profil ansehen
Tim Raveneau
Tim Raveneau

KI-Ingenieur

Profil ansehen
Mathias Wilhelm
Mathias Wilhelm

Entwicklung einer KI-gesteuerten Social Media Automatisierung zur Identifikation von Themen, Textgenerierung und Ausspielung

Profil ansehen
Eduard Van kleef
Eduard Van kleef

Leiter Workshop „Einführung von KI Entwicklungstools“

Profil ansehen
Jens Daube
Jens Daube

Product Owner und Senior Data Scientist

Profil ansehen
Kai Kramer
Kai Kramer

Chatbots für Steuer- und Rechtstexte

Profil ansehen
Fabian Crabus
Fabian Crabus

Kurzprojekt: Umwandlung monokularer Bilder

Profil ansehen
Louis Guitton
Louis Guitton

Freiberuflicher Solutions Architect und Machine Learning Engineer

Profil ansehen
Mathew Divine
Mathew Divine

Data-Science-Experte und KI-Stratege

Profil ansehen
Manuel Pasieka
Manuel Pasieka

KI-Ingenieur

Profil ansehen
Himanshu Negi
Himanshu Negi

Principal (Datenwissenschaftler/Dateningenieur/Gen-AI-Ingenieur)

Profil ansehen
René Welland
René Welland

Konferenzoperator

Profil ansehen
Karl Estermann
Karl Estermann

inkl. CI/CD, Automatisierung

Profil ansehen
Mahabub Akram
Mahabub Akram

Teamleiter – Engagement & Relevanz

Profil ansehen
Fadi Shoaa
Fadi Shoaa

Dokumentenparser für Kommissionierlisten (PDF & PNG)

Profil ansehen
Pawan Saxena
Pawan Saxena

Akademisches Projekt

Profil ansehen
Stephan Baier
Stephan Baier

Freiberuflicher Data Scientist

Profil ansehen
Markus Binder
Markus Binder

Technischer Mitgründer

Profil ansehen
Kiran kumar Kanathala
Kiran kumar Kanathala

Angewandtes NLP: Wortbasierte Kodierung für intelligentere Ereignisvorhersagen

Profil ansehen
Mirza Klimenta
Mirza Klimenta

Agentische KI für ein DeepResearch-Projekt

Profil ansehen
Sanjay Jayaprakash
Sanjay Jayaprakash

NLP-Ingenieur

Profil ansehen
Alessandro Pedori
Alessandro Pedori

Lead KI-Ingenieur

Profil ansehen
Gabin Nguegnang
Gabin Nguegnang

Freiberuflicher Mathematikexperte für das Training von KI-Modellen

Profil ansehen
Christian Saba
Christian Saba

Wissenschaftlicher Mitarbeiter – KI Consultant

Profil ansehen
Hasan Raza
Hasan Raza

KI-Ingenieur

Profil ansehen