Recommended expert
Surya (Vara prasad) Alla
KI-Softwareingenieur
Erfahrungen
Jan. 2024 - Bis heute
2 Jahren 1 MonateHamm, Deutschland
KI-Softwareingenieur
Fraunhofer FIT
- Entwicklung von LLM-basierten Automatisierungs-Utilities, darunter strukturierte Reasoning-Pipelines, LLM-as-a-Judge-Bewertungstools und Multi-Model-Vergleichs-Frameworks.
- Aufbau von RAG-Pipelines für interne Forschungs-Workflows mit LangChain, ChromaDB und FastAPI, um semantische Suche und mehrstufiges Reasoning zu ermöglichen.
- Integration von LLM-Microservices in bestehende ML-Systeme mit Docker, FastAPI und GitLab CI/CD sowie reproduzierbare Deployment-Workflows.
- Entwurf von Inferenz-APIs, die Vision-Modelle und LLM-Reasoning für multimodale Analysen und Entscheidungsfindung kombinieren.
- Optimierung der embeddings-basierten Suche durch Pruning von Vektorspeichern, verbesserte Chunking-Logik und dynamische Retriever-Auswahl.
- Durchführung von Prompt Engineering und Feintuning der Systemanweisungen für Konsistenz, Robustheit und bessere Reasoning-Qualität.
- Erstellung von Benchmarking-Suites zur Bewertung von LLM-Latenz, Reasoning-Qualität, Retrieval-Genauigkeit und Robustheit unter verschiedenen Prompt-Templates.
Juli 2022 - Dez. 2023
1 Jahr 6 MonatenSiegen, Deutschland
Machine-Learning-Ingenieur & Technischer Mitgründer
InnoSaddle GbR
- Entwicklung ML-getriebener Workflows zur Geometrieextraktion und -analyse, inklusive Preprocessing, Messlogik und Prototyp-Inferenzservices.
- Zusammenarbeit mit technischen und nicht-technischen Partnern, um ML-Erkenntnisse in Produktfunktionen und nutzerorientierte Tools zu übersetzen.
- Aufbau reproduzierbarer Experimentier-Pipelines und Erstellung von Erklärungsberichten für ML-Ergebnisse.
Feb. 2018 - Aug. 2019
1 Jahr 7 MonatenHyderabad, Indien
Softwareingenieur (Daten)
Wipro Technologies
- Entwicklung strukturierter ETL-Workflows zur Unterstützung von nachgelagerten KI-/Analyse-Anwendungsfällen über Azure Data Lake, Databricks und SQL-Systeme.
- Optimierung von Datenpipelines und Verbesserung der Überwachungszuverlässigkeit für Produktions-Ingestionssysteme.
Zusammenfassung
GenAI-Ingenieur mit Erfahrung in der Gestaltung von LLM-basierten Systemen, RAG-Pipelines, multimodalen KI-Workflows und skalierbaren Inferenzdiensten. Erfahren in Embeddings, Vektordatenbanken, LLM-Orchestrierung, Prompt Engineering, API-Design und der Optimierung der Modellausführung auf GPU- und Edge-Geräten. Die Kombination aus Software Engineering, ML Engineering und MLOps ermöglicht die durchgehende Verantwortung für GenAI-Produkte vom Prototyp bis zur Produktion.
Fähigkeiten
- Sprachen: Python, C++, Bash
- Llm-tools: Langchain, Langgraph, Openai/anthropic-apis, Vllm, Huggingface, Transformers
- Rag: Embeddings (Openai, Mpnet), Chromadb, Faiss, Vektorspeicher, Retriever, Chunking
- Genai: Prompt Engineering, Llm-bewertung, Multimodale Modelle, Tool-calling, Text- Und Vision-pipelines
- Mlops: Dvc, Mlflow, Gitlab Ci/cd, Docker, Kubernetes (Vertraut)
- Deployment: Fastapi-microservices, Onnx Runtime, Tensorrt, Gpu-/jetson-systeme
- Cloud: Aws (S3, Ec2, Ecr), Container-deployment
- Sonstiges: Numpy, Opencv, Open3d, Scipy, Linux
Sprachen
Deutsch
VerhandlungssicherEnglisch
VerhandlungssicherAusbildung
Okt. 2019 - Sept. 2023
University of Siegen
M.Sc. Mechatronik, Spezialisierung: Computer Vision, Deep Learning, C++ · Mechatronik · Siegen, Deutschland
Sept. 2013 - März 2017
Osmania University
B.E. Maschinenbau · Maschinenbau · Hyderabad, Indien
Sie suchen Freelancer?Passende Kandidaten in Sekunden!
FRATCH GPT testenWeitere Aktionen
Ähnliche Freelancer
Entdecken Sie andere Experten mit ähnlichen Qualifikationen und Erfahrungen.