Profilbild von Anonymes Profil, Data Scientist | Generative AI | Data Engineer | TensorFlow Certified Developer | Python
nicht verfügbar bis 29.04.2024

Letztes Update: 23.03.2024

Data Scientist | Generative AI | Data Engineer | TensorFlow Certified Developer | Python

Abschluss: B.Sc. Wirtschaftsinformatik | B.Sc. Betriebswirtschaftslehre
Stunden-/Tagessatz: anzeigen
Sprachkenntnisse: deutsch (Muttersprache) | englisch (verhandlungssicher)

Skills


Ich biete
Rollen: Data Science, Generative AI, Data Engineering, Computer Vision

Tätigkeitsschwerpunkte:
  • Data Warehouse Modellierung und Bau der ETL-Strecken
  • Binäre und Multi-Klassen Klassifikation (Video, Bild, Text, Audio)
  • Generative AI (Fine Tuning LLMs, RAG, LangChain, LlamaIndex)
  • Pose Estimation und Object Detection (Video, Bild)
  • Bau von Recommendation-, Ranking- und Regressionsmodellen
  • Next Best Offer (NBO), Next Best Action (NBA)
Programmiersprachen: Python, Java, SQL, TypeScript, PowerShell

Kompetenzen:
  • Sehr gute Kenntnisse: Python, PySpark, SQL, TensorFlow, LangChain, PyTest, pandas, NumPy, OpenCV, XGBoost, CatBoost, LightGBM, Git, LlamaIndex
  • Gute Kenntnisse: PyTorch, FastApi, dbt, Flask, MLflow, TypeSkript, Angular, React, Java, Spring Boot, Airflow Alternative,
Konzeption und Modellierung: Jira, Confluence, UML-Modellierung, ER-Modellierung

Weitere Tools und Technologien: Azure, AWS, Power BI, Docker, Kubeflow, Flutter, Bash/Shell, DVC

Ich freue mich auf Ihre Anfrage und stehe gerne für Gespräche zur Verfügung. 

Projekthistorie

12/2023 - bis jetzt
Generative AI – LLM Experte
(Internet und Informationstechnologie, >10.000 Mitarbeiter)

AI Operator
Entwicklung einer RAG (Retrieval Augmented Generation) Ingestion- und Retrieval-Pipeline sowie einer Evaluationskomponente auf Basis des LlamaIndex Frameworks

Tätigkeiten:
  • Fachliche und technische Beratung als LLM-Entwickler/Engineer
  • Entwurf und Implementierung einer RAG Pipeline mit Retrieval-
    und Response-Evaluation
  • Koordination mit Entwicklern und Stakeholdern, um Domänenwissen in funktionale Anforderungen  umzuwandeln
Technologien:
Python, LlamaIndex, Phoenix, MLflowDocker, MongoDB, LangChain, pgvector, Milvus,

10/2023 - 11/2023
Generative AI – LLMOps, MLOps
IT-Dienstleister (Internet und Informationstechnologie)

Multi-Tenant Chatbot mit RAG unter Azure Kubernetes Service
Aufbau eines mandantenfähigen Chatbots mit RAG unter Verwendung von Azure Kubernetes Service, Azure Key Vault, Istio Service Mesh, OAuth2-Proxy und Azure Entra ID

Tätigkeiten:
  • Modellierung und Aufbau der Azure Kubernetes Architektur
  • Integration des Istio Service Meshs
  • Erstellung von Chatbots mit Zugriff auf Kontextwissen aus Vektordatenbanken
Technologien:
Kubernetes, Docker, LangChain, Azure OpenAI, Streamlit, FastApi

10/2022 - 10/2023
Data Engineer - PySpark
(Versicherungen, 5000-10.000 Mitarbeiter)

Customer Data Hub
Konzeption und Entwicklung eines kundenzentrieten Data Warehouses für die Realisierung von konzernweiten Customer Analytics Use Cases
  • Realisierung von generischen Kundenselektionen
  • Erstellung von NBO-Trainingsdatensätzen für das trainieren von konzernweiten NBO-Modellen (Next Best Offer)
  • Kundenreporting (Power BI Datenanbindung)
Tätigkeiten:
  • DWH-Modellierung
  • Spezifikation und Implementierung der ETL-Strecken
  • Automatisierte Job- und Test-Steuerung
  • Erstellung von Next Best Offer - Trainingsdatensätzen (NBO) für die Umsetzung konzernweiter Recommendation Modelle
  • Aufbau einer Pipeline zur generischen Kundenselektionen
  • Selektionstool – PowerBI
Technologien:
Python, PySpark, PyTest, SQL, Airflow Alternative, Kubeflow, Git, Confluence

02/2023 - 08/2023
Generative AI - Data Scientist
(Internet und Informationstechnologie, 10-50 Mitarbeiter)

Kinderbuchgenerator
Entwicklung einer generativen AI-Anwendung zur Erstellung von individuellen und visualisierten Geschichten für Kinder

Tätigkeiten:
  • Integration der OpenAI, Midjourney und Stable Diffusion APIs
  • Prompt Engineering zur Verbesserung der Qualität und Kreativität der generierten Texte und Bilder
  • Verwendung von Promptemplates
  • Benutzerfreundlichen React-App als Interface für die individuelle Geschichtengenerierung
Technologien:
Python, React, LangChain, Stable Diffusion, Midjourney, OpenAI, PostgreSQL, pgvector, Azure

06/2022 - 09/2022
Data Scientist, Machine Learning Engineer
(Internet und Informationstechnologie, 10-50 Mitarbeiter)

Next Best Offer (NBO)
Entwicklung eines generischen Empfehlungssystems, um Prognosen über zukünftige Produktkäufe von Kunden abzuleiten.

Tätigkeiten:
  • Explorative Datenanalyse und Datenaufbereitung
  • Evaluierung von Recommendation Algorithmen
  • Erstellung von Trainingspipelines
  • Aufbau einer MLflow-Umgebung zum Hyperparametertuning und Persistieren verschiedener Recommendation Modelle
Technologien:
Python, TensorFlow, LightGBM, Implicit, PostgreSQL, Dataiku, scikit-learn, MLflow, DVC, Git, Confluence

11/2021 - 08/2022
Data Scientist, Computer Vision Engineer
(Automobil und Fahrzeugbau, >10.000 Mitarbeiter)

AI Golf-Coaching
Entwicklung eines Systems, das mithilfe von in Kleidung und Smartphones integrierten Sensoren sowie durch Objekterkennung in Videos Bewegungsempfehlungen für den Sportler generiert.

Tätigkeiten:
  • Analyse und Aufbereitung von Senor- und Video-Daten
  • Bildverarbeitung, Bildklassifikation und Object Detection mit OpenCV, TensorFlow, PyTorch
  • Entwicklung von individuellen Trainingspipelines und Modellarchitekturen
  • Vertestung der Integration von Deep Learning- und Gradient Boosting Modellen in mobilen Endgeräten
  • Versionierung der Modellperformance und der Modelle mit DVC und MLflow
Technologien:
AWS, Python, PyTorch, TensorFlow, XGBoost, OpenCV, Flutter, Docker, YOLOv5, SageMaker

05/2021 - 08/2021
Data Scientist, Machine Learning Engineer
Web Computing GmbH (Internet und Informationstechnologie, 50-250 Mitarbeiter)

Identifikation von Keywords aus Texten
Entwicklung einer Komponente zur automatischen Findung von Tags und Keywords basierend auf Textinhalten aus Präsentationsmedien (Videos, Powerpoints)

Tätigkeiten:
  • Requirements Engineering
  • Implementierung und Evaluierung verschiedener Algorithmen und Frameworks zur Extraktion von Keywords, z.B. RAKE, TF-IDF, KeyBert, Spacy
  • Entwicklung von individuellen Trainings- und Evaluierungspipelines
  • Medienbereitstellung und Ergebnisempfang per API
  • UML-Modellierung
Technologien:
Python, TensorFlow, Spacy, scikit-learn, Docker, NLTK, Git, Confluence

11/2020 - 04/2021
Machine Learning Engineer, Computer Vision Engineer
Web Computing GmbH (Internet und Informationstechnologie, 50-250 Mitarbeiter)

Auslesen von Textinhalten aus Videos - OCR
Entwicklung einer Komponente zum Auslesen und Bereitstellen von Textinhalten aus Videos und Slideshows auf Basis von OCR

Tätigkeiten:
  • Requirements Engineering
  • Datenanalyse und Datenaufbereitung
  • UML-Modellierung
  • Evaluation verschiedener OCRs
  • OCR-Integration und Ergebnisbereitstellung per API
Technologien:
Python, scikit-learn, PyTorch, Docker, PostgreSQL, Git, Google Cloud Vision API, Confluence

04/2020 - 09/2020
Softwareentwickler
Web Computing GmbH (Internet und Informationstechnologie, 50-250 Mitarbeiter)

Regelbasierte Klassifikation von Transaktionsdaten
Entwicklung einer Java-Anwendung zur Klassifikation von Transaktionsdaten auf Basis einer Rule Engine.

Tätigkeiten:
  • Laden der Transaktionsdaten und Regeln mit PostgreSQL und EasyRules
  • Containerisierung und Parallelisierung mit Docker
  • Containermanagement
  • Userinterface mit Angular und Flask
Technologien:
Java, Python, Docker, PostgreSQL, SQL, Apache HttpClient, EasyRules, Flask, Angular, Git, Confluence

Zertifikate

PyTorch Ultimate 2023
2023
Generative AI with Large Language Models
2023
Microsoft Certified: Azure Fundamentals
2023
Google TensorFlow Developer Certificate
2022
TensorFlow Developer Professional Certificate
2022
Unsupervised Learning Recommenders Reinforcement Learning
2022

Reisebereitschaft

Verfügbar in den Ländern Deutschland, Österreich und Schweiz
Gerne Remote

Sonstige Angaben

Offen für ANÜ.
Profilbild von Anonymes Profil, Data Scientist | Generative AI | Data Engineer | TensorFlow Certified Developer | Python Data Scientist | Generative AI | Data Engineer | TensorFlow Certified Developer | Python
Registrieren