Schlagworte
Skills
- Data Engineering / Data Analysis / Data Science
- Machine learning (Deep Learning, Computer Vision, Natural Language Processing - NLP, Mathematical Modeling, Statistics)
- Business Intelligence (BI)
- Cloud (AWS, Kubernetes, Docker)
- ETL (PySpark, Hadoop, Airflow)
- A/B Testing
- Projektmanagement, Projektcontrolling
- Big Data (Vertica, Dask, Greenplum, ClickHouse)
- Reporting (Matplotlib, Plotly)
Data Mining (Betriebsdaten Analyse, Selenium, pm4py)
Betriebssysteme
Linux, Windows
Programmiersprachen
Python (zzgl. Flask, Pandas, PyTorch, Scikit-learn, PM4Py), SQL / PL/SQL, Dart, JavaScript, HTML, Bash, PowerShell
Datenbanken
Snowflake, Oracle, PostgreSQL, IBM DB2, MySQL
Methoden/Techniken
Hochverfügbarkeit (Real Application Cluster RAC, Stand-by, Failover Advanced Replication, Backup/Recovery)
Kanban
Fachliche Kenntnisse
- Retail
- Consulting
Werkzeuge/Tools
GIT, Jira, Confluence, GitLab CI/CD, Apache Airflow
Ingenieur für maschinelles Lernen
Projekthistorie
Projekt: Aufbau des DWH und Reportingsysteme | Berlin | Immobilien April 2022 – jetzt
Rolle: Senior Business Intelligence Spezialist
- Entwicklung von ETL-Pipelines für Reporting
- Erstellen Berichte in Tableau
- Entwerfen von technischen Datenbankmodellen in Data Vault
- Automatisierung interner Prozesse: Einführung von automatisierten CI/CD, Python/SQL Testen in die Produktionsumgebung.
Technologie-Stack: Python, AWS, Snowflake, Tableau Tools: GitHub, Jira, Confluence, Miro
-
Entwicklung von ETL-Pipelines für Meldewesensysteme. Beschleunigung der gesamten täglichen Ladezeit um bis zu 40%
-
Mitarbeit an Digitalisierungsprojekten der Bank (Spezifikation der Architektur von ETL-, Data Lake- und DWH-Systemen).
-
Automatisierung interner Prozesse: Einführung von automatisierten CI/CD, Testen in die Produktionsumgebung.
Technologie-Stack: DataStage, Oracle DB, PL/SQL, Powershell, Python, Tools: Bitbucket, Jira, Confluence
-
Implementierung von komplexen Datenintegrationsprozessen auf Basis moderner ETL-Frameworks in Informatica;
-
Entwerfen von technischen Datenbankmodellen auf der Basis verschiedener Modellierungsparadigmen (3NF, Data Vault, Star, ...);
-
Co-Design von kundenspezifischen Frameworks innerhalb der eingesetzten ETL-Tools;
-
Automatisieren von Tests für ETL-Pipelines (PL/SQL, Bash, Jenkins).
Technologie-Stack: Informatica, DB2, PL/SQL, Unix (AIX) & bash, Python, Tools: Gerrit, Jira, Confluence
-
Erstellen eines Mikrodienstes zur Bereitstellung regelmäßiger Datensätze für einen ständig selbstlernenden NLP-Algorithmus für maschinelles Lernen, der einen intelligenten Nachrichten-Feed bereitstellt.
-
Entwicklung von Modellen zur Vorhersage der profitabelsten Kundengruppen mit Hilfe von Random Forest Classifier (Vorhersage von Marketing Qualified Leads)
-
Etablierung von Standards für die Dokumentation von Data-Science-Modellen
-
Entwicklung von Marketingberichten in Tableau für die tägliche Nutzung und ETL-Prozesse unter Verwendung von Google Analytics API
Technologie-Stack: Python, Scikit-learn, GreenPlum, Docker, GIT, Linux, NumPy, Tableau, Tools: Gitlab, Jira
System Analyst, Data Analyst
- Integrierung und leitende Entwicklung einer internen Android-Anwendung zur Digitalisierung von Geschäftsprozessen
- Entwicklung der persönlichen Kontoanwendung für Firmenkunden. Google Play, AppStore.
- Datenanalyse im Bereich Internet-Marketing mit Integration verschiedener Dashboards in das Unternehmens-CRM
- Leitung der Entwicklung des internen Marketing-Tools: Überprüfung der Abnahmetestspezifikationen und gelegentliche Durchführung von Abnahmetests der entwickelten Funktionalität, Erstellung der Spezifikations
- Vorbereiten von Finanzberichten für die Unternehmensleitung
Technologie-Stack: Highcharts JS, MS SQL, MS SQL-Server, PHP, Python
Notationen: Web service schemas (WSDL/XSD), BPMN, UML Tools: Archimate
Verantwortlichkeiten:
- Bedienung von Windows Server 2012 (Terminal Server 1C), Ubuntu Server 12.04 (Webdienste Firma, XMPP-Chat für Mitarbeiter, VPN für Remote Desktop Zugriff)"
- Anpassung des Cloud-Systems EDI (OwnCloud / Nextcloud + onlyoffice document server)
- Schreiben einer Software zur Automatisierung der Erstellung von physischen Werbesendungen
- Aufrechterhaltung von Backups und Reservierung
-
Technologie-Stack: 1C:Accounting, Docker, Linux, nginx, openssl