Schlagwörter
Skills
- Schwerpunkte:
- Business Intelligence (Datenbanken, ETL/ELT, Data Warehousing, Datenmodellierung)
- Big Data & Analytics (Data Integration & Migration): Data Platforms
- Cloud Computing (Microsoft Azure, AWS)
- Datenbanksysteme:
- Relationale Datenbanken: MySQL, MariaDB, Oracle (11g, 12c, 19c), PostgreSQL 13, Microsoft SQL Server, IBM DB2, Azure Datenbank
- Graphdatenbanken: Neo4J
- Programmiersprachen: SQL, PL/SQL, Java SE, Python,
- Bibliotheken: Pandas, PySpark, numPy, Natural Language Toolkit (NLTK)
- Business Intelligence:
- ETL: Azure Data Factory (ADF)
- Visualisierung: Microsoft Power BI
- Big Data: Apache Hadoop (Cloudera, CDP), Apache Spark, Apache Solr, Hue, Apache Impala, Apache Hive, Azure Databricks, Synapse Analytics, Apache Nifi
- Data Science:
- Künstliche Intelligenz (KI): Natural Language Processing (NLP), Named Entity Recognition (NER)
- Cloud Compting:
- Microsoft Azure: Data Lake/Blob Storage, Azure Data Factory (ADF), Azure Databricks, Polybase, Synapse Analytics, SQL DB
- Amazon Web Services (AWS): Simple Storage Service (S3), Amazon Athena
- Process Mining: Celonis
- Entwicklungsumgebungen: IntelliJ IDEA, Pycharm IDE, Eclipse IDE, SQL Server Management Studio (SSMS), Oracle SQL Developer, Azure Data Studio, Jupyter Notebook, Visual Studio Code
- Version Control: Git, GitHub, GitLab
- Project Management: Jira, Confluence
- Methoden und Ansätze: Agile Methodology (Scrum), Test Driven Development (TDD), Object Oriented Development (OOD), DataOps
Kurse und Zertifikationen:
- Associate Databricks SQL Analyst Accreditation
- Microsoft Certified: AI Fundamentals
- Microsoft Certified: Azure Fundamentals
- Microsoft Certified: Azure Data Fundamentals
- AWS Certified Cloud Practitioner
- Professional Scrum Master I (PSM I)
- Cloudera Developer Training for Spark and Hadoop
- Cloudera Introduction to Machine Learning with Spark ML and MLlib
- SAP ERP Integration of Business Processes (TERP10)
- ITIL Foundation in IT Service Management
Projekthistorie
- Entwurf der Datenarchitektur (basierend auf der MACH-Architektur) für die neue Cloud-Platform
- Erstellung von technischen Konzepten für Datenmanagement in der neuen Cloud-Platform
- Erstellung von technischen Konzepten für die Anbindung von externen Systemen
- Organisation und Moderation der Community of Pratctice (CoP) Meetings für Datenarchitektur
- Erstellung der Datenmodelle für die einzelnen Anwendungsfällen der Operations Platform
- Abstimmungen mit den Business Teams über die Anforderungen an der Datenarchitektur
- Datenintegration in Microsoft Azure
- Erstellung von Infrastruktur / Ressourcen in Microsoft Azure
- Erstellung von Datenbankobjekten und Datenmodellierung in Synapse Analytics
- Überprüfung der Datenqualität und Behebung von Beladungsfehler bein Auftreten
Methonden und Technologien: Microsoft Azure, Azure Data Lake Storage (Gen2), Azure Synapse Analytics, Azure SQL Datenbank, Datenmodellierung, Datenmigration (Delta/Full), ETL, SQL
- Erstellung von Datenbankobjekten und Datenaufbereitung in Azure Databricks
- Automatisierung der Datenimports
- Sicherstellung von guter Datenqualität und Überprüfung von Datenlücken
- Testen der Datenflows
- Dokumentation der Implementierung auf Confluence
Methoden und Technologien: Microsoft Azure, Azure Databricks, Apache Nifi, SQL, ETL, Datenqualität, Azure Data Lake Storage Gen2 (ADLS Gen2), Confluence, Jira, Scrum
- Datenaufbereitung in Azure Databricks mit SQL
- Performanzoptimierung
- Prozessmining mit Celonis
- Datenanbindung und Datenintegration im Celonis-Umfeld
- Implementierung von Algorithmen und Regelwerk in Python (Bibliotheken: Pandas Dataframe)
- Datenanalyse
Methoden und Technologien: Process Mining, Celonis, Vertica, SQL, ETL, Process Query Language (PQL), Python, Pandas, Jira
-Implementierung von Data Pipelines in Azure Data Factory (ADF), um Daten von On-Premise-Systemen (wie SAP) in Microsoft Azure zu integrieren
-Erstellung, Anpassung der Konfiguration für die Load-Jobs
-Datenmodellierung und Erstellung von Datenbankobjekte
-Implementierung von Monitoring und Alerting für die ADF-Pipelines
-Erstellung von technischen Dokumentationen und Konzepte (Monitoring ADF Jobs mit Events)
Methoden und Technologien: Microsoft Azure, Azure Data Factory (ADF), ETL, Datenmigration, Datenmodellierung, Hive, Azure Databricks, Apache Spark, Python, Pandas
- Erstellung von Skripten zum Anlegen von Datenbankobjekte in Azure Synapse
- Erstellung von Daten-Pipelines in Azure Data Factory (ADF) für die Archivierung von Daten
- Übersetzung von Skripten von Teradata-Syntax zu T-SQL
- Migration der Daten und Überprüfung der Migration
- Erstellung von technischen Konzepten und Dokumentationen
- Entwurf und Verbesserung von Teile einer bestehenden Datenarchitektur für Textklassifikation in Microsoft Azure
- Implementierung der Komponenten in Microsoft Azure
- Erstellung von technischen Konzepten (Sicherheitskonzept, Datenspeicherungskonzept)
- Dokumentation der Implementierung
- Erstellung von Testfällen
- Erstellung von Datenbankabfragen und Skripte
- Erstellung von technischen Konzepten und Dokumentationen
Methoden und Technologien: J2EE (Java EE), J2SE (Java SE), Java (allg.), Oracle Database, Reporting, SQL, Testing (IT), XML
- Implementierung der Entitäten-Erkennung (NLP-NER), um Daten von Textdateien zu strukturieren.
- Einlesen der Daten von verschiedenen Quellen
- Erstellung eines Datenmodells für externe Daten (öffentliche Data leaks)
- Umsetzung des ETL-Prozesses und Aufbau eines Data Warehouse
- Analyse von produktiven Kundendaten, um Kundenprozesse zu optimieren und effizienter zu gestalten
- Erstellung von DB-Abfragen, um Fehler in der Datenbank zu erstellen.
- Entwurf des Automatisierungsflusses und Implementierung der Wissensbausteine (Knowledge Items).
- Testen der gesamten Automatisierungsflusses
Methoden und Technologien: Oracle Database, PL/SQL, SQL, UML, XML
-Erstellung von Skripte für die Automatisierung
-Anwendung von Best Practices in der Implementierung der Automatisierung
-Vergleich der Performance der automatisierten Prozessen mit einem den Ergebnisse von einem anderen Automatisierungstool
Methoden und Technologien: Bash (Shell), IBM Tivoli Software, Oracle Database, PL/SQL, Scripting, ServiceNow, SQL, UML, XML