Profilbild von Joachim Groth Senior BI Analyst / Data Scientist aus Falkensee

Joachim Groth

nicht verfügbar bis 30.09.2024

Letztes Update: 27.03.2024

Senior BI Analyst / Data Scientist

Firma: dataconsult joachim groth e.K.
Abschluss: Dipl.-Volkswirt
Stunden-/Tagessatz: anzeigen
Sprachkenntnisse: deutsch (Muttersprache) | englisch (verhandlungssicher)

Dateianlagen

2020-03-01_JoachimGroth_KIDEEPLEARN02-21-ESBF3-all.pdf
2023-02-15-Reference-ebayKleinanzeigen-Jochim-Groth-Signed_220223.PDF
2021-09-02-JoachimGroth-Referenz-ITPG-ERT_220323.pdf
2017-11-ScrumCertificate-ERT_220323.pdf
2023-03-21-CV-de-JoachimGroth_220323.pdf
2023-22-03-CV-en-JoachimGroth_220323.pdf
2020-11-16-Certificate-SecurityAwarenessTraining_220323.pdf
2023-03-21-CV-de-JoachimGroth_290323.docx

Skills

Ich bin ein erfahrener Business Intelligence Analyst mit Schwerpunkt auf Datenanalysen und -visualisierung im e-Commerce, in der Pharma-Industrie und bei Finanz- und Personaldienstleistern. Als selbständiger Berater verknüpfe ich meine soliden Fachkenntnisse mit kaufmännischem Denken und kommunikativer Kompetenz. Ich habe langjährige Erfahrung in agilen Projekten und spreche fließend Englisch.

Datenbanken
Datenbanken sind meine Kernkompetenz. In den letzten Jahren standen Analysen und Visualisierungen im Vordergrund.
  • MS SQL Server (sehr gut)
  • Google BigQuery (sehr gut)
  • Spark.sql auf Hadoop und Databricks (gut)
  • MS SQL-Server-Integration Services (gut)
  • Oracle (PL-SQL)  (gut)

Datenanalyse
90 Prozent meiner Datenanalysen erfolgen gegenwärtig in BigQuery, Tableau, Google Sheets und Python.
  • MS Excel / Google Sheets (sehr gut)
  • Python auf Colab, Databricks, Jupyter und Anaconda (gut)
  • Tableau / MS Power BI (gut)
  • Statistische Verfahren (gut)
  • Google Analytics (Grundkenntnisse)
  • Google Looker, ehemals DataStudio (Grundkenntnisse)

Programmiersprachen
  • SQL (sehr gut)
  • VBA (sehr gut)
Tools/Methoden
GitHub, Scrum, Kanban, Jira, Miro, Slack.

Projekthistorie

08/2014 - bis jetzt
IT-PG ABS: Entwicklung einer Abrechnungs- und Verwaltungssoftware (lfd. Projekt)
IT-Projektgenossenschaft eG (Sonstiges, < 10 Mitarbeiter)

(Weiter-) Entwicklung einer Verwaltungsoftware für eine Vertriebsgenossenschaft mit den Modulen:
  • Kontaktverwaltung: Kunden, Lieferanten, Mitglieder
  • Abrechnung: Rechnungen, Gutschriften, Quittungen, etc.
  • Projekte: Verträge, Konditionen, Provisionen, Dokumente
  • Aufgaben, Termine, Emails
  • Bank: Import, Importverarbeitung, Sepa-Sammelüberweisungen, Zahlungsüberwachung, automatische Buchungen
  • Auswertungen

Rolle: Entwickler / Programmierer (1-Personen-Projekt)
Skills: PostgreSQL (Datenbank), Microsoft Access 2013 (Frontend)

02/2023 - 03/2023
KPI-Dashboard
NN (Internet und Informationstechnologie, 10-50 Mitarbeiter)

Entwicklung

  • eines KPI-Dashboards für die Geschäftsleitung mit den Komponenten Umsatz, Gewinn, Kunden, Dienstleister und Projekten.
  • einer Übersicht der laufenden Projekte als Gantt-Diagramm mit den Komponenten Projektstart, -dauer, -ende, -volumen, Dienstleister und Status.
     

Die Entwicklung fand als „Proof of Concept“ zuerst in Tableau und anschließend in Power-BI statt. Sie umfasste die Schritte:

  • Data Preparation
  • Data Modelling
  • Reportentwicklung
  • Deployment
  • Dokumentation und Nutzer-Einweisung

Der Kunde entschied sich für die Power-BI Lösung.
 

Rolle: Entwickler (Vollständige Projektabwicklung von der Konzeption bis zum Release)

Skills: Tableau, Power-BI, PostgreSQL


08/2021 - 02/2023
Smart Advertising Analyst
NN (Internet und Informationstechnologie, 250-500 Mitarbeiter)

  • Entwicklung von Dashboards und Berichten in Tableau, Google Sheets und Google Data Studio,
  • Analytische Unterstützung bei der Durchführung von A/B-Tests,
  • Weiterentwicklung/Erweiterung eines proprietären A/B-Testing-Frameworks,
  • Erstellung von statistischen Auswertungen und Prognosen,
  • Entwicklung und Pflege von kuratierten Datensätzen in Hadoop, Databricks und Google BigQuery mit Spark.sql, Bigquery.sql und Python,
  • Entwicklung und Pflege von ETL-Prozessen in Hadoop, Databricks und Google BigQuery mit Spark.sql, Bigquery.sql und Python,
  • Verantwortlich für die Dokumentation und Qualitätskontrolle,
  • Arbeit in agilen Teams (Scrum, Kanban),
  • Moderation von gelegentlichen Meetings und Präsentationen,
  • Ad-hoc-Analysen und Berichte im Zusammenhang mit Advertising.


Rolle: Analyst

Skills: Spark.sql (auf Hadoop und Databricks), Tableau, Python (auf Colab, Databricks und Anaconda),  Google BigQuery,  Google Analytics, Google Sheets,  Statistische Verfahren, Agile Entwicklung, Jira, Wiki (Confluence)


02/2017 - 08/2021
Ad-hoc Datenanalysen
NN (Pharma und Medizintechnik, 1000-5000 Mitarbeiter)

Ad-hoc Oracle-Queries zu laufenden klinischen Studien, insbesondere Outlier-Analysen und Untersuchungen zu Sonderfällen, vermeintlichen Fehlern und absichtlicher Täuschung. Zur Abfrage der Oracle-Datenbanken wird DBeaver eingesetzt. Das Reporting erfolgt in csv oder Excel.

Rolle: Entwickler / Programmierer
Skills: Microsoft Excel 2013, PL/SQL, DBeaver, Statistische Verfahren

10/2020 - 07/2021
Reporting: Patienten-Fragebögen
NN (Pharma und Medizintechnik, 1000-5000 Mitarbeiter)

Kundenspezifische Anpassungen von Standardreports.
Rolle: Entwickler/Programmierer
Skills: T-SQL, PL-SQL, Logi Studio 12

05/2016 - 07/2021
Datawarehouse - laufende Weiterentwicklung
NN (Pharma und Medizintechnik, 1000-5000 Mitarbeiter)

Pflege und Erweiterung eines Datawarehouse's zum Monitoring der laufenden klinischen Studien. Neu (im technischen Sinne) ist die schrittweise Umstellung des Reportings von MS SQL-Server Reporting Services und Sharepoint nach Power BI. 

Rolle: Entwickler / Programmierer
Skills: Power BI

07/2020 - 09/2020
Analyse und Visualisierung von Antwortzeiten eines Online-Services
NN (Pharma und Medizintechnik, 1000-5000 Mitarbeiter)

Für die Begutachtung klinischer Messdaten waren maximale Antwortzeiten mit den Gutachtern vereinbart. Meine Aufgabe bestand darin, die tatsächlichen Antwortzeiten grafisch und tabellarisch im PowerBI-Portal aufzubereiten, statistisch auszuwerten und Zeitüberschreitungen qualifiziert zu kennzeichnen.

Rolle: Entwickler / Programmierer (Vollständige Projektabwicklung von der Konzeption bis zum Release)
Skills: MS SQL-Server 2019 (Datawarehouse), MS SQL-Server Integration Service (SSIS-Packages zum Import aus Oracle-DBs),  PowerBI (Desktop/Server)

04/2020 - 07/2020
Visualisierung von Daten-Durchlaufzeiten
NN (Pharma und Medizintechnik, 1000-5000 Mitarbeiter)

Bei der Prozessierung von Daten durch verschiedene Systeme kam es wiederholt zu erheblichen Überschreitungen der vereinbarten Durchlaufzeit. Meine Aufgabe bestand darin, den Datenfluss zu visualisieren, um Engpässe (rückwirkend) identifizieren zu können:
  • Identifikation der betroffenen Systeme und möglicher Messpunkte,
  • Protokollieren der Durchlaufzeiten zwischen den Messpunkten,
  • Bestimmung der Zeitzonen von Quell- und Zielsystemen und Überführung nach UTC,
  • Ermittlung/Verhandlung von Alarm-Schwellwerten,
  • grafische und tabellarische Aufbereitung in einem Reporting-Portal (PowerBI Server)
Rolle: Entwickler / Programmierer (Vollständige Projektabwicklung von der Konzeption bis zum Release)
Skills: MS SQL-Server 2019 (Erweiterung Datawarehouse), MS SQL-Server Integration Service (täglicher Import aus Oracle- und SQL-Server-DBs),  MS PowerBI (Desktop/Server) (Dashboard und Reports)

12/2019 - 04/2020
Sensordaten Monitoring
NN (Pharma und Medizintechnik, 1000-5000 Mitarbeiter)

Nachdem bei einigen medizinischen Messgeräten, von denen weltweit 25.000 Stück im Einsatz sind, unter bestimmten Einsatzbedingungen ein Sensorfehler bei Messreihen festgestellt wurde, mußten schnellstmöglich alle betroffenen Geräte anhand der täglichen Messdatenübertragungen identifiziert und ausgetauscht werden. Meine Aufgaben waren:  
  • Identifizierung und Klassifizierung möglicher fehlerhafter Sensordaten anhand eines Python Machine-Learning Moduls,
  • Grafische Bereitstellung der Messreihen mit statistischen Kenngrößen zur Messreihenqualität (Quartile, Median, Standardabweichung, Outlier-Kennzeichnung) in einem interaktiven Berichtsportal (PowerBI Server)
  • Frontend zur Erfassung eines Prüfprotokolls (MS Access) und folglich Filterung der Daten im PowerBI (geprüfte Geräte erscheinen nur unter konfigurierbaren Bedingungen im PowerBI Outlier-Report
Rolle: Entwickler / Programmierer
Skills: MS SQL-Server 2017 (Backend DB), MS SQL Server Integration Service (tgl. Quelldaten aus Oracle-DB importieren),  MS Excel 2013 (Ergebnis-Berichte und Grafiken [1. Projektphase]),  MS PowerBI (Ergebnis-Berichte und Grafiken
[2. Projektphase]),  MS Access 2013 (Prüfprotokoll [als Filter für die PowerBI-Outlier-Anzeige]),  Python SKLearn (ML-Skript zur Schnell-Identifikation fehlerhafter Datensätze), Statistik

07/2019 - 12/2019
Prototypentwicklung: Geräte- und Adressmapping
NN (Pharma und Medizintechnik, 1000-5000 Mitarbeiter)

Tool zur Planung von Partitionsbelegungen auf Laptops mit Laufzeitumgebungen verschiedener klinischer Studien. Die Partitionen wurden bisher studienbezogen vom Hersteller erfasst, wobei sich mehrere gleichartige Laptops am gleichen Ort (Krankenhaus, Arztpraxis) befinden konnten. Da ein automatisiertes Mapping nicht möglich war (die Adress- und Kontakterfassung wichen von Studie zu Studie und Land zu Land zu stark voneinander ab), musste eine hybride Lösung (manuelles Mapping + Teilautomatisierung) entwickelt werden.
Der Prototyp wird zunächst für die Partitionsverwaltung von ca. 800 Laptops eingesetzt. Im nächsten Schritt ist die Umsetzung auf ein Webportal geplant. 

Rolle: Berater / Consulter (Entwurf, Entwicklung, Abstimmung mit dem Kunden)
Skills: MS SQL-Server 2017 (DB-Entwicklung), MS-SQL-Server Integration Services 2017 (SSIS-Packages zum regelmäßigen Nachladen von Daten aus JD-Edwards und Oracle-DBs),  MS Excel 2013 (Datenimport und formatierter Export),  MS Access 2013 (Frontend [Prototyp])

02/2019 - 04/2019
ClinicalTrials.gov (fortlaufendes Projekt)
IT-projektgenossenschaft eG (Sonstiges, < 10 Mitarbeiter)

Visualisierung von Highlevel-Daten der ClinicalTrials.gov Datenbank mit z.Zt. Daten aus 350.000 klinischen Studien:
  • Welche Krankheiten stehen im Mittelpunkt?
  • Welche Firmen/Institutionen sind besonders aktiv in welchen Feldern?
  • Mapping der kommerziellen Sponsoren (Pharma-Firmen)
  • Stichwort-Mapping bei Atemwegserkrankungen
  • Kennzahlen der wichtigsten Pharmafirmen (aus Finanzportalen)
Rolle: Entwickler / Programmierer (Vollständige Projektabwicklung von der Konzeption bis zum Release)
Skills: PostgreSQL (Datenquelle), MS Power BI (Visualisierung), MS Access 2013 (Mapping-Formulare und Funktionen)

10/2018 - 02/2019
Machine Learning: Overread-Automatisierung
NN (Pharma und Medizintechnik, 1000-5000 Mitarbeiter)

"Proof of Concept" Projekt. Gezeigt werden sollte, dass die Qualitätsbeurteilung von Lungenfunktionsmessreihen (Spirometrie) weitgehend automatisiert werden kann. Diese Qualitätsbeurteilung (Overreads) wurden bisher von einem kostenintensiven weltweiten Netz von Lungenfachärzten durchgeführt. Bei einem Dataset mit 170.000 qualifizierten Messreihen wurde mit verschiedenen Klassifizierern und Meta-Parameter Variationen untersucht, ob ein hoher Anteil der Overreads (> 80 %) mit großer Zuverlässigkeit (False-Positiv-Prognosequote < 0,5 %) per ML automatisch klassifiziert werden konnte. Außerdem wurde geprüft, auf welchem Weg (Webservice, ONNX-File) der resultierende ML-Algorithmus optimal für Anwendungen verfügbar gemacht werden konnte. Die eingesetzen Klassifizierer waren: SVM/Stützvektoren (Gauss, Sigmoid, Maximum Margin, Kernel), k-Nearest Neighbor und Random Forest. Deep-Learning-Verfahren waren zunächst nicht geplant.
Rolle: Entwickler / Programmierer (1-Personen-Projekt)
Skills: Python 2.7/3.6, Pandas, scikit-learn (Python sklearn), Jupyter-Notebook, Spirometrie

11/2017 - 05/2018
Datawarehouse-Migration
NN (Pharma und Medizintechnik, 1000-5000 Mitarbeiter)

Migration eines komplexen DWHs mit vielfältigen Datenquellen von MS-SQL 2008 R2 SSIS auf MS-SQL 2017 SSIS. Dieses Projekt war besonders schwierig, weil der vorherige Entwickler nicht mehr verfügbar war und es keine Dokumentation gab.
Rolle: Entwickler / Programmierer (1-Personen-Projekt)
Skills: Microsoft Visual Studio 2015, Microsoft SQL Server 2017, Microsoft Team Foundation Server 2010,  Oracle 12c,  Microsoft SSIS 2017, C#

05/2017 - 11/2017
Datenbankentwicklung. SCRUM-Pilotprojekt
NN (Pharma und Medizintechnik, 1000-5000 Mitarbeiter)

Entwicklung einer einfachen Datenbank (18 Tabellen, 24 Views, 4 Stored Procedures) für eine Webanwendung zur Verwaltung von Schulungen und Zertifikaten (Training Management System). Verwendung von History-Tabellen zur Datenversionierung und für Audittrail-Reportviews. Pilotprojekt zur agilen Entwicklung an drei Standorten in Deutschland, Russland und Indien.
Rolle: Entwickler / Programmierer (Datenbank)
Skills: Microsoft SQL Server 2017, Microsoft Visual Studio 2017, JIRA, GIT, Polarion

01/2016 - 04/2017
Data Quality Checks
NN (Pharma und Medizintechnik, 1000-5000 Mitarbeiter)

Entwicklung und Pflege von Tools zur Qualitätssicherung von komplexen Datenexporten.

Rolle: Entwickler / Programmierer
Skills: Microsoft Visual Studio 2008, Microsoft SQL Server 2008 R2, Microsoft SQL Integration Services (SSIS) 2008

05/2011 - 09/2016
Portaldatenbankentwicklung für klinische Studien
NN (Pharma und Medizintechnik, 1000-5000 Mitarbeiter)

Entwicklung und Anpassung komplexer, performanter Datenbankabfragen mit Hilfe von Transact SQL (Stored Procedures, Functions, Common Table Expressions, Views) für medizinische Webportale mit sehr großen Datenmengen aus unterschiedlichen Quellen (Big Data). Entwicklung komplexer Export-Pakete und von Datawarehouse-Komponenten (DWH).

Rolle: Entwickler / Programmierer
Skills: Microsoft SQL Server 2008 R2, Microsoft SQL Server Integration Service (SSIS),  Microsoft Team Foundation Server 2008/2010

04/2010 - 03/2011
Prototyp: Immobilienbewertungssystem
Hudson Advisors Germany (Banken und Finanzdienstleistungen, 500-1000 Mitarbeiter)

Objektverwaltung, Mieterverwaltung, Immobilienbewertung nach unterschiedlichen Bewertungs- und Exitstrategien.
Frontend für ca. 250 Clients.

Rolle: Entwickler / Programmierer (Eigenständige Entwicklung innerhalb des Entwicklungsteams des Kunden)
Skills: MS Access 2007 (Frontend), MS SQL Server 2005 (Backend), MS Excel 2007 (Reporting)

09/2009 - 03/2010
Migration/Erweiterung Schmuckgroßhandelssystem
NN (Konsumgüter und Handel, 10-50 Mitarbeiter)

Migration und Erweiterung einer Warenwirtschaft für den Schmuckgroßhandel von Microsoft Access 97 (Frontend und Backend) auf Microsoft Access 2007 (Frontend) und Microsoft SQL-Server 2008 (Backend).

Rolle: Projekt-Manager, Entwickler / Programmierer
Skills: MS SQL Server 2008 R2 (Backend), MS Access 2007 (Frontend)

Zertifikate

SCRUM Zertifikat
2017

Reisebereitschaft

Weltweit verfügbar
Verfügbar ab 1. März 2021; Bevorzugt Homeoffice; Reisebereitschaft grundsätzlich vorhanden.

Sonstige Angaben

Ich biete fachliche und konzeptionelle Stärke verbunden mit sicherem Auftreten und kommunikativer Kompetenz. Zu meinen besonderen Fähigkeiten zählen meine strukturierte und selbständige Arbeitsweise, meine schnelle Auffassungsgabe und meine langjährige Erfahrung als Projektleiter und Entwickler.
Profilbild von Joachim Groth Senior BI Analyst / Data Scientist aus Falkensee Senior BI Analyst / Data Scientist
Registrieren