Profilbild von Anonymes Profil, Big Data,  Data Science, Business Intelligence, Data Warehousing, Cloud Computing
nicht verfügbar bis 31.03.2024

Letztes Update: 04.01.2024

Big Data, Data Science, Business Intelligence, Data Warehousing, Cloud Computing

Abschluss: Diplom-Informatiker, Promotion
Stunden-/Tagessatz: anzeigen
Sprachkenntnisse: deutsch (Muttersprache) | englisch (verhandlungssicher)

Dateianlagen

Profil-Torsten-Blum_060923.pdf

Skills

Fachliche Schwerpunkte:
  • Big Data / Data Science
  • Business Intelligence / Data Warehousing
  • Cloud Computing
Rollen: Software Engineer, Data Engineer, Data Analyst, Data Scientist

Zertifizierungen:
  • AWS Solution Architect – Associate
  • Cloudera Certified Data Engineer (CCP)
  • M101J: MongoDB for Java Developers – MongoDB University
  • M102: MongoDB for DBAs – MongoDB University
  • Pentaho Architect Bootcamp
  • Sun certified Java Programmer (SCJP)
Ausbildung:
  • Promotion in Bioinformatik (2009)
    Abschluß: magna cum laude
  • Diplom in Informatik (2004)
    Abschluß: 1,3
Qualifikationen
  • Starke analytische, konzeptionelle und kommunikative Fähigkeiten. Hohe Eigeninitiative sowie selbständiges und ergebnisorientiertes Arbeiten.
  • 17 Jahre IT-Erfahrung in unterschiedlichen Rollen (Software Engineer, Data Engineer, Data Analyst, Data Scientist).
  • Mehr als zehn Jahre Erfahrung in der Anwendung agiler Projektmanagementmethoden (Scrum, Kanban).
  • Sehr vertraut mit relevanten (Big) Data Themen wie Business Intelligence, Data Warehousing, Data Analytics / Data Science sowie mehrere Jahre Erfahrung in der Anwendung moderner Technologien wie AWS, Hadoop, Spark und Pentaho sowie ihrer Ökosysteme.

Projekthistorie

09/2021 - bis jetzt
Entwicklung einer in-silico Drug-Design Plattform
(Pharma und Medizintechnik)

Verwendete Technologien, Libraries, Software und Tools: Git, BitBucket, Jira, AWS (CDK, Batch,
Lambda, DynamoDB, Step Functions, S3, Neptune, IAM, S3, VPC, EC2, ECS, EFS, SQS, SNS,
CloudWatch, Kinesis Firehose, Glue, Athena, EMR), Python, PyCharm, PySpark, Jupyter, Keras, Scikit-Learn, Java, Eclipse, Maven, Docker

01/2019 - 06/2021
Entwicklung einer Pipeline zur Transformation von Unternehmensdaten in das zentrale Data Backend einer Analytics/AI Anwendung

Verwendete Technologien, Libraries, Software und Tools: SAP HANA, HANA Development Tools, SQL, Stored Procedures, DBeaver, Python, PySpark, Pandas, Dask, PyTest, PyCharm, Parquet, Eclipse, Docker, AWS (VPC, EC2, IAM, S3, SNS, EMR, CloudWatch, Lambda), Airflow, Filebeat, ElasticSearch, Kibana, Chronograf, BitBucket, Git, Jenkins, Confluence, Jira

01/2018 - 12/2018
Entwicklung eines Data Lake basiertem Data Warehouse in der Cloud

Verwendete Technologien, Libraries, Software und Tools: AWS (EC2, VPC, SNS, SQS, S3, IAM, Lambda, Redshift, Spectrum, Athena, Glue, CloudFormation, CodePipeline, CodeCommit, CodeBuild, CodeDeploy, ECS), Impala, Kite, Avro, Parquet, NiFi, Docker, Ansible, Pentaho (Business Analytics), Java, JDBC, JNDI, Junit, Mockito, Eclipse, Python, PyCharm, BitBucket, Git, Maven, Jenkins, Confluence, Jira

01/2017 - 12/2018
Migration vorhandener Business Intelligence, Data Warehouse und Big Data Infrastruktur nach AWS

Verwendete Technologien, Libraries, Software und Tools: AWS (EC2, ELB, VPC, SNS, SQS, S3, Glacier, IAM, RDS, Redshift, CloudFormation, CodePipeline, CodeCommit, CodeBuild, ECS), Docker, Logzio, Prometheus, Ansible, Cloudera Director, Pentaho (Data Integration, Business Analytics), SQL, PostgreSQL, Sqirrel, DBeaver, Java, JDBC, JNDI, JUnit, Eclipse, Python, Locust, PyTest, Scikit-Learn, PyData, PyCharm, Spark, BitBucket, Git, Maven, Confluence, Jira

07/2016 - 12/2016
Implementierung eines Modells zur Vorhersage von Churn-Kandidaten inklusive der Visualisierung in einem analytischem Dashboard

Verwendete Technologien, Libraries, Software und Tools: Pentaho (Data Integration, CTools), WEKA, SQL, PostgreSQL, SQirrel, Java, JDBC, JNDI, JUnit, Eclipse, BitBucket, Git, Maven, Jenkins, Confluence, Jira

07/2015 - 06/2016
Einführung von Hadoop, Spark und MongoDB für Big Data Analytics

Verwendete Technologien, Libraries, Software und Tools: Pentaho (Data Integration, Business Analytics), Cloudera Hadoop (Cloudera Manager, HUE, HDFS, HBase, SQOOP, Hive, Impala, Parquet, Avro), Spark (Core, SQL), MongoDB, SQL, PostgreSQL, SQirrel, Java, JDBC, JUnit, Eclipse, Git, Ant, Jenkins, Confluence, Jira

04/2015 - 06/2015
Entwicklung von Reporting-Lösungen zur Analyse des Online-Kundenverhaltens

Verwendete Technologien, Libraries, Software und Tools: Pentaho (Data Integration, Business Analytics), Hadoop (HUE, HDFS, SQOOP, Impala, Parquet), SQL, PostgreSQL, Sqirrel, Java, JDBC, JUnit, Eclipse, Git, Ant, Jenkins, Confluence, Jira

04/2013 - 03/2015
Aufbau eines zentralen Data Warehouse und Einführung von Pentaho als Business Intelligence Lösung

Verwendete Technologien, Libraries, Software und Tools: Pentaho (Data Integration, Business Analytics), SQL, PostgreSQL, Oracle, SQirrel, PgAdmin, Python, PyCharm, Java, Spring (Boot, Data, Cloud Config), RMI, JDBC, JUnit, Eclipse, CVS, Ant, Jenkins, Confluence, Jira

10/2011 - 03/2013
Erweiterung des existierenden Adserver Systems um eine regelbasierte Empfehlungs-Engine

Verwendete Technologien, Libraries, Software und Tools: Java, JDBC, RMI, Junit, Selenium, Servlets, JSP, Struts, Wicket, Hibernate, SQL, Oracle, CVS, Ant, Eclipse, Jira, Confluence

12/2008 - 09/2011
Einführung der Handelsplattform Calypso für Zins- und Kreditderivate

Verwendete Technologien, Libraries, Software und Tools: Java, JDBC, RMI, Swing, Junit, EasyMock, Velocity, SQL, SQirrel, Sybase, XML, XSLT, UML, SVN, TIBCO Rendezvous, Jprofiler, CruiseControl, Windows, Solaris OS, Eclipse, Jira, HP Quality Center, Lotus Notes, MS Office Suite, MagicDraw UML

10/2004 - 09/2008
Analyse metabolischer Netzwerke

Verwendete Technologien, Libraries, Software und Tools: C++, Python, R, PHP, JavaScript, SQL, MySQL, XML, GraphViz, Boost, GDB, Machine Learning (Support Vector Machines, Decision Trees), libSVM, C4.5, vi, SciTE, CVS, Zope Server, MS Office Suite, Latex

03/2002 - 09/2002
Entwicklung einer web-basierten Software für die effiziente buchhalterische Erfassung von Bereitschafts- / Rufbereitschaftszeiten und Notarzteinsätzen des medizinischen Personals.

Verwendete Technologien, Libraries, Software und Tools: Perl, CVS, SQL, MySQL, Apache HTTP Server, SciTE, Windows, MS Office Suite

Reisebereitschaft

Nur Remote verfügbar
Profilbild von Anonymes Profil, Big Data,  Data Science, Business Intelligence, Data Warehousing, Cloud Computing Big Data, Data Science, Business Intelligence, Data Warehousing, Cloud Computing
Registrieren