Zum Hauptinhalt

Die Online-Konferenz von Heise

Data Science
im Unternehmen

Data-Science-Projekte meistern: von der Idee zur Produktion

26. April 2022

TICKET BUCHEN

DATA SCIENCE IN DER PRAXIS

Kaum ein Berufsfeld ist in den letzten Jahren so rasant gewachsen wie das des Data Scientists. Nahezu jedes Unternehmen arbeitet mit immer größeren Datenmengen und steht vor der Herausforderung, aus ihnen Schlüsse für aktuelle und zukünftige Geschäftsfelder zu schließen. Doch der Ablauf eines Data-Science-Projekts ist äußerst komplex, beansprucht viele Unternehmensbereiche und benötigt viel Know-how und Erfahrung.

In der Online-Konferenz von Heise zeigen wir Ihnen anhand eines praktischen Beispielprojekts, wie Sie ein Data-Science-Projekt von den Anforderungen bis zur Management-Präsentation meistern können. Angefangen bei der richtigen Formulierung einer Fragestellung bearbeiten wir die vollständige technische Umsetzung des Projekts, inklusive Aufarbeitung und Präsentation der gesammelten Erkenntnisse - immer praxisnah und konkret. Am Ende sind Sie in der Lage, das gelernte Wissen für Ihre eigenen Projekte anzuwenden und wissen genau, wo mögliche Fallstricke liegen und welche Best Practices Sie umsetzen müssen, um Ihr Data-Science-Projekt zum Erfolg zu bringen.

DIE KONFERENZ

  • 08:45 Uhr bis 09:00 Uhr

    Begrüßung

    Alexander Neumann, heise Academy

    Wir heißen Sie herzlich willkommen zu unserer Online-Konferenz und geben Ihnen einen Ausblick auf den Tag.

  • 09:00 Uhr bis 09:45 Uhr

    Business Understanding für Data Science

    Stefanie Scholz, SRH Wilhelm Löhe Hochschule

    In diesem Vortrag gehen wir auf den Ausgangspunkt jedes Data-Science-Projekts ein: den möglichen Geschäftswert, den das Projekt erschließen soll. Dabei berücksichtigen wir die Fallstricke, die in der Definition des Projekts liegen können, und betrachten wichtige Zusammenhänge zwischen den Arbeitsbereichen und gehen auf den CRISP-Prozess im Detail ein (Cross-industry Standard Process for Data Mining). Am Ende des Vortrags haben wir eine genaue Spezifikation für unser Data-Science-Projekt vorliegen und verstehen, warum das Projekt aus Geschäftssicht sinnvoll ist.

  • 09:55 Uhr bis 11:35 Uhr

    Datensuche, Exploration und Statistik: Kann ich mit meinen Daten arbeiten und wenn ja, wie?

    Stefanie Scholz & Christian Winkler, SRH Wilhelm Löhe Hochschule & datanizing

    In diesem Vortrag tauchen wir in das Themenfeld der Statistik ein. Wir lernen, wo wir die für uns notwendigen Daten eigentlich finden können, wie wir sie herunterladen und extrahieren und analysieren, ob unsere vorliegenden Datensätze überhaupt ausreichend gut sind, um unser Data-Science-Projekt durchzuführen. Außerdem zeigen wir auf, wie wir die passenden Methoden zur Arbeit mit unserem Datensatz auswählen und bereiten damit die nächsten Schritte des Workflows vor. Aussagekräftige Diagramme unterstützen dabei diesen Prozessschritt.

    Aufgrund der Länge dieses Vortrags wird es zwischendrin eine Pause von zehn Minuten geben.

  • 11:45 Uhr bis 12:30 Uhr

    Sprachmodelle und Sentiment-Analyse

    Oliver Zeigermann, OPEN KNOWLEGE

    In den Texten steckt noch viel mehr Inhalt, der durch den Kontext transportiert wird. So können Sprachmodelle dafür genutzt werden, die Sentiments in den Texten zu erkennen und besonders positive oder negative Themen zu identifizieren. Das Ökosystem bietet hier noch deutlich mehr, so gibt es auch fertige Klassifikationsmodelle, zum Beispiel für Emotionen. Mithilfe des sog. Zero-Shot-Learnings können Daten in nahezu beliebigen Dimensionen kategorisiert werden. Diese annotierten Dokumente eigenen sich dann besonders gut für alle weiteren Auswertungen.

  • 12:30 Uhr bis 13:15 Uhr

    Mittagspause

    Nutzen Sie die Mittagspause gerne zum Austausch mit anderen Teilnehmer:innen der Konferenz.

  • 13:15 Uhr bis 14:00 Uhr

    Erstellung eines Vorhersagemodells

    Christian Winkler, datanizing

    In diesem Vortrag erweitern wir unsere Modelle um ein Trend-Detection-Modell, um Vorhersagen bezüglich unseres Datensatzes treffen zu können. Dabei schauen wir uns die Implementierungsmöglichkeiten und die Best Practices für diese Arbeit im Detail an. Wir nutzen dazu intuitive verständliche Auswertungen und Visualisierungen. Die Visualisierungen eignen sich auch direkt zur Kundenkommunikation. Wir zeigen eine mögliche Darstellung mithilfe von Jupyter Voilà, ohne dass störender Programmcode sichtbar wird.

  • 14:10 Uhr bis 14:55 Uhr

    Data Storytelling: Reporting und Best Practices

    Shirin Elsinghorst, codecentric

    In diesem Vortrag beschäftigen wir uns mit Data Storytelling. Wir zeigen, wie wir unsere Daten bewerten und eine Geschichte daraus ableiten, die wir im Unternehmen entsprechend kommunizieren können. Dabei bieten wir zahlreiche Praxistipps und Best Practices, die für die Aufbereitung der Daten fürs Storytelling wichtig sind. Evtl. müssen wir dazu bereits vorhandene Auswertungen noch etwas justieren.

  • 15:05 Uhr bis 15:50 Uhr

    Operationalisierung von Data Science (MLOps): Die Modelle in die Produktion bringen

    Christian Koch & Moritz Bunse, TeamBank

    Im letzten Vortrag der Konferenz schauen wir uns an, wie wir unser Data-Science-Modell in der Produktion einsetzen. Dafür überführen wir das Modell in ein Dashboard und zeigen, wie wir es automatisieren und aktualisieren können, um es regelmäßig einzusetzen. Dazu verlassen wir ein stückweit die Jupyter-Welt und konstruieren eine klassische Client-Server-Anwendung, in der wir allerdings viel des bisher Gelernten verwenden können.

IHRE EXPERTEN

  • Christian Winkler

    Dr. Christian Winkler

    datanizing

    ist Data Scientist und Machine Learning Architect bei datanizing. Er promovierte in theoretischer Physik und arbeitet seit 20 Jahren im Bereich großer Datenmengen und Künstliche Intelligenz, insbesondere mit Fokus auf skalierbaren Systemen und intelligenten Algorithmen zur Massentextverarbeitung.

  • Stefanie Scholz

    SRH Wilhelm Löhe Hochschule

    ist Professorin für Sozialwirtschaft an der SRH Wilhelm Löhe Hochschule in Fürth. Nach ihrer Tätigkeit als Bereichsleiterin für Marketing und Vertrieb befasst sie sich mit KI-gestützten Marketinganalysen. Data-driven Marketing und Advanced Analytics stehen im Fokus ihrer Forschungsaktivitäten.

  • Moritz Bunse

    Moritz Bunse

    TeamBank

    ist Lead Data Scientist bei der TeamBank AG, den Machern von easyCredit. Während seines Physik-Studiums an der TU Dortmund suchte er mittels Machine Learning in den ersten Daten des LHC nach Top Quarks. 2011 wechselte er in die Finanzbranche, wo er sich zunächst der Entwicklung von Kreditrisikomodellen widmete, bevor er ab 2017 das Data Science Team und die Analytics-Plattform der TeamBank mit aufgebaut hat.

  • Christian Koch

    Christian Koch

    TeamBank

    ist Datenarchitekt bei der TeamBank AG und Dozent an der Technischen Hochschule Nürnberg Georg Simon Ohm. Er begann seine Karriere als IT-Consultant und hat seitdem analytische Systeme für verschiedene europäische Banken und öffentliche Institutionen entwickelt. Seine Spezialgebiete umfassen Datenarchitekturen, Data Science und Machine Learning.

  • Shirin Elsinghorst

    codecentric

    arbeitet als Data Scientist bei der codecentric AG. Sie hat in der Bioinformatik promoviert und nutzt von Statistik bis Machine Learning verschiedenste Methoden, um aus Daten spannende und neue Erkenntnisse zu gewinnen. Regelmäßig bloggt sie über Data-Science-Themen und gibt Schulungen zu Deep Learning mit Keras.

  • Oliver-Zeigermann

    Oliver Zeigermann

    Softwareentwickler

    ist Softwareentwickler und -architekt aus Hamburg. Er entwickelt seit mehr als drei Jahrzehnten Software mit verschiedenen Ansätzen und Programmiersprachen. In letzter Zeit konzentriert er sich auf maschinelles Lernen und dessen Interaktionen mit Menschen.

TICKETS BUCHEN

  • Ein ganzer Tag Data-Sciene-Know-how
  • Sechs Praxisvorträge renommierter Experten
  • Data-Science-Projekte von A bis Z
  • Online-Teilnahme vom eigenen Schreibtisch aus
  • Tauschen Sie sich mit anderen Teilnehmern aus
  • Stellen Sie den Experten Fragen über den Chat
  • Unbefristeter Zugang zu allen Videos & Materialien
  • Ideal für Teams und Unternehmen

Standard-Ticket: 199 €

JETZT BUCHEN

* Alle Preise verstehen sich inkl. gesetzl. MwSt. (kann je nach Bestimmungsland im Bestellverlauf variieren).

NOCH MEHR WISSEN SICHERN

mit dem heise-Academy-Abo

  • Teilnahme an 100 Online-Trainings im Jahr
  • Zugriff auf eine umfangreiche Videokurs-Bibliothek
  • Lernen von den führenden IT-Experten Deutschlands
  • Mit vielen Praxisbeispielen und Übungen
  • Die wichtigsten Themen zu Administration, Softwareentwicklung und Security
  • Ideal für Teams und Unternehmen

Einführungspreis: € 495* pro Jahr

Buchen Sie gleich Ihr Abo für die heise Academy, um sich die Teilnahme an der Konferenz zu sichern – und erhalten Sie zusätzlich Zugang zu vielen weiteren Online-Kursen, Online-Trainings und Lernmaterialien.

JETZT ABONNIEREN