Speaker
Description
Machine Learning (ML) wird in das Training von Modellen und die Vorhersage unter Verwendung des Modells unterteilt. ML Frameworks nutzen üblicherweise einen Big-Data-Speicher wie HDFS oder S3, um historische Daten zu verarbeiten und die analytischen Modelle zu trainieren. Dank einer modernen Streamingarchitektur können diese Speicher komplett vermieden werden.
In diesem Talk wird diese moderne Streamingarchitektur mit traditionellen Batch- bzw. Big-Data-Alternativen verglichen. Zudem werden die Vorteile, wie die vereinfachte Architektur, die Möglichkeit, Events wiederholt in der gleichen Reihenfolge zu verarbeiten, um verschiedene Modelle zu trainieren, und eine skalierbare, unternehmenskritische ML-Archtektur für Echtzeitvorhersagen, beleuchtet, und vorgestellt, wie sie aussehen können – ohne die üblichen Kopfschmerzen und Probleme.
Der Vortrag erläutert, wie Streamingdaten direkt über Apache Kafka aus einer beliebigen Quelle eingespielt, mit Kafka Streams oder KSQL verarbeitet, und danach direkt in TensorFlow für das Trainieren der Modelle und Vorhersagen genutzt werden können.