Masterarbeit: Maschinelles Lernen in Recommendation Systems für den Onlinehandel

Masterarbeit

Mein Name ist Tom Daniek und ich arbeite seit 2018 neben dem Informatik-Masterstudium bei basecom. Bereits zuvor habe ich mich in meiner Bachelorarbeit und verschiedenen Modulen des Studiums mit dem maschinellen Lernen auseinandergesetzt. Im wissenschaftlichen Projekt, welches auf die Masterarbeit hinführt, habe ich die Nutzung verschiedener ML-Modelle auf deren Einsatzmöglichkeiten im E-Commerce untersucht.

Die für mich interessanteste Nutzungsform besteht im Bereich Recommendation Systems. Diese Systeme sind bereits weit verbreitet, sodass jeder von uns fast täglich damit in Kontakt kommt. Cross-Selling-Überschriften wie “Diese Artikel könnten Ihnen gefallen”, “Für Dich ausgewählt” oder “Kunden, die X kauften, interessieren sich auch für Y” deuten auf die Nutzung von Recommendation Systems hin und sind mittlerweile weit verbreitet. Wir als Nutzer*innen begegnen Vorschlägen nicht nur im E-Commerce, sondern auch auf Streamingplattformen (Netflix, Spotify) oder Nachrichtenseiten. Recommendation Systems können im Vergleich zu Wettbewerbern einen Vorteil bieten und einem guten Kundenberater aus dem stationären Handel online mindestens nacheifern, wenn nicht sogar gleichkommen. Sie können, müssen aber nicht auf Methoden des maschinellen Lernens beruhen.

Da es sich um eine wissenschaftliche Arbeit handelt, ist vor allem interessant, wie solche Systeme funktionieren. Grundlegend gibt es zwei Bereiche: Das Content-Based Filtering basiert, wie der Name vermuten lässt, auf der Ähnlichkeit von Inhalten, das Collaborative Filtering auf der Ähnlichkeit von Verhaltensmustern der Nutzer*innen. Innerhalb dieser Bereiche können verschiedene Ansätze und Modelle gewählt werden. Größtenteils geht es dabei recht mathematisch zu.

Das Modell der Matrix-Faktorisierung versucht zum Beispiel, eine unvollständige Interaktionsmatrix, die aus Interaktionen (z. B. Bewertungen, Klickzahlen von Produkten) zwischen Nutzern und Items besteht (grün), so in Faktoren zu zerlegen, dass die erneute Multiplikation dieser Eigenschaftsmatrizen (schwarz) eine vorhergesagte, vollständige Interaktionsmatrix (lila) ergibt. In dieser sind auch Interaktionen (z.B. Bewertungen) vorhanden, die noch nicht stattgefunden haben und dann für die Vorhersagen genutzt werden können. Das Finden optimaler Eigenschaftsmatrizen geschieht, wie so häufig im Bereich des maschinellen Lernens, durch die Minimierung des Fehlers (rot) zwischen der Vorhersage und der Realität. Zu diesem Zweck können unter anderem künstliche neuronale Netze genutzt werden.

Masterarbeit Tom Daniek

In meiner Arbeit habe ich zunächst verschiedene Modelle dargestellt und dann untersucht, wie diese für ein Recommendation System innerhalb der Platzbuchungssoftware desk.ly genutzt werden können. Dazu habe ich diese u.A. auf Basis von Tensorflow implementiert und auf ausgewählten Datensets getestet.

Insgesamt konnten, abhängig vom genutzten Modell und der Beschaffenheit der Daten, vielversprechende Trefferraten (Anteil korrekter Vorhersagen) von z.T. über 90% auf zuvor isolierten Validierungsdaten, erzielt werden. Diese Erkenntnisse können in Zukunft den Nutzer*innen der Plattform desk.ly einen deutlichen Mehrwert, z.B. durch passende Platzvorschläge und somit verkürzte Platzsuche, bieten.

Tom Daniek

Nach meiner Masterarbeit arbeite ich weiterhin bei basecom als Technical Consultant im Bereich Shopware. Dort erarbeite ich u.A. gemeinsam mit den Kund*innen technische Anforderungen und Konzeptionen und stehe in Projekten für technische Rückfragen zur Verfügung.

Wenn auch du Interesse daran hast, deine Bachelor- oder Masterarbeit bei basecom zu schreiben, dann informiere dich auf unserer Karriereseite www.wirsprecheninter.net . Wir freuen uns auf deine Bewerbung!