Ähnlichkeit von Produktmarken basierend auf kollaborativen Nutzeraktionen

Status


Reserved bachelor thesis

Formalia


Targeted audience
  • AI Bachelor
  • Kommedia Bachelor
Preconditions
  • Praktische Kenntnisse mit Datenbanken und SQL-Anfragen (notwendig).
  • Gute Note in Datenbanken.
  • Gute Programmierfähigkeiten.
  • Gute Kenntnisse in Graphentheorie (hilfreich).
  • Vorlesung Internet-Suchmaschinen und/oder Information Retrieval (hilfreich).

Task description


Online Shops bieten Nutzern eine Vielfalt an Produkten, die von verschiedensten Anbietern zur Verfügung gestellt werden. Um den Nutzer einen besseren Überblick über den großen Produktraum zu verschaffen, greifen viele Online Shops auf Produktempfehlungen zurück. Diese Produktempfehlungen können beispielsweise aus ähnlichen Produkten (hinsichtlich der Merkmale), aber auch aufgrund von ähnlichen Nutzern (hinsichtlich der Nutzeraktionen) generiert werden. Letztere wird u.a. häufig von Amazon benutzt, um den Nutzer auf Produkte aufmerksam zu machen, die von Nutzern mit ähnlichem Kaufverhalten resultieren. Für jedes angebotene Produkt wird dann eine Empfehlungsliste mit dem Tag "Kunden, die diesen Artikel gekauft haben, kauften auch..." erzeugt.

Ziel dieser Bachelorarbeit ist es, die Beziehungen zwischen Produktmarken basierend auf kollaborativen Produktempfehlungen zu bestimmen, um dann letztlich eine Ähnlichkeitsmatrix aufzustellen. Diese Ähnlichkeitsmatrix dient dazu, um zu bestimmen welche Produktmarken ähnlicher zueinander sind ("Ist Dell ähnlicher zu Apple oder Lenovo?"), welches in zukünftigen Retrieval-Modellen berücksichtigt werden kann. Hierzu ist wichtig den (unstrukturierten) Datenbestand der Produktseiten aufzuarbeiten und in ein strukturierte Datenformat zu überführen (z.B. relationale Datenbank). Die Transaktionen aus den kollaborativen Produktempfehlungen werden benutzt, um das Produktmarkennetzwerk zu erstellen und dann die Ähnlichkeitsmatrix zu bestimmen. Der Umfang dieser Arbeit beschränkt sich auf den Produkttypen Laptop.

Schließlich sollen die automatisierten Ergebnisse der Ähnlichkeitsbeziehungen evaluiert werden. Hierzu kann Crowdsourcing verwendet werden, um die Ähnlichkeit von Produktmarken zu bewerten. Anschließend werden die Crowdsoucing Resultate mit den automatisch extrahierten Ergebnisse verglichen.

Im einzelnen umfasst die Bachelorarbeit insbesondere folgende Aspekte:

  • Crawlen und Parsen von Produkten auf Amazon.
  • Festhaltung der Produktempfehlungen in einem strukturierten Datenformat.
  • Erstellung eines Netzwerks von gemeinsamen Produktkäufen von Nutzern bzgl. verschiedener Produktmarken.
  • Ermittlung von Ähhnlichkeiten zwischen Produktmarken abgeleitet aus dem gemeinsamen Produktkäufen des zuvor erstellten Netzwerks.
  • Evaluation der Ergebnisse (über Crowdsourcing).