Supervisor(s)

Student

Related projects

CAIR
Semantic Cluster Analysis in Information Retrieval

Finished

2011-10

Formalia

Targeted audience
  • DAI Hauptstudium
  • AI Master
Preconditions
  • Fähigkeit zum Lesen und Verstehen englischer wissenschaftlicher Publikationen
  • Fähigkeit und Interesse, sich in neue theoretische und praktische Aspekte einzuarbeiten
  • Erfahrung in der Programmierung mit Java (notwendig)
  • Vorlesung Information Retrieval oder Information Mining (hilfreich)

Task description

In Produktrezensionen gehen Kunden auf unterschiedliche Aspekte von Produkten ein. Beispielsweise kann der Inhalt in einer Kurzzusammenfassung wiedergegeben werden, die Verarbeitung oder Ausstattung bewertet werden oder eine Empfehlung für eine bestimmte Zielgruppe ausgesprochen werden.

Je nachdem für welche Aspekte sich ein Benutzer interessiert, sind unterschiedliche Rezensionen für eine Kaufentscheidung nützlich. Ein Überblick über die angesprochenen Aspekte könnte daher den Benutzer dabei unterstützen, schneller die relevanten Aspekte zu identifizieren, die ihm bei seiner Kaufentscheidung nützlich sind, und die entsprechenden Rezensionen zu finden.

In dieser Arbeit soll versucht werden, wichtige Stichworte und Phrasen sowie Aspekteigenschaften und deren Ausprägungen in einer Menge von Rezensionen mittels unüberwachter Lernverfahren zu identifizieren, zu extrahieren und zu strukturieren. Die Präsentation in einer geeigneten Form soll dem Benutzer einen Überblick über die in den Rezensionen angesprochenen Aspekte und Eigenschaften liefern.

Eine Evaluation soll prüfen, ob tatsächlich die entscheidenden Stichworte und Eigenschaften sowie deren Ausprägungen extrahiert und richtig gruppiert wurden.

Eine 2,78 Millionen Bücher umfassende Dokumentkollektion mit entsprechenden Leserrezensionen steht zur Verfügung.