„Was andere Menschen denken“ war schon immer ein interessanter Teil des eigenen Meinungsbildungsprozesses. Schon lange bevor das „World Wide Web“ für jedermann
verfügbar war, fragte man Freunde, wen sie bei der nächsten Bundestagswahl wählen würden, welche Autowerkstatt wohl die Beste sei oder aber welches Handwaschmittel
wohl das mit der höchsten Fettlösekraft sei. Der Otto Normalverbraucher, nicht etwa professionelle Kritiker oder aber Bekanntschaften aus dem persönlichen Umfeld sind
Ziel solcher Informationsbeschaffungen. Man erforscht den eigenen Bekanntenkreis nach Erfahrungen mit Produkten und Dienstleistungen jeglicher Art. Genau das machen sich neuerdings auch Unternehmen zu Nutze, welche durch die Entstehung des „WWW“ eine Meinungsressource scheinbar unendlichen Ausmaßes zur Verfügung haben.
Mit Entstehung von informationsreichen Ressourcen, wie persönlichen Blogs, Online-Review Seiten, Meinungsforen und Bewertungsportalen sind eine Vielzahl von unterschiedlichen
Möglichkeiten entstanden, sich zu informieren, zu recherchieren und sich somit diese Ressourcen aktiv zu Nutze zu machen. In Blogs wird über politische Entscheidungen
diskutiert, werden Produkte bewertet und Kritiken zu nahezu allem verfasst.
Zieht man beispielsweise in eine andere Stadt, so informiert man sich über die umliegende Gegend, den zukünftigen Arbeitgeber und lässt sich die schönsten Wohngegenden
anzeigen. Es gibt Internetseiten wie kununu.com, auf denen es möglich ist, seinen Arbeitgeber anhand von einer Notenskala von eins bis fünf zu bewerten. Amazon bietet umfassende Bewertungsprofile an, auf denen man anhand einer Punkteskala ein vorher gekauftes Produkt bewerten kann. Zusätzlich kann man eine vollständige Rezension mit positiven und negativen Eigenschaften des Produkts verfassen.
Inhaltsverzeichnis
1 Einleitung
1.1 Ziel der Arbeit
1.2 Stand der Forschung
2 Heranführung an die aspektbasierte Stimmungsanalyse
2.1 Semantische Annotation
2.1.1 Extrahierung von Aspekten mittels part-of relationship
2.1.2 Aspekt Extrahierung mit Hilfe von double propagation
2.1.3 Explizite und Implizite Aspekte
2.2 Klassifikation von aspektbasierten Stimmungswörtern
2.2.1 Markierung der Stimmungswörter und Phrasen
2.2.2 Verwendung von sentiment shifter
2.2.3 Indikatoren von Gegensatzanzeichen
2.2.4 Basic Rules of Opinions
2.2.5 Sentiment Scores
3 Zusammenfassung und Ausblick
Zielsetzung und Themen
Die Arbeit verfolgt das Ziel, das automatische Klassifizieren von Texten hinsichtlich ihrer Meinungsausprägung zu erläutern und dabei insbesondere die Herausforderungen und Methoden der aspektbasierten Stimmungsanalyse in deutscher Sprache aufzuzeigen.
- Grundlagen der semantischen Annotation und Aspekt-Extraktion
- Methoden des maschinellen Lernens vs. lexikonbasierte Verfahren
- Behandlung von Stimmungsumkehrungen und vergleichenden Meinungen
- Anwendung von Meinungsregeln zur automatisierten Klassifikation
- Berechnung und Interpretation von Sentiment Scores
Auszug aus dem Buch
2.1.2 Aspekt Extrahierung mit Hilfe von double propagation
Ein weiterer Teil der Aspekt Gewinnung ist die Verwendung von Wortgruppen und sogenannten „Samen“ (engl. seed). Man kann sich die herausgefilterten seed words auch als einen Baum vorstellen, aus denen viele kleine Äste hervorgehen, welche verwandte Wörter beschreiben. Neue Stimmungswörter bilden den Stamm für wiederrum neue. Nimmt man beispielsweise folgenden Satz: „Die Canon Eos 1000 macht hervorragende Bilder“, so kann man das Adjektiv hervorragend in Verbindung mit dem Nomen Bilder herausfiltern. Der Vorteil dieser Methode liegt darin, dass man:
1. Aspekte extrahieren kann auf Grundlage von Stimmungswörtern,
2. Aspekte extrahieren kann auf Grundlage extrahierter Aspekte,
3. Stimmungswörter extrahieren kann auf Grundlage extrahierter Aspekte,
4. Stimmungswörter extrahieren kann auf Grundlage von gegebenen Aspekten und Stimmungswörtern, sowie Meinungswörtern [Bin12].
Aus diesem Grund nennt man diese Art der Aufspaltung und Erschließung neuer Stimmungswörter double propagation (DP). Es ist nun möglich diese Gesetzmäßigkeit zu nutzen, indem ein Nomen mit einem Stimmungswort direkt in Verbindung bringt. Nimmt man nun das Wort Bildqualität aus dem vorherigen Beispiel, kann man davon auf das mögliche Stimmungswort hervorragend schließen. Anders herum ist es möglich bei Verwendung des Stimmungswortes hervorragend auf die Bildqualität zu schließen.
Zusammenfassung der Kapitel
1 Einleitung: Diese Einleitung führt in die Relevanz der Stimmungsanalyse ein, beleuchtet das Nutzerverhalten im Internet und definiert das Ziel der Arbeit, automatische Verfahren zur Meinungsanalyse zu untersuchen.
2 Heranführung an die aspektbasierte Stimmungsanalyse: Dieses Kapitel detailliert die semantische Annotation und verschiedene Klassifikationsverfahren wie das überwachte Lernen und den lexikonbasierten Ansatz, um Texte differenziert in Aspekte und Stimmungswerte zu zerlegen.
3 Zusammenfassung und Ausblick: Das Fazit fasst die Bedeutung statistischer und linguistischer Verfahren zusammen und prognostiziert eine steigende Relevanz der Stimmungsanalyse für Unternehmen und Individuen.
Schlüsselwörter
Stimmungsanalyse, Sentiment Analysis, Opinion Mining, aspektbasierte Stimmungsanalyse, semantische Annotation, maschinelles Lernen, lexikonbasierte Erhebung, Natural Language Processing, Double Propagation, Stimmungsschwankungen, Sentiment Scores, Klassifikation,Polaritätsanalyse, Meinungsbildung, Nutzerdaten.
Häufig gestellte Fragen
Worum geht es in dieser Arbeit grundsätzlich?
Die Arbeit befasst sich mit den automatisierten Methoden der Stimmungsanalyse, um in großen Mengen unstrukturierter Daten Meinungen zu extrahieren und zu klassifizieren.
Was sind die zentralen Themenfelder der Analyse?
Zu den Schwerpunkten gehören die semantische Annotation, die Extraktion von Aspekten aus Texten sowie die Klassifizierung dieser Aspekte in positive, negative oder neutrale Kategorien.
Welches primäre Ziel verfolgt die Arbeit?
Das primäre Ziel ist es, schrittweise aufzuzeigen, wie ein System Texte automatisch hinsichtlich der darin ausgedrückten Meinungsausprägung analysieren kann.
Welche wissenschaftliche Methodik wird verwendet?
Die Arbeit untersucht sowohl statistische Verfahren, wie den naiven Bayes-Klassifizierer, als auch linguistische, lexikonbasierte Herangehensweisen wie die Double Propagation.
Was wird im Hauptteil der Arbeit behandelt?
Der Hauptteil gliedert sich in die Identifikation und Extraktion von Aspekten sowie deren anschließende Klassifizierung anhand von Sentiment-Regeln und -Scores.
Welche Schlüsselwörter charakterisieren die Arbeit?
Die zentralen Begriffe umfassen Sentiment Analysis, Opinion Mining, Aspekt-Extraktion, maschinelles Lernen sowie die linguistische Klassifizierung von Stimmungswörtern.
Warum ist die Analyse von Aspekten schwieriger als eine allgemeine Klassifizierung?
Die aspektbasierte Analyse erfordert das Verständnis für verschachtelte Satzstrukturen, implizite Meinungen und den Kontext, während bei einer allgemeinen Klassifizierung oft nur die Stimmung des Gesamtsatzes betrachtet wird.
Was unterscheidet das "lexikonbasierte Verfahren" vom "maschinellen Lernen"?
Beim maschinellen Lernen werden Algorithmen anhand von Trainingsdaten trainiert, um Muster zu erkennen, während das lexikonbasierte Verfahren auf grammatikalischen Regeln und einem vordefinierten Wortschatz mit zugewiesenen Stimmungswerten basiert.
- Arbeit zitieren
- Elmar Scholz (Autor:in), 2014, Aspektbasierte Stimmungsanalyse. Semantische Annotation und Klassifikation von aspektbasierten Stimmungswörtern, München, GRIN Verlag, https://www.hausarbeiten.de/document/298222