Demonstration von thematischen Frames im TopicExplorer-System.

2014 
Themenmodelle bieten sich an, die Inhalte groser Dokumentensammlungen zu erforschen. Thematische Wortlisten prasentieren typische Inhalte. Diese Themen werden automatisch gelernt, ohne das Dokumente manuell annotiert werden mussen. Wahrend des Lernens eines Themenmodells werden die Worter der Dokumente Themen zugeordnet. Dabei werden zwei gegenlaufige Ziele verfolgt: erstens, einem Thema sollen so wenig wie moglich verschiedene Worter zugeordnet werden und zweitens, ein Dokument soll so wenig wie moglich verschiedene Themen enthalten [2]. Die unuberwachten Lernalgorithmen finden Kompromisslosungen fur diese Aufgabenstellung, welche im Fall von Variationsinferenz zu lokalen Extrema der freien Energiefunktion des Modells und im Fall von Gibbs-Samplern zu wahrscheinlichen Zustanden einer Markov-Kette korrespondieren. In keinem Fall garantieren die Algorithmen, dass die berechneten Themen gut durch Menschen interpretierbar sind. Es ist state-of-the-art die Themen, welche mathematisch gesehen Wahrscheinlichkeitsverteilungen uber Wortern sind, durch die wahrscheinlichsten Wortern zu reprasentieren. Die Interpretation dieser Wortlisten kann jedoch eine schwierige Aufgabe fur den Anwender sein. Eine erfolgreiche Interpretation hangt vom Hintergrundwissen der Person und der Vertrautheit mit dem genutzten Vokabular ab. Zwei wesentliche Probleme konnen die Interpretation eines Thema beeintrachtigen. Erstens, thematische Wortlisten konnen komplett aus Substantiven bestehen, deren Beziehungen zueinander mehrdeutig sein konnen. Ein Beispiel ist ein Thema, dass durch eine Liste von Landernamen reprasentiert wird. Trotz dessen, dass alle Lander in einer eng umgrenzten Region liegen konnen, gibt es immer noch mehrere verschiedene Interpretationen, die zu einer solchen Liste passen wurden. Deshalb ist sie nicht gut interpretierbar. Ein zweiter Grund kann darin liegen, dass die prasentierten Worter dem Anwender als unzusammenhangend erscheinen. Dies kann an Wortern liegen, die der Anwender nicht kennt. Es ist eine offene Frage, wie durch Themenmodelle berechnete Themen so reprasentiert werden konnen, dass sie klar und eindeutig durch Menschen interpretiert werden
    • Correction
    • Source
    • Cite
    • Save
    • Machine Reading By IdeaReader
    1
    References
    0
    Citations
    NaN
    KQI
    []