Analyse der Dokument-Metadaten

  • Eine weitere Möglichkeit, sich einen Überblick zum vorliegenden Korpusmaterial zu verschaffen, besteht darin, dass die Metadaten des Korpus betrachtet werden.
  • Falls noch nicht geschehen: Starten Sie den CorpusExplorer und laden Sie ein Korpus.
  • Gehen Sie dann auf Analyse > Korpusverteilung > Tabelle.
  • Zunächst einmal sollten Sie die Tabelle anhand der Tabellenspalte „Token“ sortieren.
  • Klicken Sie mit der rechten Maustaste auf den Tabellenkopf „Token“ und wählen Sie die Option „absteigend sortieren“ aus.
  • Sie werden feststellen, dass die Tabelle weiterhin sehr undurchsichtig ist. Das liegt an den unterschiedlichen Metadaten. Klicken Sie mit der rechten Maustaste auf die den Spaltenkopf „Kategorie“ und wählen Sie die Optionen „gruppieren“.
  • Die so erstellten Gruppen schaffen gleich mehr Überblick und können mit einem einfachen Klick ausgeklappt werden. Klicken Sie auf die Gruppe „Speaker“. Vorgenommene Sortie-rungen und Filterungen gelten auch innerhalb der jeweiligen Gruppe. Daher sehen Sie zum Anfang der Speaker-Gruppe den Speaker mit dem meisten Token im gegenwärtigen Korpus.
  • Ein guter Ausgangspunkt für eine tiefergehende Analyse wäre, dass unterschiedliche Speaker ausgewählt werden und diese dann separat betrachtet werden.