Schnappschüsse nutzen und weiter verfeinern

  • Bisher wurden alle Analysen auf Basis aller in das Projekt geladenen Korpora durchgeführt. D.h. aber auch, dass bisher nur Aussagen über die Gesamttextmenge getroffen werden konnten. Im Folgenden werden Sie mehrere Möglichkeiten kennen lernen, Schnappschüsse zu erstellen und damit ihre Analyse zu präzisieren.
  • Starten Sie den CorpusExplorer und laden Sie mindestens ein Korpus.
  • Klicken Sie dann im Programmmenü auf das Schnappschuss-Symbol und wählen Sie Schnappschuss-Übersicht aus. Sie gelangen auf die Schnappschuss-Übersichtsseite, wo Sie die Schnappschüsse verwalten können.
  • Der aktive Schnappschuss ist immer fett hervorgehoben und erscheint zudem jederzeit oben rechts im Corpus-Explorer Fenster. Klicken Sie auf einen anderen Schnappschuss, um diesen auszuwählen. Für jedes geladene Korpus erstellt der CorpusExplorer automatisch einen Schnappschuss, der alle Texte des Korpus umfasst. Außer-dem existiert ein dynamischer Schnapp-schuss. „Alle Texte & Korpora (dyna-misch)“ – Dieser ist die Analysegrund-lage, wenn Sie sich nicht um Schnapp-schüsse im CorpusExplorer kümmern… er soll den Einstieg erleichtern. Die Unterschiede zu einem normalen Schnappschuss: Der dynamische Schnappschuss verändert sich, wenn neues Textmaterial hinzugefügt wird und er wird nicht in der Projektmappe gespeichert.
  • Klicken Sie im rechten Menü auf „Neu“. Es werden Ihnen drei Optionen angezeigt. Individuell, Autosplit und Zufällig. „Individuell“ erlaubt es, individuelle Filter zu definieren. Mit „AutoSplit“ können Sie Schnappschüsse automatisch auf Basis von Dokumentmetadaten erstellen. Die Option „Zufällig“ erlaubt es, ein zufälliges Sample zu generieren.
  • Klicken Sie auf „individuell“.
  • Vergeben Sie zuerst einen prägnanten Schnappschuss-Namen. „Freiheit(en)“
  • Zur Auswahl stehen Ihnen drei Filterbausteine: Korpus, Meta-Bedingung und Volltext-Bedingung. „Korpus vollständig“ bedeutet, dass Sie nur bestimmte Korpora betrachten möchten. Die Volltext Bedingung erlaubt es Ihnen, den Inhalt der Dokumente zu durchsuchen. „Metabedingungen“ filtert hingegen Dokumente anhand ihrer Metadaten.
  • Klicken Sie auf „Volltextbedingung“. In der linken Auswahlbox können Sie den abzufragenden Layer auswählen. In der rechten Auswahlbox stehen verschiedene Such-Operatoren zur Verfügung. In der Textbox darunter können Sie dann die Abfrage definieren.
  • Geben Sie hier zum Beispiel „Freiheit“ ein. Bereits bei der Eingabe erscheint eine Liste - die Autovervollständigung. Diese Liste enthält nur verfügbare Begriffe. Um einen Begriff aus der Liste zu übernehmen, klicken Sie ihn entweder mit der Maus an, oder bestätigen Sie ihn mit einem Druck auf Enter (Freiheiten). Wenn Sie nicht durch die Liste scrollen wollen, können Sie auch ein Semikolon eingeben, um den Begriff zu übernehmen (Meinungsfreiheit). Nur grün hinterlegte Begriffe werden von der Suche verwendet. Um einen Begriff aus der Liste zu entfernen, können Sie ihn entweder markieren und löschen oder Sie klicken auf das X. (Meinungsfreiheit).
  • Werfen wir abschließend einen Blick auf die gesamte Abfrage. Wir erstellen einen Schnappschuss mit folgendem Namen: „Freiheit(en)“. Dieser Schnappschuss fragt den Volltext jedes Dokuments einzelnen ab, ob in dessen Wort Layer mindestens ein Wert aus der Liste enthalten ist – in diesem Fall Freiheit und Freiheiten. Mit einem Klick auf „Schnappschuss erstellen“ wird der Schnappschuss generiert.
  • Neben der Möglichkeit, neue Schnappschüsse zu erstellen, besteht die Möglichkeit, bestehende Schnappschüsse noch weiter einzugrenzen.
  • Klicken Sie dazu auf „eingrenzen“. Auch hier sehen Sie die gleichen Funktionen, die Sie bei neuen Schnappschüssen haben, nur mit dem Unterschied, dass kein komplett neuer Schnappschuss erstellt wird, sondern der aktuell gewählte Schnappschuss weiter reduziert wird.
  • Klicken Sie auf „Auto Split“. Im erscheinenden Dialog können Sie die Metaangabe auswählen.
  • Wählen Sie unter Dokument-Metadaten „Speaker“ aus. Außerdem sollten Sie angeben, um welchen Datentyp es sich handelt. In diesem Fall ist es eine Textinformation. Sie sehen aber auch, dass es für Zahlen und Datumsangaben weitere Optionen gibt. Klicken Sie auf „o. k.“ Es werden nun automatisch für jede Metanagabe eigene Schnappschüsse erstellt. Somit wird für jeden Speaker, der innerhalb des Korpus den Begriff „Freiheit“ verwendet, ein separater Schnappschuss angelegt.
  • Wählen Sie einen der Schnappschüsse aus und starten Sie die Analyse „Frequenzanalyse“ mit der „Tabellen“ Ansicht. Rechts oben sehen Sie, dass
  • Sie auf dem gewählten Schnappschuss arbeiten. Über das Schnappschussmenü können Sie jederzeit in einen anderen Schnappschuss wechseln – Die Ansicht wird dann automatisch neu berechnet.
  • Die meisten Analysen im CorpusExplorer bieten die Möglichkeit, einen Schnappschuss direkt aus der Analyseansicht heraus erstellen. Dazu klicken Sie zum Beispiel in der Tabelle auf die gewünschte Zeile, sodass sie hervorgehoben wird.
  • Klicken Sie dann im Tabellenmenü auf das Symbol für „Schnappschuss erstellen“ und tragen Sie dort den gewünschten Namen ein. Bestätigen Sie Ihre aus Eingabe mit „OK“ – Ein Blick in die Schnappschussübersicht zeigt das Ergebnis.
  • Schnappschüsse können außerdem untereinander kombiniert werden. Dafür stehen rechts die folgenden Mengenoperatoren zur Verfügung. Außerdem finden Sie hier die Funktion zum Importieren und Exportieren von Schnappschüssen. Exportieren erlaubt es, einen Schnappschuss und damit alle zugrundeliegenden Korpusdaten in ein externes Format zu exportieren. Die Option „AntiClone“ ist besonders für Zeitungs- und Tweet-Korpora inte-ressant. Mit dieser Option können Sie identische/ähnliche Texte aus dem Korpus eliminieren.