Tipp: Korpora verteilen

Dieser Tipp beschreibt die Möglichkeit, wie Sie eigenes Korpusmaterial verteilen/bereitstellen. Verteilen Sie Korpusmaterial an Kolleg*innen und Student*innen. Die großen Vorteile liegen in der einfachen Handhabung und gleichzeitig verfügt das Korpus über eine Autoupdatefunktion. Sie entscheiden, wer was erhält und behalten jederzeit die Kontrolle.
 
Diese Anleitung orientiert sich an einem realen Beispiel. Alle Dateien können Sie auch real & kostenfrei herunterladen. Mehr Infos zum verwendeten KAMOKO-Projekt finden Sie hier.
 
Vorbereitung:
  • Zunächst laden Sie bitte die Korpusdateien auf einen Webserver oder auf ein Netzwerklaufwerk hoch. Dropbox und ähnliche Speicherdienste funktionieren ebenfalls. Für alle Ressourcen (Webserver, Netzwerklaufwerk, Speicherdienst) gilt: Die Nutzer*innen der Korpusdateien müssen Zugriff auf diese Ressource haben.
  • Den Nutzer*innen, denen Sie Zugriff auf ein Korpus gewähren wollen, müssen Zugriff auf die Korpusdateien und die *.manifest-Datei (siehe unten) haben.
  • Der Verteilmechanismus funktioniert aus Sicherheitsgründen NUR mit CEC5-Korpora. Wenn Sie anderen Dateien verteilen wollen, werden Sie scheitern.
 
Bereitstellung - Teil 1 - (*.manifest):
  • Erstellen Sie eine Textdatei - diese muss die Dateiendung .manifest tragen.
  • Pro Zeile können Sie jeweils eine URL eintragen.
  • Direkt nach der URL - ohne Leerzeichen - muss das | Zeichen gesetz sein, gefolgt von der Versionsnummer
  • Laden Sie diese Datei ebenfalls auf einen Webserver, Netzwerklaufwerk, Onlinespeicher hoch.
  • Die Datei muss nicht im selben Verzeichnis liegen wie die Korpusdateien.
     
Bereitstellung - Teil 1 - (*.manifest) - Beispiel
(Auszug aus der http://www.bitcutstudios.com/products/CorpusExplorer/corpora/kamoko/KAMOKO.manifest):
http://www.bitcutstudios.com/products/CorpusExplorer/corpora/kamoko/Artikel.cec5|20160120
http://www.bitcutstudios.com/products/CorpusExplorer/corpora/kamoko/Futur.cec5|20160120
http://www.bitcutstudios.com/products/CorpusExplorer/corpora/kamoko/Infinitiv.cec5|20160120
 
Bereitstellung - Teil 1 - (*.manifest) - Beispiel - Erklärung
Im Auszug sind drei Dateien aufgeführt (mit ihrer frei verfügbaren URL) + | + Versionsnummer. Die *.manifest-Datei dient dem CorpusExplorer als Nachschlagewerk. Neue, noch nicht verfügbare Dateien werden automatisch installiert, d.h. fügen Sie der *.manifest-Datei etwas hinzu, bekommt jede Nutzer*in, die diese Datei abonniert hat eine Update-/Installationsmeldung. Das gleiche gilt, wenn Sie die Versionsnummer ändern. Bitte denken Sie daran, das Ändern der Korpusdateien sorgt noch nicht für ein Autp-Update. Erst wenn Sie die Versionsnummer in der *.manifest-Datei ändern bekommen die Nutzer*innen die Updatemeldung.
 
Bereitstellung - Teil 2 - (*.ceAddon):
  • Erstellen Sie eine weitere Textdatei - diese muss die Dateiendung .ceAddon tragen.
  • Pro Zeile können Sie jeweils eine URL eintragen.
  • Jede URL muss auf eine *.manifest Datei verweisen - Andere Dateitypen werden ignoriert
  • In der ceAddon gibt es keine | oder Versionsnummern - diese Funktion steht nur in den manifest-Dateien zur Verfügung.
 
Bereitstellung - Teil 2 - (*.ceAddon) - Beispiel:
http://www.bitcutstudios.com/products/CorpusExplorer/corpora/kamoko/KAMOKO.manifest
 
Bereitstellung - Teil 2 - (*.ceAddon) - Erklärung:
Das *.ceAddon können Sie entweder online veröffentlichen, oder (so mache ich das im Seminar) - Sie schicken die Datei als Mailanhang an die Student*innen. Dies hat zwei Vorteile (i) das ceAddon gibt die URL der manifest-Datei bekannt. Wenn diese nicht über Suchmaschinen oder Verzeichnisdienste bereits bekannt ist, kann man die manifest-Datei nicht ohne weitere auffinden. (ii) Als Mailanhang ist die ceAddon besonders geeignet, da sie nur wenige KB groß ist. Trotzdem können Korpora in MB- und GB-Größe verschickt werden.
 
Was passiert mit der ceAddon?
  • Die Nutzer*in installiert das ceAddon.
  • Der CorpusExplorer prüft, ob neue oder aktualisierte Datei existieren, indem er in der manifest-Datei nachschlägt.
  • Neue oder aktualisierte Dateien werden automatisch abgerufen.
 
Kann ich nachträglich auch Korpora löschen bzw. zurückziehen?
Ja, das geht, wenn auch mit einem Trick. Ersetzen Sie das zu löschende Korpus mit einer leeren Textdatei. Erhöhen Sie dann die Versionsnummer in der manifest-Datei. Ihre Nutzer*innen werden Sie hassen, denn nach dem vermeintlichen Update ist das Korpus unbrauchbar, da durch eine leere Datei ersetzt.