UDPipe (eigene/externe Installation)

Vorbemerkung: Dieser Tagger setzt voraus, dass Sie UDPipe und die gewünschten Sprachmodelle selbst installieren. Alternativ können Sie eine vorkonfigurierte UDPipe Version als CorpusExplorer-Addon installieren. Die hier geschilderte Anleitung richtet sich an fortgeschrittene Nutzer*innen, die UDPipe selbst konfigurieren wollen und können. Das Addon liefert alle verfügbaren Sprachen, der Tagger im Addon arbeitet wesentlich schneller und die Konfiguration ist wesentlich einfacher.
 
Voraussetzung:
  • Laden Sie das aktuelle UDPipe-Release herunter und entpacken Sie die Dateie "udpipe.exe" z. B. nach C:\UDPipe\ - Die Datei befindet sich dabei in einem Unterorder. Dieser beginnt mit "bin-" gefolgt von Betriebssystemkürzel und der Prozessorarchitektur. Bsp.: "bin-win64" - Windows mit 64-Bit (empfohlen). Sie sollten am Ende folgende Pfad erhalten: C:\UDPipe\udpipe.exe
  • Laden Sie die Sprachmodelle herunter und entpacken Sie die gewünschten Dateien in das selbe Verzeichnis wie im Schritt zuvor.
 
UDPipe ist wohl der Tagger mit den meisten verfügbaren Sprachen. Aktuell werden folgende Informationen mittels UDPipe ermittelt: Token, Satzgrenzen, Lemma und POS. Die Erkennung von Phrasen und Satzstrukturen (Syntax-Bäumen) ist aktuell in der Entwicklungsphase.