Ein PoS-Tagger für „das” Mittelhochdeutsche

Nora Echelmeyer, Nils Reiter, Sarah Schulz. Ein PoS-Tagger für „das” Mittelhochdeutsche. In Book of Abstracts of DHd 2017, Bern, Switzerland, February 2017.

DOI: 10.18419/opus-9023

Downloads

Model & description

Abstract

Das Modell für den TreeTagger wurde auf der Mittelhochdeutschen Begriffsdatenbank trainiert. Da die Datenbank keine Annotationen im Kontext enthält, wurden die PoS-Annotationen erzeugt, in dem die grammatischen Informationen zu Begriffen zu PoS tags aus dem Universal Dependency tagset abgebildet wurden. Diese Abbildung basiert auf einem Modell, das auf einer kleinen Datenmenge manuell annotiert wurde. Das letztliche Trainingskorpus enthält etwa 10 Millionen tokens und repräsentiert unterschiedliche Gattungen, Epochen und Dialekte.

BibTeX

@inproceedings{ Echelmeyer2017aa,
   Title = {{Ein PoS-Tagger für „das” Mittelhochdeutsche}},
   Address = { Bern, Switzerland },
   Author = { Nora Echelmeyer and Nils Reiter and Sarah Schulz },
   Booktitle = {{Book of Abstracts of DHd 2017}},
   Month = { February },
   Doi = { 10.18419/opus-9023 },
   Year = { 2017 }
}

RIS

TY - 
TI - Ein PoS-Tagger für „das” Mittelhochdeutsche
AU - Nora Echelmeyer
AU - Nils Reiter
AU - Sarah Schulz
PY - 2017
CY - Bern, Switzerland
DO - 10.18419/opus-9023
J2 - Book of Abstracts of DHd 2017
ER -