Korpussammlung

Ein Korpus ist eine Sammlung schriftlicher oder gesprochener Äußerungen in einer oder mehreren Sprachen. Die Daten des Korpus sind digitalisiert, d.h. auf Rechnern gespeichert oder maschinenlesbar. Die Bestandteile des Korpus, die Texte oder Äußerungsfolgen, bestehen aus den Daten selber sowie möglicherweise aus Metadaten, die diese Daten beschreiben, und aus linguistischen Annotationen, die diese Daten zugeordnet sind.[1]

Viele Korpusprojekte bieten eine eigene Weboberfläche für die Untersuchung der Korpusdaten an, teilweise werden die Daten auch für den Download bereitgestellt. Mit unserer Korpusübersicht bei Studi.DH möchten wir Ihnen einen Überblick über bestehende Korpusprojekte bieten.

Für eine noch breitere Recherche können Sie sich aber zum Beispiel auch auf den Korpus-Websites der folgenden Institutionen umsehen:

[1] Lemnitzer, Lothar & Zinsmeister, Heike (2015): Korpuslinguistik. Eine Einführung. 3. Auflage. Tübingen: Narr.