PF
2017-07-10
http://hdl.handle.net/10932/00-0374-4A34-CED0-0801-B
clarin.eu:cr1:p_1366895758244
Institut für Deutsche Sprache, CLARIN-D Zentrum, Mannheim
LandingPage
https://sites.google.com/site/empirist2015/home/annotation-guidelines
LandingPage
https://knjigarna.ff.uni-lj.si/en/izdelek/1766/investigating-computer-mediated-communication/
Resource
http://hdl.handle.net/10932/00-0374-4A34-F910-0901-E
Michael Beißwenger
Diese Ressource enthält ein Datenset mit 230 Belegen (Nutzerpostings) aus dem Dortmunder Chat-Korpus für die Verwendung von Verschmelzungen des Typs 'Vollverb + Personalpronomen'. Alle Belege wurden mit dem Stanford Tagger PoS-annotiert. Das Taggingergebnis wurde nicht manuell nachkorrigiert; lediglich dem Verschmelzungs-Token wurde das Tag VVPPER aus dem erweiterten STTS-Tagset für die PoS-Annotation von Sprachdaten aus Genres internetbasierter Kommunikation ('STTS 2.0') zugewiesen (Beißwenger et al. 2015, Beißwenger et al. 2017).
This resource contains 230 instances of user posts from the Dortmund Chat Corpus which include contractions of the type full verb + personal pronoun. All posts have been automatically PoS-tagged with the Stanford Tagger. The tagger output has not been manually corrected except the tag assigned to the contractions:
Contractions of the aforementioned type have been manually assigned the tag VVPPER described in the 'STTS 2.0' tagset for German CMC/social media data developed for the EmpiriST shared task 2016 (Beißwenger et al. 2015, Beißwenger et al. 2017).
Chatposts + License (rar, 14 KB)
http://hdl.handle.net/10932/00-0374-4A34-CED0-0801-B
2017-10-07
deu
Institut für Deutsche Sprache
Beißwenger et al. 2015: Beißwenger, Michael; Bartz, Thomas; Storrer, Angelika; Westpfahl, Swantje (2015): Tagset und Richtlinie für das Part-of-Speech-Tagging von Sprachdaten aus Genres internetbasierter Kommunikation. Guideline document from the Empirikom shared task on automatic linguistic annotation of internet-based communication (EmpiriST 2015).
Beißwenger et al. 2017: Beißwenger, Michael; Horsmann, Tobias; Zesch, Torsten (2017): Part-of-speech Tagging for Corpora of Computer-mediated Communication: A Case Study on Finding Rare Phenomena. In: Fišer, Darja: Beißwenger, Michael (Eds.): Investigating Computer-Mediated Communication: Corpus-Based Approaches to Language in the Digital World. Ljubljana: Ljubljana University Press (Translation Studies and Applied Linguistics), 192-219. Open access publication
Creative Commons Attribution-ShareAlike 4.0
230 Chat Posts, POS tagged
collection