Verhuizing TST-materialen

Vanaf april 2016 zijn de digitale taalmaterialen van de TST-Centrale niet langer ondergebracht bij de Nederlandse Taalunie, maar bij het Instituut voor de Nederlandse Taal. Lees meer...

VU-DNC-corpus

Stel een vraag over dit artikel
Preloader

Kenmerken

Aantal Woorden: 1902633
Categorie: Corpus
Taligheid: Monolinguaal
Periode van: 1950
Periode tot: 2002
Annotaties:
Lemma’s , Part of Speech

Omschrijving

Het VU-DNC-corpus is een diachroon Nederlands krantencorpus (VU: Vrije Universiteit, DNC: Dutch Newspaper Corpus). Het corpus bestaat uit data van vijf kranten: Algemeen Dagblad, NRC (Handelsblad), de Telegraaf, Trouw en de Volkskrant. Voor elk van de kranten is data uit twee jaren (1950/1951 en 2002) beschikbaar. De artikelen zijn geselecteerd op onderwerp (o.a. voorpaginanieuws, buitenlands nieuws en sport). Bijzonder aan het corpus is dat het geannoteerd is op de aanwezigheid van subjectieve elementen in de artikelen en op de aanwezigheid van directe rede. De subjectieve elementen zijn geannoteerd op basis van een set lexicale elementen (subjectiviteitslexicon. Daardoor is het corpus interessant voor taalkundig geïnteresseerde onderzoekers met een belangstelling voor diachronie en/of subjectiviteit en voor communicatiewetenschappers en mediaonderzoekers die geïnteresseerd zijn in veranderende praktijken met betrekking tot framing van berichtgeving.

Specificaties

Versie 1.0
Jaar 2012
Opdrachtgever CLARIN-NL
Financier CLARIN-NL
Eigenaar VU Amsterdam
Dataformaat xml, FoLiA
Talen Nederlands
Documentatie Corpusdocumentatie
Project VU-DNC
Projectwebsite http://www.clarin.nl/page/about/projects/162#VU-DNC
Bijzonderheden De data is toegankelijk via de CLARIN-portal. Alleen organisaties die aangesloten zijn bij CLARIN kunnen via de portal gebruikmaken van de data. De metadatabestanden (cmdi) zijn publiek toegankelijk.