|
|
Abstract DutilhWe beschrijven de verrijking met woordsoort en lemma van het Nederlandse Parole Internet Corpus. Dit corpus zal worden ontsloten met een Webinterface.Aan bod komen:
- Technische implementatie. We werken met een combinatie van verschillende statistische taggers, waarvan 2 speciaal door ons ontwikkeld zijn om gebruik te kunnen maken van het beschikbare lexicon. Omdat de toekenning van bepaalde kenmerken op grond van statistische technieken geen bevredigend resultaat oplevert, lassen we een fine tuning fase in, waarbij we regels inzetten die ook niet-onmiddelijke context gebruiken. Last modified $Date: 2001/10/04 13:39:44 $ by Parlevink Webmaster |