Wat betekent Natural Language Toolkit?
De Natural Language Toolkit (NLTK) is een platform dat wordt gebruikt voor het bouwen van Python-programma’s die werken met menselijke taalgegevens voor toepassing in statistische Natural Language Processing (NLP).
Het bevat tekstverwerkingsbibliotheken voor tokenisatie, parsing, classificatie, stemming, tagging en semantisch redeneren. Het bevat ook grafische demonstraties en voorbeelddatasets en gaat vergezeld met instructies en een boek met uitleg over de principes achter de onderliggende taalverwerkingstaken die NLTK ondersteunt.
Techopedia legt Natural Language Toolkit uit
De Natural Language Toolkit is een open-source bibliotheek voor de programmeertaal Python, oorspronkelijk geschreven door Steven Bird, Edward Loper en Ewan Klein voor gebruik in ontwikkeling en onderwijs.
Het wordt geleverd met een praktische handleiding die onderwerpen en basisprincipes van het programmeren voor Python behandelt, waardoor het geschikt is voor taalkundigen zonder diepgaande programmeerkennis. Daarnaast is het ook geschikt voor ingenieurs, studenten, docenten en onderzoekers die zich moeten verdiepen in computationele taalkunde.
NLTK bevat een uitgebreide verzameling van meer dan 50 corpora en lexicale bronnen, waaronder het Penn Treebank Corpus, Open Multilingual Wordnet, Problem Report Corpus en Lin’s Dependency Thesaurus.