doorgaan naar inhoud
Venster sluiten

Meld u aan bij WorldCat 

Heeft u geen account? U kunt eenvoudig een nieuwe gratis account aanmaken.

Automatic lexicon generation for unsupervised part-of-speech tagging using only unannotated text
SluitenVoorbeeldweergave van dit item

Automatic lexicon generation for unsupervised part-of-speech tagging using only unannotated text

Auteur: Dennis V Pereira
Uitgever: [Blacksburg, Va. : University Libraries, Virginia Polytechnic Institute and State University, 2004]
Editie/Formaat: e-Boek : Document : Scriptie/Dissertatie : Deelstaats- of provinciale overheidsuitgave : Engels
Samenvatting:
With the growing number of textual resources available, the ability to understand them becomes critical. An essential first step in understanding these sources is the ability to identify the parts-of-speech in each sentence. The goal of this research is to propose, improve, and implement an algorithm capable of finding terms (words in a corpus) that are used in similar ways - a term categorizer. Such a term  Meer lezen...
Beoordeling:

Gegevens waarderingen en beoordelingen worden opgehaald...  

 

Zoeken naar een online exemplaar

Links naar dit item

Zoeken naar een in de bibliotheek beschikbaar exemplaar

Resultaten worden opgehaald... Bibliotheken met dit item worden gezocht…

Details

Genre: Document, Scriptie/Dissertatie, Overheidsuitgave, Deelstaats- of provinciale overheidsuitgave, Internetbron
Soort document: Internetbron, Computerbestand
Alle auteurs / medewerkers: Dennis V Pereira
OCLC-nummer: 56569925
Opmerkingen: Title from electronic submission form. Vita. Abstract.
Details: System requirements: PC, World Wide Web browser and PDF reader.; Available electronically via Internet.
Verantwoordelijkheid: Dennis V. Pereira.

Fragment:

With the growing number of textual resources available, the ability to understand them becomes critical. An essential first step in understanding these sources is the ability to identify the parts-of-speech in each sentence. The goal of this research is to propose, improve, and implement an algorithm capable of finding terms (words in a corpus) that are used in similar ways - a term categorizer. Such a term categorizer can be used to find a particular part-of-speech, i.e. nouns in a corpus, and generate a lexicon. The proposed work is not dependent on any external sources of information, such as dictionaries, and it shows a significant improvement (30%) over an existing method of categorization. More importantly, the proposed algorithm can be applied as a component of an unsupervised part-of-speech tagger, making it truly unsupervised, requiring only unannotated text. The algorithm is discussed in detail, along with its background, and its performance. Experimentation shows that the proposed algorithm performs within 3% of the baseline, the Penn-TreeBank Lexicon.

Beoordelingen

WorldCat-beoordelingen worden opgehaald...
EMRO-beoordelingen worden opgehaald...
weRead-beoordelingen worden opgehaald...
Beoordelingen van GoodReads worden opgehaald...
Amazon-beoordelingen worden opgehaald...

Tags

U bent de eerste.

Vergelijkbare items

Bevestig deze aanvraag

Misschien heeft u dit item reeds aangevraagd. Selecteer a.u.b. Ok als u toch wilt doorgaan met deze aanvraag.