Difference between revisions of "LexMan"

From String
Jump to: navigation, search
Line 1: Line 1:
 
===== Acronym =====
 
===== Acronym =====
 
'''''LexMan''''' stands for '''''Lex'''''lical '''''M'''''orphological '''''an'''''alizer
 
'''''LexMan''''' stands for '''''Lex'''''lical '''''M'''''orphological '''''an'''''alizer
 +
  
 
===== Brief Description =====
 
===== Brief Description =====
Line 8: Line 9:
  
  
O LexMan (Lexical Morphological Analiser é responsa ́vel pela etiquetagem morfossintática (POS tagging) da cadeia. O Lex- Man atribui a cada um dos segmentos identificados anteriormente todas as poss ́ıveis etiquetas morfossinta ́ticas, ou seja, classifica um segmento como sendo um s ́ımbolo, um nu ́mero, um verbo, etc. No caso das categorias com flexa ̃o, in- dica ainda os respetivos valores flexionais (tempo, modo, pessoa-número, g ́enero, nu ́mero, grau, etc.). Uma palavra com mais do que uma etiqueta ́e uma palavra amb ́ıgua, de um ponto de vista morfossinta ́tico.
+
O LexMan é responsável pela etiquetagem morfossintática (POS tagging) da cadeia. O LexMan atribui a cada um dos segmentos identificados anteriormente todas as possíveis etiquetas morfossintáticas, ou seja, classifica um segmento como sendo um símbolo, um número, um verbo, etc. No caso das categorias com flexão, indica ainda os respetivos valores flexionais (tempo, modo, pessoa-número, género, número, grau, etc.). Uma palavra com mais do que uma etiqueta é uma palavra amb ́ıgua, de um ponto de vista morfossinta ́tico.
  
  

Revision as of 00:55, 6 March 2012

Acronym

LexMan stands for Lexlical Morphological analizer


Brief Description

LexMan is responsible for according to each token its part-of-speech (POS) and any other relevant morphosyntactic feature (gender, number, tense, mood, case, degree, etc.).

The rich tag set has a high granularity featuring 12 POS categories and 11 fields.


O LexMan é responsável pela etiquetagem morfossintática (POS tagging) da cadeia. O LexMan atribui a cada um dos segmentos identificados anteriormente todas as possíveis etiquetas morfossintáticas, ou seja, classifica um segmento como sendo um símbolo, um número, um verbo, etc. No caso das categorias com flexão, indica ainda os respetivos valores flexionais (tempo, modo, pessoa-número, género, número, grau, etc.). Uma palavra com mais do que uma etiqueta é uma palavra amb ́ıgua, de um ponto de vista morfossinta ́tico.


Module evolution

a new version, capable of performing tokenization is being developed by Alexandre Vicente.


Publications