Autores: | Carreras-Riudavets, F.; Santana-Herrera, J.C.; Hernández-Figueroa, Z.; Rodríguez-Rodríguez, G. (ULPGC) |
URL: | http://tip.dis.ulpgc.es/paramtext |
Contacto: | Francisco Javier Carreras Riudavets <tip |
Descripción
Parametrizador morfológico de textos (No realiza desambiguación)
Funcionalidad
El ParamText TIP analiza un documento y extrae información estadística de interés. Los datos analizados se muestran en gráficas y en tablas, exportables a Microsoft excel, para su estudio y análisis posterior por el usuario.
El ParamText TIP analiza el contenido léxico de un texto, extrayendo el número de párrafos, oraciones, palabras y caracteres. Asímismo, se extrae para cada uno de estos grupos el número de oraciones, de palabras y de caracteres de cada párrafo, el número de palabras y de caracteres de cada oración y el número de caracteres de cada palabra. Ofrece información métrica como la frecuencia de aparición de las palabras en el texto, el centro de gravedad de los vocablos, la distribución de las palabras según su primera aparición y su frecuencia de uso en el español. Asimismo, se muestra en una tabla el vocabulario completo utlizado en el texto.
El ParamText TIP analiza morfológicamente el texto y extrae información relacionada con las categorías gramaticales de las palabras y su flexión morfológica. ParamText no realiza un análisis sintáctico de las frases y, por tanto, no desambigüa las múltiples opciones morfológicas que en ocasiones puede tener una palabra, sino que ofrece el reconocimiento morfológico de cada palabra independientemente de su función en la oración. El grupo Text & Information Processing está trabajando para extraer además la función gramatical que le corresponde a cada palabra en la oración.
Por otro lado, el ParamText TIP permite distinguir en sus análisis entre palabras con significado o sentido semántico y palabras vacías. El ParamText TIP aporta un conjunto de palabras vacías por defecto que el usuario puede modificar en cualquier momento según sus intereses.
Tecnología
Página web ASP.NET programada en C#
Requisitos técnicos
Módulos
Innovación
Extrae información estadística de documentos
Admite documentos de tipo word, pdf y txt
Se muestran gráficas y tablas con los resultados
Analiza morfológicamente las palabras del documento
Todos los datos son exportables a excel
Permite definir el conjunto de palabras vacías