Autores: | Antonio Ferrández Rodríguez |
URL: | http://gplsi.dlsi.ua.es/mwgplsi/index.php/Portada |
Contacto: | Antonio Ferrández Rodríguez <antoniodlsi.ua.es> |
Descripción
Es un Sistema de Procesamiento de Lenguaje Natural orientado al análisis sintáctico (completo o parcial) y a la resolución de la anáfora. Éste sistema puede incorporar cualquier etiquetador léxico (POS tagger).
Funcionalidad
El sistema funciona tanto para el español como para el inglés. Para realizar un análisis morfo¬sintáctico, recibe como entrada un fichero de texto en lenguaje natural y el idioma. Como salida se almacena en el fichero de salida el texto analizado morfo¬sintácticamente y con resolución de anáfora pronominal, la cual se etiqueta.
Tecnología
Sistema desarrollado en Prolog con versiones ejecutables tanto en Windows como en Linux. Dispone de un interfaz gráfico para su funcionamiento interactivo con el usuario, y también se ha desarrollado una versión ejecutable desde la línea de comando.
Requisitos técnicos
Esta herramienta hace uso del postagger Maco para el español y del Tree Tagger para el inglés.
Módulos
Necesita de un POS tagger que etiquete léxicamente el texto.
Innovación
Amplia cobertura sintáctica para el español e inglés, permitiendo un análisis sintáctico equivalente entre varios idiomas (bloques sintácticos similares: SN, SP, Aposiciones, Núcleos Verbales, etc.). Rapidez de ejecución que permite su uso en grandes corpus, como los empleados en las competiciones de RI y QA del CLEF y TREC.
Desarrollo
Fue resultado de la Tesis Doctoral de Antonio Ferrández Rodríguez, y el cual evolucionó durante las competiciones CLEF y TREC.
Publicaciones
- Antonio Ferrández Rodríguez, Manuel Palomar, Lidia Moreno: An Empirical Approach to Spanish Anaphora Resolution. Machine Translation 14(3¬4): 191¬216 (1999).
- Antonio Ferrández, Manuel Palomar, Lidia Moreno: Anaphor Resolution in Unrestricted Texts with Partial Parsing. COLING¬ACL 1998: 385391.