Autores: | Carreras-Riudavets, F.; Jiménez-Estupiñán, R.; Hernández-Figueroa, Z.; Rodríguez-Rodríguez, G. (ULPGC) |
URL: | http://tip.dis.ulpgc.es/es/catalogador-de-neologismos |
Contacto: | Francisco Javier Carreras Riudavets <tipdis.ulpgc.es> |
Descripción
Catalogador automático de neologismos sufijales y prefijales.
Funcionalidad
El sistema CANeo TIP es capaz de detectar los prefijos y los sufijos de un posible neologismo y aplicar las diferentes reglas del español para conseguir un conjunto de palabras primitivas; es decir palabras de las que puede provenir. Para catalogar el neologismo es necesario primero catalogar las palabras primitivas. Para ello utilizamos el servicio de lematización. Realizando consultas a este servicio, obtendremos información acerca de la categoría gramatical de una determinada palabra primitiva, además de información muy valiosa para realizar la catalogación y valoración de los resultados. Utilizando la información estadística recopilada en el estudio, y partiendo de la categoría gramatical de la primitiva, se realiza una estimación a cerca de la categoría gramatical del neologismo.
Tecnología
Página web ASP.NET programada en C#
Requisitos técnicos
http://tip.dis.ulpgc.es/neologismo
Módulos
Innovación
Esta aplicación se basa en el estudio de unas setenta mil palabras derivadas de palabras primitivas que reúne, entre otras cosas, información muy valiosa referente a la utilización de los afijos más productivos del idioma español, sus significados, información estadística de frecuencias de utilización, etc. De manera general, podemos definir la metodología de trabajo para localizar posibles reglas a aplicar, para obtener la palabra primitiva de la que proviene una palabra derivada, de la siguiente manera:
* Análisis sufijal: Se revisa el conjunto de reglas sufijales. Se buscarán reglas que puedan encajar con la terminación sufijal y se incluirán anotaciones acerca de las estadísticas de uso, significados, reglas de corte, etc.
* Análisis prefijal: Se revisa el conjunto de reglas prefijales. Se buscarán reglas que puedan encajar con la terminación prefijal y se incluirán anotaciones acerca de las estadísticas de uso, significados, reglas de corte, etc.
* Se revisarán sustituciones de raíces irregulares: Se anotarán las transformaciones de raíces irregulares en pares que incluyan la raíz de origen y la raíz transformada.
* Se revisan reglas ortográficas: Reglas tales como diptongos, hiatos y otras reglas propias del español.
* Análisis parasintético: Una parasíntesis es la formación de palabras por medio de una combinación de afijos, normalmente pares de prefijo-sufijo. Algunas de estas parasíntesis describen una relación habitual y deben ser tratadas de manera diferente. Del conjunto de sufijos y prefijos estudiados, se reunirán y anotarán estadísticas de uso de las relaciones que existan entre ellos.
* Tratamiento de tildes: Existe un conjunto de reglas de acentuación que también son consideradas en este trabajo.