Autores: |
Mohammed Rushdi‐Saleh, M Teresa Martín‐Valdivia, L Alfonso Ureña‐López, José M Perea‐Ortega |
URL: | http://sinai.ujaen.es/wp-content/uploads/2013/11/EVOCA-corpus.rar |
Contacto: |
José M. Perea <jmpereaujaen.es> |
Descripción
EVOCA (English Version of OCA) es un corpus en inglés generado a partir de la traducción del corpus OCA en árabe. Este corpus contiene comentarios de películas y está dividido en 250 comentarios considerados positivos y 250 negativos. Algunas estadísticas sobre EVOCA corpus. Este corpus fue traducido en Abril de 2011. Algunas estadísticas sobre él se muestran en la siguiente tabla:
Negativos | Positivos | |
---|---|---|
Total documentos | 250 | 250 |
Total tokens | 122.135 | 153.581 |
Media de tokens en cada comentario | 488,54 | 614,32 |
Total sentencias | 5.030 | 3.483 |
Media de sentencias en cada comentario | 20,12 | 13,93 |
Funcionalidad
-
Tecnología
-
Requisitos técnicos
-
Módulos
-
Innovación
-
Desarrollo
-
Publicaciones
Rushdi Saleh, M., Martín-Valdivia, M. T., Ureña-López, L. A. & Perea-Ortega, J. M. (2011). Bilingual Experiments with an Arabic-English Corpus for Opinion Mining. Proceedings of Recent Advances in Natural Language Processing, pages 740–745.