EVOCA Corpus

Autores:	Mohammed Rushdi‐Saleh, M Teresa Martín‐Valdivia, L Alfonso Ureña‐López, José M Perea‐Ortega
URL:	http://sinai.ujaen.es/wp-content/uploads/2013/11/EVOCA-corpus.rar
Contacto:	José M. Perea <jmpereaujaen.es>

Descripción

EVOCA (English Version of OCA) es un corpus en inglés generado a partir de la traducción del corpus OCA en árabe. Este corpus contiene comentarios de películas y está dividido en 250 comentarios considerados positivos y 250 negativos. Algunas estadísticas sobre EVOCA corpus. Este corpus fue traducido en Abril de 2011. Algunas estadísticas sobre él se muestran en la siguiente tabla:

	Negativos	Positivos
Total documentos	250	250
Total tokens	122.135	153.581
Media de tokens en cada comentario	488,54	614,32
Total sentencias	5.030	3.483
Media de sentencias en cada comentario	20,12	13,93

Funcionalidad

Tecnología

Requisitos técnicos

Módulos

Innovación

Desarrollo

Publicaciones

Rushdi Saleh, M., Martín-Valdivia, M. T., Ureña-López, L. A. & Perea-Ortega, J. M. (2011). Bilingual Experiments with an Arabic-English Corpus for Opinion Mining. Proceedings of Recent Advances in Natural Language Processing, pages 740–745.

Red Temática en Tratamiento de la Información Multilingüe y Multimodal (TIMM)

Red Temática en Tratamiento de la Información Multilingüe y Multimodal (TIMM)

Red Temática en Tratamiento de la Información Multilingüe y Multimodal (TIMM)

Índice recursos

EVOCA Corpus

Descripción

Funcionalidad

Tecnología

Requisitos técnicos

Módulos

Innovación

Desarrollo

Publicaciones