Academic Journals Database
Disseminating quality controlled scientific knowledge

Clasificación de textos en lenguaje natural usando la Wikipedia

ADD TO MY LIST
 
Author(s): Jose María Quinteiro-González | Ernestina Martel-Jordán | Pablo Hernández-Morera | Juan A. Ligero-Fleitas | Aaron López-Rodriguez

Journal: RISTI : Revista Ibérica de Sistemas e Tecnologias de Informação
ISSN 1646-9895

Issue: 8;
Start page: 39;
Date: 2011;
VIEW PDF   PDF DOWNLOAD PDF   Download PDF Original page

Keywords: Categorización de textos | Wikipedia | tf-idf | Aprendizaje Automático | Procesado de Lenguaje Natural.

ABSTRACT
La clasificación de textos, en entornos en los que el volumen de datos a clasificar es tan elevado que resulta muy costosa la realización de esta tarea por parte de humanos, requiere la utilización de clasificadores de textos en lenguaje natural automáticos. El clasificador propuesto en el presente estudio toma como base la Wikipedia para la creación del corpus que define una categoría mediante técnicas de Procesado de Lenguaje Natural (PLN) que analizan sintácticamente los textos a clasificar. El resultado final del sistema propuesto presenta un alto porcentaje de acierto, incluso cuando se compara con los resultados obtenidos con técnicas alternativas de Aprendizaje Automático.
RPA Switzerland

RPA Switzerland

Robotic process automation

    

Tango Rapperswil
Tango Rapperswil