https://www.ingenieria.unam.mx Repositorio Facultad de Ingeniería

Clasificación Automática de Textos Cortos por Género y Grupo Etario

Mostrar el registro sencillo del ítem

dc.contributor.author González Gallardo, Carlos Emiliano
dc.date.accessioned 2016-04-05T22:37:21Z
dc.date.available 2016-04-05T22:37:21Z
dc.date.issued 2016-04-05
dc.identifier.uri http://132.248.52.100:8080/xmlui/handle/132.248.52.100/9743
dc.description La presente investigación provee de un prototipo de software para la clasificación automática de textos cortos por género y grupo etario que ha sido aplicado a la red social Twitter. Este prototipo hace uso del Aprendizaje de Máquina para entrenar un sistema clasificador a partir de características estilísticas, con la intención de hacerlo lo más independiente del idioma. Cabe señalar que un proceso de re-etiquetado denominado Normalización dinámica dependiente del contexto se lleva a cabo con la intención de aprovechar los elementos sintácticos propios de la red social. Los resultados obtenidos son mostrados primeramente a partir de un grupo de datos provistos por los organizadores del concurso PAN2015; posteriormente una comparación entre la presente propuesta y las otras siete mejores propuestas es realizada a partir de los resultados oficiales liberados por los organizadores. Se realizaron pruebas en los siguientes idiomas: español, inglés, italiano y holandés, siendo el italiano el que mejores resultados mostró e inglés el que obtuvo un rendimiento menor. A partir de los resultados obtenidos, es posible concluir que es de gran importancia mantener toda la información que la red social pueda proveer, pues las características de los textos que presentan las redes sociales difieren en gran medida con las características de los textos de longitud amplia, por lo que es necesario buscar elementos extras que puedan ayudar a caracterizarlos de mejor forma. es_ES
dc.description.abstract La presente investigación provee de un prototipo de software para la clasificación automática de textos cortos por género y grupo etario que ha sido aplicado a la red social Twitter. Este prototipo hace uso del Aprendizaje de Máquina para entrenar un sistema clasificador a partir de características estilísticas, con la intención de hacerlo lo más independiente del idioma. Cabe señalar que un proceso de re-etiquetado denominado Normalización dinámica dependiente del contexto se lleva a cabo con la intención de aprovechar los elementos sintácticos propios de la red social. Los resultados obtenidos son mostrados primeramente a partir de un grupo de datos provistos por los organizadores del concurso PAN2015; posteriormente una comparación entre la presente propuesta y las otras siete mejores propuestas es realizada a partir de los resultados oficiales liberados por los organizadores. Se realizaron pruebas en los siguientes idiomas: español, inglés, italiano y holandés, siendo el italiano el que mejores resultados mostró e inglés el que obtuvo un rendimiento menor. A partir de los resultados obtenidos, es posible concluir que es de gran importancia mantener toda la información que la red social pueda proveer, pues las características de los textos que presentan las redes sociales difieren en gran medida con las características de los textos de longitud amplia, por lo que es necesario buscar elementos extras que puedan ayudar a caracterizarlos de mejor forma. es_ES
dc.description.sponsorship Esta investigación se realizó gracias al apoyo del proyecto Caracterización de huellas textuales para análisis forense; financiado por el CONACYT con la clave 215179 del Fondo Sectorial de Investigación para la Educación (SEP-CONACYT). es_ES
dc.language.iso es es_ES
dc.subject Procesamiento del Lenguaje Natural es_ES
dc.subject Aprendizaje Automático es_ES
dc.subject Perfilado de Autor es_ES
dc.subject Clasificación de texto es_ES
dc.subject Ingeniería Lingüística es_ES
dc.subject Aprendizaje de Máquina es_ES
dc.title Clasificación Automática de Textos Cortos por Género y Grupo Etario es_ES
dc.type Tesis es_ES
dc.director.trabajoescrito Montes Rendón, Azucena
dc.carrera.ingenieria Ingeniería en computación es_ES


Ficheros en el ítem

Este ítem aparece en la(s) siguiente(s) colección(ones)

  • Tesis 2016
    Trabajos escritos para obtener grado académico de licenciatura en ingeniería

Mostrar el registro sencillo del ítem

Buscar en RepoFI


Búsqueda avanzada

Listar

Mi cuenta