Mostrar el registro sencillo del ítem
dc.contributor.author | González Gallardo, Carlos Emiliano | |
dc.date.accessioned | 2016-04-05T22:37:21Z | |
dc.date.available | 2016-04-05T22:37:21Z | |
dc.date.issued | 2016-04-05 | |
dc.identifier.uri | http://132.248.52.100:8080/xmlui/handle/132.248.52.100/9743 | |
dc.description | La presente investigación provee de un prototipo de software para la clasificación automática de textos cortos por género y grupo etario que ha sido aplicado a la red social Twitter. Este prototipo hace uso del Aprendizaje de Máquina para entrenar un sistema clasificador a partir de características estilísticas, con la intención de hacerlo lo más independiente del idioma. Cabe señalar que un proceso de re-etiquetado denominado Normalización dinámica dependiente del contexto se lleva a cabo con la intención de aprovechar los elementos sintácticos propios de la red social. Los resultados obtenidos son mostrados primeramente a partir de un grupo de datos provistos por los organizadores del concurso PAN2015; posteriormente una comparación entre la presente propuesta y las otras siete mejores propuestas es realizada a partir de los resultados oficiales liberados por los organizadores. Se realizaron pruebas en los siguientes idiomas: español, inglés, italiano y holandés, siendo el italiano el que mejores resultados mostró e inglés el que obtuvo un rendimiento menor. A partir de los resultados obtenidos, es posible concluir que es de gran importancia mantener toda la información que la red social pueda proveer, pues las características de los textos que presentan las redes sociales difieren en gran medida con las características de los textos de longitud amplia, por lo que es necesario buscar elementos extras que puedan ayudar a caracterizarlos de mejor forma. | es_ES |
dc.description.abstract | La presente investigación provee de un prototipo de software para la clasificación automática de textos cortos por género y grupo etario que ha sido aplicado a la red social Twitter. Este prototipo hace uso del Aprendizaje de Máquina para entrenar un sistema clasificador a partir de características estilísticas, con la intención de hacerlo lo más independiente del idioma. Cabe señalar que un proceso de re-etiquetado denominado Normalización dinámica dependiente del contexto se lleva a cabo con la intención de aprovechar los elementos sintácticos propios de la red social. Los resultados obtenidos son mostrados primeramente a partir de un grupo de datos provistos por los organizadores del concurso PAN2015; posteriormente una comparación entre la presente propuesta y las otras siete mejores propuestas es realizada a partir de los resultados oficiales liberados por los organizadores. Se realizaron pruebas en los siguientes idiomas: español, inglés, italiano y holandés, siendo el italiano el que mejores resultados mostró e inglés el que obtuvo un rendimiento menor. A partir de los resultados obtenidos, es posible concluir que es de gran importancia mantener toda la información que la red social pueda proveer, pues las características de los textos que presentan las redes sociales difieren en gran medida con las características de los textos de longitud amplia, por lo que es necesario buscar elementos extras que puedan ayudar a caracterizarlos de mejor forma. | es_ES |
dc.description.sponsorship | Esta investigación se realizó gracias al apoyo del proyecto Caracterización de huellas textuales para análisis forense; financiado por el CONACYT con la clave 215179 del Fondo Sectorial de Investigación para la Educación (SEP-CONACYT). | es_ES |
dc.language.iso | es | es_ES |
dc.subject | Procesamiento del Lenguaje Natural | es_ES |
dc.subject | Aprendizaje Automático | es_ES |
dc.subject | Perfilado de Autor | es_ES |
dc.subject | Clasificación de texto | es_ES |
dc.subject | Ingeniería Lingüística | es_ES |
dc.subject | Aprendizaje de Máquina | es_ES |
dc.title | Clasificación Automática de Textos Cortos por Género y Grupo Etario | es_ES |
dc.type | Tesis | es_ES |
dc.director.trabajoescrito | Montes Rendón, Azucena | |
dc.carrera.ingenieria | Ingeniería en computación | es_ES |