Resumen:
El mundo se encuentra en la era del Big Data y el web scraping se ha vuelto una práctica común e importante porque permite la extracción de grandes cantidades de información de internet de forma automatizada. Esta técnica permite recopilar datos de interés, lo que posibilita a cualquier negocio obtener información abierta y estructurada para tomar mejores decisiones. La publicación de perfiles y vacantes de empleo en sitios web está en pleno auge. Las empresas saben que el capital humano es de suma importancia, tener responsables que hagan búsquedas de perfiles en sitios web demanda un gran uso de recursos computacionales, económicos y, en especial, de tiempo. Esto se puede solventar por medio de técnicas de web scraping que permiten realizar el trabajo automático en un par de minutos, así se consiguen cantidades industriales de información sin tener un manejo prolongado del equipo de cómputo. A través de ciertos algoritmos de búsqueda automatizada se puede acceder a la web para extraer información relevante y actualizada de una o varias fuentes. Esta técnica permite el almacenamiento y la manipulación de los datos obtenidos como la generación de tablas, documentos o registros en base de datos. La automatización de tareas en el web scraping permite ahorrar recursos en tiempo y dinero mejorando la precisión, fiabilidad y calidad de los datos.
Descripción:
Se propone la creación de una aplicación de escritorio que utilice técnicas de web scraping para facilitarle al personal de la industria de Atracción de Talento la búsqueda de perfiles específicos en páginas online, este sistema ahorrará al cliente tiempo y recursos. Para llegar a esta solución se tendrá que indagar en la estructura de diferentes bolsas de trabajo online, definir las características principales de sus vacantes, realizar un modelo de base de datos acorde al análisis anterior, crear módulos para la obtención de datos online que se adapten al sitio web de interés y programar un orquestador de estos módulos, al final crear hojas de cálculo para presentar de manera amigable al usuario los resultados.