Recientemente nos encontramos con un reto muy particular, un cliente quería indagar sobre sus costos de envíos (paquetería), ya tenía en sus datos el registro contable de lo que pagaba mensualmente a las diferentes compañías de paquetería pero, no tenía el detalle del costo por tipo de paquete, estado, ciudad o localidad, horario, etc. Al fin de cada mes, recibía en una factura total por compañía y los detalles de cada envío estaban en miles de archivos en formato PDF. Y como una iniciativa de la dirección general, se buscaba la reducción de costos de paquetería, en ese momento resultaron las preguntas, ¿Dónde reducir?, ¿Qué localidades podían tener envíos en lotes? ¿Cuál era la mejor opción por estado, por localidad?, etc. Preguntas sencillas de responder, si se contara con los datos del gasto de paquetería a detalle, y de hecho si lo tenían, pero en archivos PDF. Si bien, ya habían solicitado que, el desglose de los envíos actuales fuera reportado a detalle en un formato facil de analizar (excel), aún nos encontrábamos que, nuestro cliente tenía un pequeño ejército de capturistas realizando el vaciado de los datos que contenían sus miles de archivos de “Guías de envío”, para generar un histórico de los costos y proceder a la optimización de ese gasto. De este modo, nos encontramos con el reto de extraer datos de un formato no amigable, y existen diferentes métodos para hacerlo, ya sea mediante herramientas de extracción o usando código de los lenguajes que están de moda “R” y “Phyton”; nosotros usaremos el más sencillo, contamos con el asombroso POWER BI y con tan solo unos clics, podemos hacer la extracción de cualquier dato de un PDF, permitiendonos enfocarnos en la optimización y quitando los recursos dedicados a ese proceso manual de captura. Así es, Power…
Capturar datos, no gracias, no.
