Profesionales en Real Business Data Science

Generamos soluciones REALES de Ciencia de Datos e Inteligencia Empresarial enfocadas en hacer crecer los negocios. Ayudamos a que las empresas entren en la era del Big Data, tomando decisiones informadas, generando estrategias correctas y con indicadores para evaluar su desempeño.

Los Datos del Mundo en Tus Manos

Vivimos en la era de la información, se habla mucho de Big Data y que necesitamos tomar decisiones basadas en datos, pero al llegar a este punto nadie nos dice que en nuestra computadora tenemos la mejor herramienta para limpiar, almacenar y analizar los datos de todo el mundo, EXCEL, así es nuestro famoso y popular programa cuenta con todo el poder para usar BIG DATA. ¿Qué tan BIG es este BIG DATA?, el Excel tradicional maneja un límite de 1 millón de filas, además hacer cálculos o relacionar con diferentes fuentes (usando VLOOKUP O BUSCARV O INDEX), lo hará lento y quedaremos frustrados. Pero ya no más, el Nuevo Excel tiene un límite de capacidad de “solo” 2 BILLONES de registros y además puede manejar 2 BILLONES de tablas (hagan la cuenta y serán muchos, muchos datos). Pero dimensionemos, 2 Billones de registros son las transacciones anuales de “Walmart México y Centro América”, es decir, si tu empresa tiene la infraestructura, las operaciones y las ventas de ese tamaño, podemos usar nuestro Super Excel para hacer análisis de esas transacciones. Además, cuenta con una tecnología de compresión impresionante, yo he visto como datos que median 4 gigas se comprimieron en un archivo de 40 megas. En un artículo anterior hablamos del poder de compresión de Excel. Ok ahora, ¿de dónde saco los datos?, la respuesta corta, de donde quieras, otra nueva funcionalidad de este Nuevo Excel, son sus conectores, podemos obtener información de archivos de texto, cvs, bases de datos formales, páginas web, Salesforce, Facebook (si, también de ahí), etc. Con estas nuevas funcionalidades, todos pueden usar BIG DATA, analistas, financieros, mercadólogos o psicólogos, y sin importar en que área o industria te desempeñes, puedes hacer uso de todos los datos que desees, ya sean de tu ERP, CRM,…

Read More

¿Cuánto Flow tienes? Más horas de sueño o más horas de fiesta.

Imaginemos lo siguiente, cada inicio de semana (Lunes tienes que llegar super temprano) o cada viernes (todos se van a casa y tu te quedas a enviar el reporte) te llega información de diferentes áreas o regiones y tienes que abrir correos, descargar el archivo, acomodarlos y con eso empezar a hacer el reporte del periodo y el acumulado. Puedes tener un archivo con un formato o una macro que te ayude con ciertas tareas. Sin embargo, hay cosas que aún tienes que hacer manualmente. Pero ya no más, con el PowerStack de Microsoft (Flow y Excel) podemos recuperar horas de sueño o tener más horas de fiesta, tu decides. Primero, quitaremos el abrir correos y descargar los archivos, para ello utilizaremos FLOW. Microsoft Flow es un servicio de flujo de trabajo en línea, que nos permite automatizar acciones en los servicios y las aplicaciones más comunes. Para este ejemplo, queremos que los correos que nos envíen en específico tres compañeros, con los reportes de tres áreas se descarguen en una carpeta compartida. Iniciaremos sesión con las credenciales del correo de office 365 y seleccionamos plantillas. Podemos encontrar la plantilla de “Guardar datos adjuntos de correo electrónico”, nos pedirá acceso a los servicios y los autorizamos. Daremos clic en “Crear flujo” y Microsoft Flow crea el flujo automáticamente. Se conectará a nuestro correo electrónico del trabajo para obtener los datos adjuntos.Después creará una carpeta en la cuenta de OneDrive para la Empresa para colocar automáticamente todos los datos adjuntos enviados a la dirección de correo electrónico del trabajo en esa carpeta. Ahora seleccionaremos mis flujos para configurarlo adecuadamente. Tendremos las opciones detalladas de quién nos envía el correo y si tiene datos adjuntos. También elegiremos la carpeta destino de nuestro One Drive. De este modo, cada vez que recibamos un…

Read More

Capturar datos, no gracias, no.

Recientemente nos encontramos con un reto muy particular, un cliente quería indagar sobre sus costos de envíos (paquetería), ya tenía en sus datos el registro contable de lo que pagaba mensualmente a las diferentes compañías de paquetería pero, no tenía el detalle del costo por tipo de paquete, estado, ciudad o localidad, horario, etc. Al fin de cada mes, recibía en una factura total por compañía y los detalles de cada envío estaban en miles de archivos en formato PDF. Y como una iniciativa de la dirección general, se buscaba la reducción de costos de paquetería, en ese momento resultaron las preguntas, ¿Dónde reducir?, ¿Qué localidades podían tener envíos en lotes? ¿Cuál era la mejor opción por estado, por localidad?, etc. Preguntas sencillas de responder, si se contara con los datos del gasto de paquetería a detalle, y de hecho si lo tenían, pero en archivos PDF. Si bien, ya habían solicitado que, el desglose de los envíos actuales fuera reportado a detalle en un formato facil de analizar (excel), aún nos encontrábamos que, nuestro cliente tenía un pequeño ejército de capturistas realizando el vaciado de los datos que contenían sus miles de archivos de “Guías de envío”, para generar un histórico de los costos y proceder a la optimización de ese gasto. De este modo, nos encontramos con el reto de extraer datos de un formato no amigable, y existen diferentes métodos para hacerlo, ya sea mediante herramientas de extracción o usando código de los lenguajes que están de moda “R” y “Phyton”; nosotros usaremos el más sencillo, contamos con el asombroso POWER BI y con tan solo unos clics, podemos hacer la extracción de cualquier dato de un PDF, permitiendonos enfocarnos en la optimización y quitando los recursos dedicados a ese proceso manual de captura. Así es, Power…

Read More

¿Cuánto Vale la Lealtad del Consumidor?

Este 2019, estaremos generando una serie de artículos con ejemplos prácticos, es decir, no solo mencionaremos las aplicaciones posibles, daremos unos ejemplos reales, para que cualquiera pueda echar a andar el poder de la plataforma de manejo de datos Power Pivot, Power Query y Power BI (en la actualidad son las herramientas más poderosas y sencillas de usar). Usando los datos para medir el valor de la lealtad a la marca. En los meses anteriores un cliente nos pidió evaluar la lealtad de sus clientes, si bien existe toda la teoría de “Customer Loyalty” y como generar lealtad a las marcas, nos solicitaron una herramienta de medición para saber de manera específica cuántos pesos me genera la lealtad de los clientes (valuar con datos duros), es decir, si sus campañas para generar apego a la marca estaban funcionando, ya que están realizando una fuerte inversión en ello. Con los datos obtenidos, observamos que existe un crecimiento muy importante en el número de clientes activos, es decir, el número de consumidores que efectivamente realizaron una compra, vemos que presenta una clara tendencia al alza. Pero, necesitamos saber cuáles de ellos ya han sido nuestros clientes en años anteriores. Lealtad y recompra. Para esto segmentamos a los clientes por el año en el cual se realizó la primera compra, con ello podemos saber, desde cuando nos están comprando y así, logramos conocer si nuestros programas de fidelización están funcionando. Como podemos observar, en los dos primeros años de operación (2011-2012), solo se tuvieron nuevos clientes, es decir, cero recompra. A finales de 2012 se iniciaron planes de apego y beneficios de recompra. Ahora, en 2013 y 2014, dichos planes y programas de apego, empezaron a operar y a dar resultados. Vemos que algunos clientes, que ya habían comprado en 2011 y 2012,…

Read More

DAX-plotion gana el “Hack CDMX: donadores de datos” en la modalidad “VISUALIZACIÓN Y ANÁLISIS DE DATOS”

HACK CDMX: DONADORES DE DATOS En esta nueva edición de Hack CDMX: donadores de datos, el Laboratorio para la Ciudad, en colaboración con el Sistema de Movilidad 1, Metrobús, AXA Seguros y Sin Tráfico convocaron a diseñadores, urbanistas, artistas y arquitectos entusiasmados por el quehacer de la ciudad; periodistas, politólogos, científicos sociales, expertos en movilidad y ciudadanía en general interesados en abordar datos por primera vez liberados para proponer ideas que contribuyan a evitar hechos de tránsito o mejorar el servicio de transporte público, utilizando datos abiertos. DAX-plotion participó en la modalidad de VISUALIZACIÓN Y ANÁLISIS DE DATOS, la cual consistó en traducir bases de datos en materia de seguridad vial y transformarlos en gráficos ilustrativos creativos y para todo público, acompañados de un texto que arrojará luz al hallazgo, con el fin de comunicar un mensaje que permita acciones puntuales para reducir hechos de tránsito. Gracias a la participación de todos los colaboradores de DAX-plotion ganamos, fue un proyecto divertido revisando los datos, construyendo visualizaciones y revisando tecnicas de mapeo, etc. Agradacemos a la CDMX, a los jueces y a la iniciativa Laboratorio para la Ciudad que lanzaron la convocatoria para buscar soluciones a la seguridad vial de nuestra ciudad. Fuentes: https://twitter.com/LabCDMX/status/1067236635308363777 https://hack.labcd.mx

Read More

¿Quién dijo límites?

Recientemente, un cliente nos preguntó cuál era el límite del SUPER EXCEL, y es una pregunta válida, en las versiones “normales” no puedes usar más de 1 millón de filas, es más, al usar unos cuantos miles de registros combinados con fórmulas y con referencias (BUSCARV o VLOOKUP), aparece un escenario que desespera hasta al más paciente de los Analistas de Negocios, un Excel “pasmado”, en la parte de debajo de Excel una pequeña leyenda que dice “calculando”. Y ante cualquier ajuste o movimiento se vuelve a la leyenda “calculando”. Pero eso, hoy es cosa del pasado, intrigados por el límite, encontramos un artículo de Wyn Hopkins (Excel MVP & Director at Access Analytic) que llegaba a cargar 10 millones de filas, y nos dijimos, llevemos a estresar el “Modelo”, nosotros cargamos 100 Millones de filas, así es !!!100 Millones!!!. ¿Y qué tan manejable es un documento así?, pues el tamaño ya es considerable, tenemos un archivo de Excel de 1.5 GB, sin embargo, no tiene problemas de cálculos y no se pasma.   Ahora, probemos las capacidades de compresión del NUEVO EXCEL, tener 100 millones de registros únicos, es posible, veamos qué pasa si algunos valores fueran repetidos. Veamos qué pasa si, tenemos los mismos 100 Millones de registros con valores iguales.   Vemos que son 100 millones de registros, pero ahora nuestro archivo de Excel puede realizar una gran compresión.   Si, mide solamente 154 KB. ¿Qué nos dice esto? Dependiendo de cómo hagamos las consultas a las bases de datos podemos construir modelos más o menos grandes tanto en tamaño, pero ahora el NUEVO EXCEL, NO TIENE LIMITES.   Si aún no disfrutas de los beneficios del SUPER EXCEL, es porque TE HACE FALTA MÁS DAX. Ponte en contacto con nosotros y vive la Nueva de Era…

Read More

Te hace Falta Más DAX

Antes, cuando se pensaba en analizar grandes bases de datos se recurría a ACCESS, SPSS, STATA, SQL y no sé cuántas siglas más, para poder manejar más datos de los que cabían en una hoja de EXCEL, también se pensaba que combinar datos de mercado, de competidores o de la industria tenían que hacerse por separado. Hoy, eso ya es cosa del pasado, Microsoft ha potenciado de manera increíble a la herramienta común de toda la gente que vivimos haciendo números, así es, el mismísimo EXCEL de siempre, ahora tiene DATA SUPER POWERS. Ya no hay nada que temer, no importa la cantidad de filas ni el tamaño de la base de datos (yo he visto como una base de 4 Gigas se reduce a un archivo de EXCEL de 40 megas), no te preocupes si viene en TXT, CVS, SQL, si esta desordenado, si es de una página WEB, no hay datos que no pueda procesar y lo más importante los puede combinar, SÍ, ese famoso Market Share o participación de mercado, la productividad de los vendedores, por línea de producto, se puede hacer super rápido y se puede mezclar con cualquier tipo de información, los datos de los clientes, de los vendedores, TODO. Y lo más importante, ese reporte que siempre te piden los lunes por la mañana, el cual debes de terminar antes de las 11 am y por el cual llegas desde las 6am, se hace con solo un Actualizar o Refresh. O también, ese reporte que te mataste haciendo por Regiones, que 30 minutos antes de la junta te dicen “lo podemos ver por Vendedor y por línea de producto”, hoy con unos cuantos clics estará terminado, pero no lo vas a decir, porque saber DAX, NO CUALQUIERA. Y ahora, te luces haciendo recomendaciones y sugerencias…

Read More