Vivimos en la era de la información, se habla mucho de Big Data y que necesitamos tomar decisiones basadas en datos, pero al llegar a este punto nadie nos dice que en nuestra computadora tenemos la mejor herramienta para limpiar, almacenar y analizar los datos de todo el mundo, EXCEL, así es nuestro famoso y popular programa cuenta con todo el poder para usar BIG DATA. ¿Qué tan BIG es este BIG DATA?, el Excel tradicional maneja un límite de 1 millón de filas, además hacer cálculos o relacionar con diferentes fuentes (usando VLOOKUP O BUSCARV O INDEX), lo hará lento y quedaremos frustrados. Pero ya no más, el Nuevo Excel tiene un límite de capacidad de “solo” 2 BILLONES de registros y además puede manejar 2 BILLONES de tablas (hagan la cuenta y serán muchos, muchos datos). Pero dimensionemos, 2 Billones de registros son las transacciones anuales de “Walmart México y Centro América”, es decir, si tu empresa tiene la infraestructura, las operaciones y las ventas de ese tamaño, podemos usar nuestro Super Excel para hacer análisis de esas transacciones. Además, cuenta con una tecnología de compresión impresionante, yo he visto como datos que median 4 gigas se comprimieron en un archivo de 40 megas. En un artículo anterior hablamos del poder de compresión de Excel. Ok ahora, ¿de dónde saco los datos?, la respuesta corta, de donde quieras, otra nueva funcionalidad de este Nuevo Excel, son sus conectores, podemos obtener información de archivos de texto, cvs, bases de datos formales, páginas web, Salesforce, Facebook (si, también de ahí), etc. Con estas nuevas funcionalidades, todos pueden usar BIG DATA, analistas, financieros, mercadólogos o psicólogos, y sin importar en que área o industria te desempeñes, puedes hacer uso de todos los datos que desees, ya sean de tu ERP, CRM,…
¿Cuánto Flow tienes? Más horas de sueño o más horas de fiesta.
Imaginemos lo siguiente, cada inicio de semana (Lunes tienes que llegar super temprano) o cada viernes (todos se van a casa y tu te quedas a enviar el reporte) te llega información de diferentes áreas o regiones y tienes que abrir correos, descargar el archivo, acomodarlos y con eso empezar a hacer el reporte del periodo y el acumulado. Puedes tener un archivo con un formato o una macro que te ayude con ciertas tareas. Sin embargo, hay cosas que aún tienes que hacer manualmente. Pero ya no más, con el PowerStack de Microsoft (Flow y Excel) podemos recuperar horas de sueño o tener más horas de fiesta, tu decides. Primero, quitaremos el abrir correos y descargar los archivos, para ello utilizaremos FLOW. Microsoft Flow es un servicio de flujo de trabajo en línea, que nos permite automatizar acciones en los servicios y las aplicaciones más comunes. Para este ejemplo, queremos que los correos que nos envíen en específico tres compañeros, con los reportes de tres áreas se descarguen en una carpeta compartida. Iniciaremos sesión con las credenciales del correo de office 365 y seleccionamos plantillas. Podemos encontrar la plantilla de “Guardar datos adjuntos de correo electrónico”, nos pedirá acceso a los servicios y los autorizamos. Daremos clic en “Crear flujo” y Microsoft Flow crea el flujo automáticamente. Se conectará a nuestro correo electrónico del trabajo para obtener los datos adjuntos.Después creará una carpeta en la cuenta de OneDrive para la Empresa para colocar automáticamente todos los datos adjuntos enviados a la dirección de correo electrónico del trabajo en esa carpeta. Ahora seleccionaremos mis flujos para configurarlo adecuadamente. Tendremos las opciones detalladas de quién nos envía el correo y si tiene datos adjuntos. También elegiremos la carpeta destino de nuestro One Drive. De este modo, cada vez que recibamos un…
Inteligencia Artificial disponible YA en Power BI, Machine Learning para todos.
Como lo anunciamos con anterioridad, Power BI esta integrando soluciones de Inteligencia Artificial en su plataforma, en este mes de Febrero se agregó la “Visualización de influenciadores clave”, la cual ya esta empoderada con Inteligencia Artificial. Esta visualización incluye dos modelos de Machine Learning activos (Regresión Logística y Arboles de decisión). Este nuevo objeto visual de influenciadores clave nos ayudará a reconocer los factores que mayor impacto tienen en una métrica de nuestro interés. Power BI analiza los datos, clasifica aquellos factores que son importantes y los muestra como influenciadores clave. Veamos un ejemplo práctico, para el artículo, usaremos como ejemplo la tasa de abandono de los clientes de una compañía que ofrece el servicio de telefonía, internet y televisión. El contexto es el siguiente, se preguntan los motivos principales por los cuales los clientes abandonan el servicio, para este caso el valor es “Cliente Perdido”= “Si” o “No” y entre los posibles factores que pudieran explicarlo están: AntigüedadSi el cliente es Adulto MayorTipo de servicio de Internet (Fibra óptica, DSL, sin servicio)Método de PagoDuración del ContratoEtc. Es importante considerar la experiencia que el analista tenga del modelo de negocio, ya que esto facilitará la selección de variables a considerar y, también, debemos considerar analizar aquellos elementos que hoy desconocemos su impacto en la variable de interés (este es un proceso crítico y de descubrimiento). Abrimos Power BI, cargamos el archivo de ejemplo y seleccionamos nuestro visual "Key Influencers”. Seleccionamos la variable que deseamos investigar, la colocamos en la sección “Analyze” y las variables que consideremos importantes, aquellas que deseamos saber su impacto, las colocaremos en la sección “Explain by” Veremos como el gráfico se genera y evaluará la importancia de cada elemento y aquellos que no sean relevantes no serán mostrados. De este modo vemos como el Tipo de…
Inteligencia Artificial para todos
La filosofía de DAX-PLOTION es acercar la tecnología a las personas y que su vida sea más fácil y productiva, ya seas un analista que trabaja todos los días con gran cantidad de datos, procesos y reportes, o un ejecutivo que, necesita tomar las mejores decisiones para su empresa, buscamos apoyarte a que asimiles todo el Poder de la Ciencia de Datos en tu día a día. Esa es la razón principal por la cual somos Business Partner de Microsoft, porque busca la democratización de la Ciencia de Datos, es decir, no es necesario ser un experto técnico-matemático, para aprovechar la tecnología, hoy ya lo hace con Power Pivot, Power Query y PowerBI, que son las mejores herramientas para usar analizar datos de manera masiva, les dejo el artículo donde mostramos como Gartner califica a PowerBI como lo mejor en la actualidad. Ahora, lo vuelve a hacer con la Inteligencia Artificial, el pasado mes de Noviembre de 2018, Microsoft anuncia que Power BI contará con integración a Azure Cognitive Service, es decir, tendrá integrados Modelos de Azure Machine Learning (ya entrenados, por supuesto) con lo cual los analistas podrán hacer uso de estos modelos sin escribir una sola línea de código. "Power BI hace posible que todos los empleados de una organización tomen mejores decisiones basadas en datos con hermosos informes y paneles" "Todas estas nuevas capacidades de inteligencia artificial (iniciadas en Azure y ahora disponibles en Power BI) no requieren ningún código" "Esto permite a todos los usuarios de Power BI descubrir información oculta y accionable en sus datos y lograr mejores resultados de negocios con una IA fácil de usar" Arun Ulag General Manager of Engineering for the Power BI project. De este modo no es necesario ser un gigante como Google, Amazon o Netflix para usar Inteligencia…
Power BI como los buenos vinos, cada año MEJOR.
Como cada año, la Firma Consultora Gartner publica un reporte acerca de las herramientas Analíticas y de Inteligencia de Negocios, e incluye su famoso Cuadrante Mágico, en el cual resume en dos ejes las características de las herramientas que se encuentran en el mercado, por un lado tenemos la Amplitud de visión (Completeness of vision) y, por otro, la Capacidad de ejecución (Ability to execute). Fuente: Gartner Feb 2021 Como podemos observar Microsoft con Power BI es el líder indiscutible, y lleva varios años siendo así, para mostrarlo, usaremos los Cuadrantes Mágicos de Gartner de varios años. Tome esta idea de un fabuloso artículo del maestro Matt Allintong, en el cual no solo nos enseña a sacar valores de imágenes, sino que también apreciamos como Power BI es el “Papá de los Pollitos” y lo vemos en un tablero con un gráfico dinámico hecho, POR SU PUESTO EN POWER BI!!!!! Power BI dominando el Mercado de BI Tablero interactivo con los datos de los Cuadrantes ¿Cómo extraer puntos de datos de una imagen? Para extraer los valores de las imágenes de los cuadrantes usaremos la página https://automeris.io/WebPlotDigitizer/ Cargamos la aplicación web y seleccionamos, cargar nuestros archivos de imágenes. Le indicamos que estamos usando un gráfico de dispersión (XY). Alineamos y calibramos los ejes. Ahora, seleccionamos los puntos, no estoy usando todas las compañías, solamente ocuparemos los 7 más relevantes (Microsoft, Tableau, Qlik, SAP, MicroStrategy, IBM y Oracle). Siguiente, ya con los puntos seleccionados, le damos a “View Data” y descargar. Le damos orden al archivo descargado poniendo eje, nombre de la empresa y año. Hacemos lo mismo para los otros años, de 2014 hasta 2019. Cargamos nuestros datos a Power Bi, generamos un gráfico de dispersión y vemos como Rockea Power BI a través de los años. Como podemos observar, Power…
Capturar datos, no gracias, no.
Recientemente nos encontramos con un reto muy particular, un cliente quería indagar sobre sus costos de envíos (paquetería), ya tenía en sus datos el registro contable de lo que pagaba mensualmente a las diferentes compañías de paquetería pero, no tenía el detalle del costo por tipo de paquete, estado, ciudad o localidad, horario, etc. Al fin de cada mes, recibía en una factura total por compañía y los detalles de cada envío estaban en miles de archivos en formato PDF. Y como una iniciativa de la dirección general, se buscaba la reducción de costos de paquetería, en ese momento resultaron las preguntas, ¿Dónde reducir?, ¿Qué localidades podían tener envíos en lotes? ¿Cuál era la mejor opción por estado, por localidad?, etc. Preguntas sencillas de responder, si se contara con los datos del gasto de paquetería a detalle, y de hecho si lo tenían, pero en archivos PDF. Si bien, ya habían solicitado que, el desglose de los envíos actuales fuera reportado a detalle en un formato facil de analizar (excel), aún nos encontrábamos que, nuestro cliente tenía un pequeño ejército de capturistas realizando el vaciado de los datos que contenían sus miles de archivos de “Guías de envío”, para generar un histórico de los costos y proceder a la optimización de ese gasto. De este modo, nos encontramos con el reto de extraer datos de un formato no amigable, y existen diferentes métodos para hacerlo, ya sea mediante herramientas de extracción o usando código de los lenguajes que están de moda “R” y “Phyton”; nosotros usaremos el más sencillo, contamos con el asombroso POWER BI y con tan solo unos clics, podemos hacer la extracción de cualquier dato de un PDF, permitiendonos enfocarnos en la optimización y quitando los recursos dedicados a ese proceso manual de captura. Así es, Power…
8 Tendencias del Sector de Hospitales Privados en México
Para este 2019 también vamos a integrar en nuestras publicaciones análisis a sectores o industrias, usando las herramientas de Data Management de Microsoft, Power Query y Power BI. Comenzaremos con el sector de Hospitales Privados, derivado de un interesante artículo de Maribel Ramírez Coronel, el cual, menciona las diferentes iniciativas del Sector Salud Privado y cómo se está gestando un plan alternativo al sistema de Salud Pública.De este modo, nos dimos a la tarea de buscar datos para construir un modelo que nos de información acerca de las tendencias de este sector. Comentaremos nuestros principales hallazgos, compartiremos los tableros y las visualizaciones asociadas a nuestros análisis. Si desean más detalle o les interesa otro sector déjenlo en los comentarios. Para este artículo mencionaremos las tendencias principales en los Hospitales Privados de México, obtenidas gracias a la consolidación de las series de datos disponibles en las Bases del INEGI. Existe una concentración de las unidades Hospitalarias en 5 estados de la república mexicana. Concentración de unidades Hospitalarias en el Edo de México, CDMX, Guanajuato, Jalisco y Veracruz Además, se están generando una consolidación del sector en Unidades Hospitalarias de Mayor capacidad de atención, ya que se observa una clara reducción de hospitales pequeños (con capacidad menor a 10 camas), pero un incremento en los hospitales grandes (25 o más camas). Tendencia de Hospitales Privados Pequeños Tendencia de Hospitales Privados Grandes Las Consultas Generales y Especialidad, son atendidas en igual proporción, sin importar el tamaño del hospital, sin embargo, las consultas de Emergencia son atendidas en mayor proporción en los Hospitales grandes. Consultas atendidas por Hospitales Pequeños y Medianos Consultas atendidas por Hospitales Grandes A pesar de existir una disminución de unidades médicas, las personas atendidas no presentan una tendencia a disminuir y presentan una tendencia claramente al alza. Número de Pacientes…
¿Cuánto Vale la Lealtad del Consumidor?
Este 2019, estaremos generando una serie de artículos con ejemplos prácticos, es decir, no solo mencionaremos las aplicaciones posibles, daremos unos ejemplos reales, para que cualquiera pueda echar a andar el poder de la plataforma de manejo de datos Power Pivot, Power Query y Power BI (en la actualidad son las herramientas más poderosas y sencillas de usar). Usando los datos para medir el valor de la lealtad a la marca. En los meses anteriores un cliente nos pidió evaluar la lealtad de sus clientes, si bien existe toda la teoría de “Customer Loyalty” y como generar lealtad a las marcas, nos solicitaron una herramienta de medición para saber de manera específica cuántos pesos me genera la lealtad de los clientes (valuar con datos duros), es decir, si sus campañas para generar apego a la marca estaban funcionando, ya que están realizando una fuerte inversión en ello. Con los datos obtenidos, observamos que existe un crecimiento muy importante en el número de clientes activos, es decir, el número de consumidores que efectivamente realizaron una compra, vemos que presenta una clara tendencia al alza. Pero, necesitamos saber cuáles de ellos ya han sido nuestros clientes en años anteriores. Lealtad y recompra. Para esto segmentamos a los clientes por el año en el cual se realizó la primera compra, con ello podemos saber, desde cuando nos están comprando y así, logramos conocer si nuestros programas de fidelización están funcionando. Como podemos observar, en los dos primeros años de operación (2011-2012), solo se tuvieron nuevos clientes, es decir, cero recompra. A finales de 2012 se iniciaron planes de apego y beneficios de recompra. Ahora, en 2013 y 2014, dichos planes y programas de apego, empezaron a operar y a dar resultados. Vemos que algunos clientes, que ya habían comprado en 2011 y 2012,…
Una imagen vale más que mil palabras y una Visualización complementa mil análisis.
Recientemente participamos en una iniciativa que buscaba analizar y visualizar datos relacionados a la seguridad vial, fue un gran reto ya que no se habían trabajado con anterioridad esas bases de datos, y el objetivo fue hacer visible la problemática de las vialidades de la Ciudad de México, con base a dichos datos. Les dejo el vínculo de nuestra excelente participación. Ahora, ¿por qué es tan importante la visualización?, si ya tenemos los datos y podemos hacer muchas métricas, estadísticas y con ellas podemos realizar un análisis profundo. El ser humano es un ser visual, desde la antigüedad y por el proceso evolutivo, el sentido de la vista se ha desarrollado para ser uno de los sentidos más importantes, las formas y colores nos dan indicios de nuestro entorno, nos indican peligros, vemos patrones, admiramos paisajes y, por lo tanto, podemos hacer inferencias de nuestro mundo y actuar de acuerdo con la situación. En el caso de los negocios podemos hacer lo mismo, una buena visualización nos complementará aquel análisis numérico que hayamos realizado. Para ejemplificarlo, vemos el siguiente caso. Contamos con la información de nuestra fuerza de ventas, sus visitas a clientes y los valores de ventas de cada mes. De acuerdo con los resultados, los vendedores son muy parecidos, tanto en esfuerzo como en desempeño, las estadísticas de los vendedores son similares (de hecho, son exactamente iguales) cada mes realizan en promedio el mismo número de visitas y obtienen el mismo promedio de ventas; incluso sus variaciones son muy similares (la desviación estándar). Es más, si realizamos una fórmula de pronóstico de sus ventas basadas en sus vistas a clientes tendremos los mismos pronósticos (con buen nivel de efectividad). ¿Acaso tendremos vendedores clonados o estarán incorrectos nuestros datos? No, simplemente nos falta complementar el análisis. Ahora podemos…
DAX-plotion gana el “Hack CDMX: donadores de datos” en la modalidad “VISUALIZACIÓN Y ANÁLISIS DE DATOS”
HACK CDMX: DONADORES DE DATOS En esta nueva edición de Hack CDMX: donadores de datos, el Laboratorio para la Ciudad, en colaboración con el Sistema de Movilidad 1, Metrobús, AXA Seguros y Sin Tráfico convocaron a diseñadores, urbanistas, artistas y arquitectos entusiasmados por el quehacer de la ciudad; periodistas, politólogos, científicos sociales, expertos en movilidad y ciudadanía en general interesados en abordar datos por primera vez liberados para proponer ideas que contribuyan a evitar hechos de tránsito o mejorar el servicio de transporte público, utilizando datos abiertos. DAX-plotion participó en la modalidad de VISUALIZACIÓN Y ANÁLISIS DE DATOS, la cual consistó en traducir bases de datos en materia de seguridad vial y transformarlos en gráficos ilustrativos creativos y para todo público, acompañados de un texto que arrojará luz al hallazgo, con el fin de comunicar un mensaje que permita acciones puntuales para reducir hechos de tránsito. Gracias a la participación de todos los colaboradores de DAX-plotion ganamos, fue un proyecto divertido revisando los datos, construyendo visualizaciones y revisando tecnicas de mapeo, etc. Agradacemos a la CDMX, a los jueces y a la iniciativa Laboratorio para la Ciudad que lanzaron la convocatoria para buscar soluciones a la seguridad vial de nuestra ciudad. Fuentes: https://twitter.com/LabCDMX/status/1067236635308363777 https://hack.labcd.mx