Mapa de procesos para implementar proyectos de Machine Learning
De acuerdo con lo aprendido en el programa del MIT realicé este diagrama que nos muestra visualmente los pasos para realizar un proyecto de ML. Espero sea de ayuda para todos y lo podamos usar como una herramienta más que nos permita aplicar todo lo aprendido. También me gustaría saber si hay algún concepto que no he incluido en este Mapa de Procesos, lo cual sería un punto de mejora del diagrama y con mucho gusto les mandaría una actualización.
El diagrama anterior contiene al proceso, desde mi punto de vista, para la implementación de un proyecto de Machine Learning dentro del marco de las cuatro fases definidas en este programa de estudio.
Mediante el uso de Machine Learning tomamos decisiones basadas en las predicciones de patrones de comportamiento de cualquier evento de la vida real. En mi opinión la primera fase de ML, comprensión de los datos, es vital en el estudio que nos interesa y pienso que podemos también hacer una exploración del problema desde el punto de vista de los procesos de la entidad donde ocurre, sea una empresa, dominio u otro estudio.
Al crear un mapa detallado de cada uno de los elementos y conexiones del problema de interés y someter los datos a algoritmos para encontrar patrones comunes, variables dependientes, variables independientes y modelos predictivos, estamos aplicando la segunda fase de ML: predicción.
Luego de definir el modelo para predecir nuestra variable objetivo, obtendremos los datos derivados de los pronósticos. Estos datos los usaremos para la tercera fase de ML, correspondiente a la toma de decisiones y para esto tendremos en cuenta el tipo de escenario de acuerdo con el dinamismo del entorno y la cantidad de datos que tenemos. Una vez que tomemos decisiones para implementar en nuestro negocio o dominio de estudio, recopilaremos los datos resultantes para el análisis posterior.
Finalmente, en la cuarta fase de ML, inferencia causal, evaluamos si estos resultados fueron satisfactorios y cuáles fueron las causas que afectaron en mayor proporción el desempeño de nuestro modelo. En la medida que mejoramos el modelo de predicción, mejoramos toda la cadena de procesos del proyecto de aprendizaje automático que estamos implementando. Esta última fase nos permite entender cuál fue la causa del éxito o fracaso de las políticas implementadas a partir de los datos, algoritmos, modelos y métodos aprendidos en este programa.
Realmente el concepto que más me llama la atención es que nunca vamos a tener el modelo perfecto o estar completamente seguros de que la toma de decisiones va a ser 100% acertada, pero mientras más herramientas conozcamos y seamos mejores “artistas” de los datos, estaremos más cerca del éxito en la implementación de proyectos de Aprendizaje Automático.
Para esta pequeña disertación me pongo el sombrero de CEO & Founder en OpenSols (https://opensols.com/) y considero que ML nos brinda la tranquilidad que nuestras decisiones estarán basadas en hechos científicos con un enfoque cuantitativo y orientado a resultados. A nosotros en OpenSols nos permite darle una poderosa herramientas de gestión a nuestros directores y mandos medios, para poder combinar su experiencia e intuición con la analítica de datos. Por otra parte, hemos fortalecido nuestra principal oferta de servicios basada en Big Data, agregando la construcción de modelos de aprendizaje automático. Con esto entregamos a nuestros clientes un valor agregado que les permite tallar sus datos como un diamante en bruto que se transforma en información valiosa, toma de decisiones asertivas y una ventaja competitiva sostenible.
Fuentes:
https://www.hbs.edu/faculty/Supplemental%20Files/Metodos-de-Evaluacion-de-Impacto_50067.pdf
https://carlososorio.co/beneficios-y-usos-del-big-data/