Oops! It appears that you have disabled your Javascript. In order for you to see this page as it is meant to appear, we ask that you please re-enable your Javascript!
slider-bigdata

Caja de herramientas

Analítica y Minería de datos

riesgo-cumplimiento-sinnetic-mobile

Caja de herramientas

Analítica y Minería de datos

Aprendizaje no supervisado

Los datos tienen mucho que decir si los dejamos hablar. El aprendizaje no supervisado constituye un conjunto de técnicas orientadas a encontrar patrones ocultos en la información. Los datos se agrupan y asocian naturalmente; encontrar estas asociaciones, correlaciones y agrupaciones para lograr optimizaciones es nuestro principal objetivo.

Algoritmos de asociación

En datos transaccionales, nos interesa analizar:

◆ ¿Cómo se configuran canastas de compra?
◆ ¿Cuál es la secuencia de adopción de productos? ejemplo producto 1: tarjeta crédito, producto 2: Cuenta de ahorro.
◆ ¿Cuáles son las secuencias de pasos que sigue un usuario en una página web?

Encontrar reglas que describan la asociación de decisiones del consumidor, las canastas de compra, las rutinas de navegación, los patrones de venta cruzada y venta escalonada, son algunas de las aplicaciones de los algoritmos de asociación.

Clúster analysis

Nos interesa encontrar grupos (Clientes, puntos de venta, sitios web).

Los elementos clasificados al interior de estos grupos son muy similares entre sí, pero al comparar entre grupos, estos se deben mostrar muy diferentes.

Las técnicas de clustering generalmente se usan para encontrar segmentos, agrupaciones naturales, perfiles etc.

Segmentación de clientes, riesgos, contratos etc., son algunas aplicaciones.

Reducción de dimensiones

Cuando contamos con muchas variables, es común encontrar que estas tiendan a estar correlacionadas.

Nos interesa construir nuevas variables o vectores que agrupen las variables correlacionadas y hagan más precisas y estables las predicciones a futuro.

Técnicas como el análisis de componentes principales, el análisis factorial y el escalamiento multidimensional, son algunos de los ejemplos.

Mapas auto-organizados

Esta familia de herramientas provienen de las redes neuronales artificiales.

Busca encontrar segmentos y posteriormente perfiles encontrando patrones ocultos en la información.

Se basa en encontrar vecinos cercanos en el espacio o en el tiempo por lo que es una técnica eficiente cuando las unidades de análisis tienden a variar temporal o topológicamente.

Aprendizaje supervisado

Algunas veces, tenemos que predecir un fenómeno, ejemplo: pérdida de clientes, volumen de consumo, fraude etc. Esto implica que tenemos algunos casos que tienen el fenómeno y otros que no. Para encontrar las características que diferencian los grupos y construir predicciones eficientes, aparecen las técnicas de aprendizaje supervisado.

La variable que queremos predecir, “supervisa” u organiza el aprendizaje del modelo.

Aquí nuestro objetivo es predecir: usar variables auxiliares para estimar una variable diferente a la que llamaremos objetivo.

Groso modo, hay tres grandes familias de modelos supervisados:

Métodos de regresión

Estos modelos construyen ecuaciones en donde las variables X (explicativas) adquieren peso para poder estimar la variable Y (factor que queremos predecir).

Algunos modelos en esta familia de técnicas son:

◆ Regresión Lineal: Para predecir variables cuantitativas.
◆ Regresión Logística: Para predecir variables cualitativas binarias o multinomiales.
◆ Regresión de Poisson: Para predecir variables que se expresan como porcentajes o conteos.
◆ Regresión de Cox: Para predecir duraciones.

Métodos de árbol

Los árboles de decisión, construyen particiones en los datos según el impacto de variables X (Explicativas) sobre la variable Y.

Crea reglas de clasificación no ecuaciones.

Algunos algoritmos son CHAID, CRT, Entropías.

Algunas técnicas avanzadas de machine learning se basan en esta familia de técnicas, ejemplo: Random Forest, Gradient boosting.

Métodos de redes neuronales

La red neuronal intenta aprender sobre Y a partir de las X disponibles de la misma forma como el cerebro intenta establecer conexiones neuronales para generar reconocimiento y memoria.

Se crean ecuaciones y reglas simultáneamente para lograr la predicción.

El perceptrón multicapa y la función de base radial son dos de los algoritmos más usados para entrenar modelos de esta naturaleza.

Forecasting

Mucha información en el contexto de negocios e inclusive en el contexto digital, tiende a coleccionarse sobre el tiempo, por ejemplo las ventas, los inventarios, los factores de riesgo, los casos de fraude etc.

Las series de tiempo, tiene generalmente tres características como mínimo: Tendencia, estacionalidad y ciclos. Lo que busca el forecasting es generar el mejor escenario de futuro teniendo en cuenta el comportamiento de la misma variable sobre el tiempo.

Aquí nuestro objetivo es PRONOSTICAR: usar el comportamiento de una variable en el pasado para estimar su comportamiento futuro.

Métodos de suavizado

Son metodologías eficientes para modelar el comportamiento histórico de una variable pero no tan óptimos para hacer una representación futura de la misma.

Estos métodos tienden a ser eficientes cuando hay pocos datos.

Promedios móviles, suavizamiento exponencial, Línea holt, método Winter.

Método Box Jenkins

También conocido como A.R.I.M.A., es toda una metodología para descomponer la serie según tres elementos:

a. AR: Componente auto-regresivo.
b. I: Componente integrado – diferenciación o estacionalidad.
c. MA: Componente de promedio móvil.

Si los tres componentes predicen la serie, se configura un ARIMA, cuando solo el componente AR y MA son significativos, se constituye un A.R.M.A., etc.

Métodos de redes neuronales

Las redes neuronales han mostrado excelentes niveles de precisión para predecir series de tiempo.

Particularmente los modelos de función de base radial se posicionan como una nueva estrategia para mejorar el “forecast Acuracy” de los modelos de pronóstico.

Funciones de transferencia y co-integración

Hay oportunidades en las que tenemos diferentes variables desplegadas a lo largo del tiempo y en las mismas fechas.

En estos casos, queremos construir modelos integradores llamados funciones de transferencia.

Nos interesa ver cómo una serie de tiempo predice o estima otra.

Optimización

El objetivo máximo de la matemática aplicada bien podría ser la optimización.

Aquí nos interesa minimizar, maximizar o igualar un proceso, lo que implica distribuir recursos limitados dentro de necesidades ilimitadas.

Distribuir presupuesto de marketing dentro de diferentes canales de comunicación o distribuir inventarios entre puntos de venta para reducir los días de inventario son ejemplos de problemas de optimización aplicados.

Optimización matemática

La relación entre los procesos y los resultados tienden a asumir un comportamiento que describe estas relaciones.

Optimización lineal, no lineal, cuadrática etc.

Simulación de eventos discretos

Los resultados cualitativos, también son resultados, y necesitamos predecirlos, estimarlos y tenerlos en cuenta para optimizarlos.

Optimización de recursos y procesos

Durante procesos productivos, en la gerencia de proyectos o en escenarios similares, el tiempo y el dinero deben ser distribuidos de forma estratégica.

La distribución de recursos para lograr el mejor resultado con menos, constituyen los problemas de optimización más frecuentes.

Diseño y optimización de rutas

Llevar cosas – personas de un punto a otro, en el menor tiempo posible, con la mayor ocupación viable y al menor costo, es un reto.

La investigación de operaciones tiene una respuesta eficiente a este tipo de preguntas.

Aprendizaje no supervisado

Los datos tienen mucho que decir si los dejamos hablar. El aprendizaje no supervisado constituye un conjunto de técnicas orientadas a encontrar patrones ocultos en la información. Los datos se agrupan y asocian naturalmente; encontrar estas asociaciones, correlaciones y agrupaciones para lograr optimizaciones es nuestro principal objetivo.

Algoritmos de asociación

En datos transaccionales, nos interesa analizar:

◆ ¿Cómo se configuran canastas de compra?
◆ ¿Cuál es la secuencia de adopción de productos? ejemplo producto 1: tarjeta crédito, producto 2: Cuenta de ahorro.
◆ ¿Cuáles son las secuencias de pasos que sigue un usuario en una página web?

Encontrar reglas que describan la asociación de decisiones del consumidor, las canastas de compra, las rutinas de navegación, los patrones de venta cruzada y venta escalonada, son algunas de las aplicaciones de los algoritmos de asociación.

Clúster analysis

Nos interesa encontrar grupos (Clientes, puntos de venta, sitios web).

Los elementos clasificados al interior de estos grupos son muy similares entre sí, pero al comparar entre grupos, estos se deben mostrar muy diferentes.

Las técnicas de clustering generalmente se usan para encontrar segmentos, agrupaciones naturales, perfiles etc.

Segmentación de clientes, riesgos, contratos etc., son algunas aplicaciones.

Reducción de dimensiones

Cuando contamos con muchas variables, es común encontrar que estas tiendan a estar correlacionadas.

Nos interesa construir nuevas variables o vectores que agrupen las variables correlacionadas y hagan más precisas y estables las predicciones a futuro.

Técnicas como el análisis de componentes principales, el análisis factorial y el escalamiento multidimensional, son algunos de los ejemplos.

Mapas auto-organizados

Esta familia de herramientas provienen de las redes neuronales artificiales.

Busca encontrar segmentos y posteriormente perfiles encontrando patrones ocultos en la información.

Se basa en encontrar vecinos cercanos en el espacio o en el tiempo por lo que es una técnica eficiente cuando las unidades de análisis tienden a variar temporal o topológicamente.

Aprendizaje supervisado

Algunas veces, tenemos que predecir un fenómeno, ejemplo: pérdida de clientes, volumen de consumo, fraude etc. Esto implica que tenemos algunos casos que tienen el fenómeno y otros que no. Para encontrar las características que diferencian los grupos y construir predicciones eficientes, aparecen las técnicas de aprendizaje supervisado.

La variable que queremos predecir, “supervisa” u organiza el aprendizaje del modelo.

Aquí nuestro objetivo es predecir: usar variables auxiliares para estimar una variable diferente a la que llamaremos objetivo.

Groso modo, hay tres grandes familias de modelos supervisados:

Métodos de regresión

Estos modelos construyen ecuaciones en donde las variables X (explicativas) adquieren peso para poder estimar la variable Y (factor que queremos predecir).

Algunos modelos en esta familia de técnicas son:

◆ Regresión Lineal: Para predecir variables cuantitativas.
◆ Regresión Logística: Para predecir variables cualitativas binarias o multinomiales.
◆ Regresión de Poisson: Para predecir variables que se expresan como porcentajes o conteos.
◆ Regresión de Cox: Para predecir duraciones.

Métodos de árbol

Los árboles de decisión, construyen particiones en los datos según el impacto de variables X (Explicativas) sobre la variable Y.

Crea reglas de clasificación no ecuaciones.

Algunos algoritmos son CHAID, CRT, Entropías.

Algunas técnicas avanzadas de machine learning se basan en esta familia de técnicas, ejemplo: Random Forest, Gradient boosting.

Métodos de redes neuronales

La red neuronal intenta aprender sobre Y a partir de las X disponibles de la misma forma como el cerebro intenta establecer conexiones neuronales para generar reconocimiento y memoria.

Se crean ecuaciones y reglas simultáneamente para lograr la predicción.

El perceptrón multicapa y la función de base radial son dos de los algoritmos más usados para entrenar modelos de esta naturaleza.

Forecasting

Mucha información en el contexto de negocios e inclusive en el contexto digital, tiende a coleccionarse sobre el tiempo, por ejemplo las ventas, los inventarios, los factores de riesgo, los casos de fraude etc.

Las series de tiempo, tiene generalmente tres características como mínimo: Tendencia, estacionalidad y ciclos. Lo que busca el forecasting es generar el mejor escenario de futuro teniendo en cuenta el comportamiento de la misma variable sobre el tiempo.

Aquí nuestro objetivo es PRONOSTICAR: usar el comportamiento de una variable en el pasado para estimar su comportamiento futuro.

Métodos de suavizado

Son metodologías eficientes para modelar el comportamiento histórico de una variable pero no tan óptimos para hacer una representación futura de la misma.

Estos métodos tienden a ser eficientes cuando hay pocos datos.

Promedios móviles, suavizamiento exponencial, Línea holt, método Winter.

Método Box Jenkins

También conocido como A.R.I.M.A., es toda una metodología para descomponer la serie según tres elementos:

a. AR: Componente auto-regresivo.
b. I: Componente integrado – diferenciación o estacionalidad.
c. MA: Componente de promedio móvil.

Si los tres componentes predicen la serie, se configura un ARIMA, cuando solo el componente AR y MA son significativos, se constituye un A.R.M.A., etc.

Métodos de redes neuronales

Las redes neuronales han mostrado excelentes niveles de precisión para predecir series de tiempo.

Particularmente los modelos de función de base radial se posicionan como una nueva estrategia para mejorar el “forecast Acuracy” de los modelos de pronóstico.

Funciones de transferencia y co-integración

Hay oportunidades en las que tenemos diferentes variables desplegadas a lo largo del tiempo y en las mismas fechas.

En estos casos, queremos construir modelos integradores llamados funciones de transferencia.

Nos interesa ver cómo una serie de tiempo predice o estima otra.

Optimización

El objetivo máximo de la matemática aplicada bien podría ser la optimización.

Aquí nos interesa minimizar, maximizar o igualar un proceso, lo que implica distribuir recursos limitados dentro de necesidades ilimitadas.

Distribuir presupuesto de marketing dentro de diferentes canales de comunicación o distribuir inventarios entre puntos de venta para reducir los días de inventario son ejemplos de problemas de optimización aplicados.

Optimización matemática

La relación entre los procesos y los resultados tienden a asumir un comportamiento que describe estas relaciones.

Optimización lineal, no lineal, cuadrática etc.

Simulación de eventos discretos

Los resultados cualitativos, también son resultados, y necesitamos predecirlos, estimarlos y tenerlos en cuenta para optimizarlos.

Optimización de recursos y procesos

Durante procesos productivos, en la gerencia de proyectos o en escenarios similares, el tiempo y el dinero deben ser distribuidos de forma estratégica.

La distribución de recursos para lograr el mejor resultado con menos, constituyen los problemas de optimización más frecuentes.

Diseño y optimización de rutas

Llevar cosas – personas de un punto a otro, en el menor tiempo posible, con la mayor ocupación viable y al menor costo, es un reto.

La investigación de operaciones tiene una respuesta eficiente a este tipo de preguntas.

¿Cómo podemos ayudarte?