Neutralizar la estacionalidad en un análisis de cohortes


Aviso: si no estás familiarizado con el análisis de cohortes te recomiendo leer primero mi post de introducción al «Modelo de estudio de cohortes» (2013).

Como comentaba Pablo Ventura (FJME) en este twit hace unos días, la recurrencia estimada que puedes calcular con un análisis de cohortes puede variar mucho según la temporada en qué la mides. Con los mismos datos es fácil llegar a variaciones de +-20% según la temporada, o incluso más para negocios muy estacionales.

Luego Pablo me preguntó si tenía alguna solución así que me anime a postear algo ;)

Para negocios estacionales, es recomendable neutralizar la temporada para obtener una recurrencia que no dependa del mes en el que la mides. ¿cómo se hace? Lo que yo suelo hacer es trabajar con una media móvil de 12 meses en lugar de trabajar sobre todos los datos disponibles de los X últimos meses. De esta manera, cada mes del año tiene exactamente el mismo peso que los demás (1/12) dentro del estudio.

Ilustración: he cogido unos datos de cohortes de un ecommerce cualquier, y he tocado los datos para meterle una fuerte temporada en julio y agosto.

Recurrencia estimada con media móvil 12 meses
(= neutralizando la estacionalidad):
2,20 compras (en 24 meses)

Cohortes neutralizar estacionalidad

Recurrencia estimada sin neutralizar a estacionalidad:
2,71 compras (en 24 meses)

Cohortes SIN neutralizar estacionalidad

-> No neutralizar la estacionalidad te llevaría a exagerar la recurrencia en un 23% en este ejemplo

¿quieres juguetear con los datos?
descargar fichero Excel de este ejemplo.

Etiquetas: , , , ,

5 respuestas to “Neutralizar la estacionalidad en un análisis de cohortes”

  1. Alfonso Villar Says:

    Muy interesante y acertado. Revisándolo en detalle creo que este método también es útil aunque el negocio no sea estacional pero que la inversión (o meses fuertes) se realicen en periodos determinados o meses determinados. Si no estoy equivocado, creo que lo importante es que todos los promedios que se seleccionen en cada cohorte tengan la misma cantidad de «meses fuertes» para igualar el peso en todos ellos.

    Me gusta

    • François Derbaix Says:

      Hola Alfonso, creo que dependerá del negocio y sobre todo de la calidad de los clientes captados en estos meses de inversión más alta. Si al invertir más se captan clientes de peor calidad, acabará teniendo un impacto negativo sobre la recurrencia. Este impacto se podrá ver en los cohortes correspondientes a estos meses, o haciendo un análisis de cohortes por canal de captación.

      Me gusta

  2. Pablo (@pablomj_) Says:

    Hola François,

    Gracias por compartir este conocimiento. Me ha encantado el artículo al igual que su predecesor. Son realmente útiles y aportan valor.

    Te escribo para hacerte una pregunta y hacer una sugerencia.

    PREGUNTA:
    Entiendo que en el ejemplo con estacionalidad neutralizada, incluyes en la gráfica únicamente aquellos meses (columnas) que incluyen 12 meses o cohortes (filas). Así, no incluyes las que no tienen todavía 12 cohortes para que esos meses de temporada alta no introduzcan variaciones indeseadas. Hasta ahí bien. Mi pregunta, es:

    Si aplicando el Análisis de Cohortes, por ejemplo al número de usuarios activos, podríamos tener el caso en que lanzamos la primera versión el día 0, y lanzamos una versión v2, a los 3 meses. ¿Crees que sería adecuado tener en cuenta los últimos 3 meses e ignorar el resto o qué sería correcto? A priori lo que yo haría sería empezar un segundo Análisis de Cohortes y hacer la comparación posterior pero me gustaría conocer tu opinión. La otra opción que he contemplado es usar un único Análisis de Cohortes, por aquello de la simplicidad, y hacer una marca en el Cohorte en el cual se introduce la nueva versión de la web.

    SUGERENCIA:
    Cuando he estado estudiando los artículos, he tenido un problema. No comprendía de dónde salía la fórmula de las gráficas ni por qué. Tras dedicar unos minutos a averiguarlo, creo que sería bueno incluir en el artículo cómo extraerla ya que es la fórmula que permitirá hacer una correcta extrapolación.

    Por si alguien tiene la misma duda, indico como extraerla:
    1. Tras tener la gráfica: botón derecho sobre la linea / Agregar linea de tendencia. 2. Con el diálogo desplegado, seleccionar el tipo de linea Logarítmica y en opciones de la linea de tendencia, marcar los checkbox «Presentar ecuación en el gráfico» y «Presentar el valor R cuadrado en el gráfico».

    Un saludo y muchas gracias.

    Me gusta

  3. Pablo Says:

    Hola François,

    Gracias por compartir este conocimiento. Me ha encantado el artículo al igual que su predecesor. Ambos son realmente útiles y aportan valor.

    Tras estudiarlos, solo quería comentar que no sabía de dónde salían las fórmulas de las gráficas. Por si alguien tiene la misma duda, y quiere obtener la fórmula para hacer una correcta extrapolación, aquí tiene cómo sacarla:

    1. Tras tener la gráfica: botón derecho sobre la linea / Agregar linea de tendencia.
    2. Con el diálogo desplegado, seleccionar el tipo de linea Logarítmica.
    3. En opciones de la linea de tendencia, marcar los checkbox «Presentar ecuación en el gráfico» y «Presentar el valor R cuadrado en el gráfico».

    Saludos.

    Me gusta

Deja una respuesta

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Salir /  Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Salir /  Cambiar )

Conectando a %s

Este sitio usa Akismet para reducir el spam. Aprende cómo se procesan los datos de tus comentarios.


A %d blogueros les gusta esto: