Modelos SARIMA#

Los modelos SARIMA (Seasonal AutoRegressive Integrated Moving Average) son una extensión de los modelos ARIMA, que permiten capturar tanto la dependencia temporal como los patrones estacionales en una serie de tiempo.

A diferencia de los modelos ARIMA tradicionales, el modelo SARIMA incorpora componentes adicionales que representan la estacionalidad de la serie.

El modelo se denota como:

\[SARIMA(p, d, q)(P, D, Q)_s\]

Donde:

  • \(p\): orden del componente autorregresivo (AR).

  • \(d\): grado de diferenciación no estacional.

  • \(q\): orden del componente de media móvil (MA).

  • \(P\): orden del componente autorregresivo estacional.

  • \(D\): grado de diferenciación estacional.

  • \(Q\): orden del componente de media móvil estacional.

  • \(s\): periodo estacional (por ejemplo, 12 para datos mensuales, 4 para trimestrales, 7 para semanales).

Ecuaciones del modelo ARIMA

El modelo SARIMA combina los componentes autorregresivos (AR), integrados (I) y de media móvil (MA), además de los componentes estacionales.

  1. Componente autorregresivo (AR):

El valor actual depende linealmente de los valores pasados de la serie:

\[y_t = c + \phi_1 y_{t-1} + \phi_2 y_{t-2} + \cdots + \phi_p y_{t-p} + \varepsilon_t\]
  1. Componente de media móvil (MA):

El valor actual depende linealmente de los errores pasados:

\[y_t = \mu + \theta_1 \varepsilon_{t-1} + \theta_2 \varepsilon_{t-2} + \cdots + \theta_q \varepsilon_{t-q} + \varepsilon_t\]
  1. Componente integrado (I):

Representa el número de diferencias necesarias para hacer estacionaria la serie.
Si \(d = 1\), se utiliza la primera diferencia:
\[y'_t = y_t - y_{t-1}\]

Ecuación general del modelo SARIMA

El modelo se puede expresar como:

\[\Phi_P(L^s)\phi_p(L)(1-L)^d(1-L^s)^D y_t = \Theta_Q(L^s)\theta_q(L)\varepsilon_t\]

Donde:

  • \(L\) es el operador de rezago, tal que \(Ly_t = y_{t-1}\).

  • \(\phi_p(L)\) representa los parámetros autorregresivos no estacionales.

  • \(\Phi_P(L^s)\) representa los parámetros autorregresivos estacionales.

  • \(\theta_q(L)\) representa los parámetros de media móvil no estacionales.

  • \(\Theta_Q(L^s)\) representa los parámetros de media móvil estacionales.

  • \((1-L)^d\) indica la diferenciación ordinaria.

  • \((1-L^s)^D\) indica la diferenciación estacional.

Interpretación de cada componente

  1. Parte AR (AutoRegresiva):

    Modela la dependencia del valor actual con los valores pasados.
    Ejemplo: \(y_t = \phi_1 y_{t-1} + \phi_2 y_{t-2} + \varepsilon_t\)
  2. Parte I (Integrada):

    Se refiere al número de veces que la serie debe diferenciarse para volverse estacionaria.
    Si \(d=1\), se utiliza la primera diferencia:
    \[y'_t = y_t - y_{t-1}\]
  3. Parte MA (Media Móvil):

    Modela la dependencia del valor actual con los errores pasados.
    Ejemplo: \(y_t = \varepsilon_t + \theta_1 \varepsilon_{t-1}\)
  4. Parte estacional (P, D, Q, s):

    Captura patrones que se repiten cada \(s\) períodos.
    Por ejemplo, en datos mensuales (\(s=12\)), se modela la relación con los valores del mismo mes en años anteriores.

Extensión estacional del modelo (SARIMA)

El modelo SARIMA introduce términos autorregresivos y de medias móviles adicionales que capturan la dependencia estacional, es decir, patrones que se repiten cada \(s\) períodos.
La ecuación general puede expresarse mediante el operador de rezago \(L\) como:
\[\Phi_P(L^s)\phi_p(L)(1 - L)^d(1 - L^s)^D y_t = \Theta_Q(L^s)\theta_q(L)\varepsilon_t\]

Donde:

  • \(\phi_p(L)\) representa los parámetros AR no estacionales.

  • \(\Phi_P(L^s)\) representa los parámetros AR estacionales.

  • \(\theta_q(L)\) representa los parámetros MA no estacionales.

  • \(\Theta_Q(L^s)\) representa los parámetros MA estacionales.

  • \((1 - L)^d\) representa la diferenciación ordinaria.

  • \((1 - L^s)^D\) representa la diferenciación estacional.

Proceso general para ajustar un modelo SARIMA

  1. Analizar la serie de tiempo:

    Verificar tendencia y estacionalidad mediante gráficos y pruebas estadísticas (ADF, KPSS, etc.).

  2. Aplicar diferenciaciones necesarias:

    Hacer la serie estacionaria con diferencias ordinarias y/o estacionales.

  3. Identificar los órdenes p, q, P, Q:

    Usar los gráficos de ACF y PACF para estimar posibles órdenes.

  4. Ajustar el modelo SARIMA:

    Estimar los parámetros con máxima verosimilitud usando librerías como statsmodels.

  5. Diagnóstico de residuales:

    Evaluar si los residuales son ruido blanco mediante ACF/PACF y pruebas Ljung-Box, Jarque-Bera, etc.

  6. Pronóstico:

    Generar pronósticos dentro y fuera de la muestra y comparar con los valores reales.

Ventajas del modelo SARIMA

  • Integra en un solo marco tanto la tendencia como la estacionalidad.

  • Permite pronósticos robustos para series con patrones estacionales regulares.

  • Es flexible y se adapta a distintas frecuencias de tiempo.

Limitaciones

  • Requiere una estacionalidad constante (no cambiante en el tiempo).

  • Puede ser costoso computacionalmente para órdenes altos.

  • La interpretación de los parámetros no es directa.

  • No captura relaciones con variables externas (para ello se usa SARIMAX).

Extensión SARIMAX

El modelo SARIMAX (Seasonal ARIMA with eXogenous variables) añade variables explicativas externas (\(X_t\)):

\[y_t = SARIMA(p, d, q)(P, D, Q)_s + \beta X_t + \varepsilon_t\]

Esto permite incorporar factores externos como temperatura, demanda, o precios de energía que influyen en la serie.

Conclusión

El modelo SARIMA es una herramienta poderosa para el pronóstico de series con componentes estacionales.
Su correcta identificación, ajuste y validación de residuales permiten obtener predicciones confiables y útiles en contextos económicos, financieros y energéticos.

Identificación de los componentes estacionales (P, D, Q)#

En un modelo SARIMA(p,d,q)(P,D,Q)ₛ, los parámetros P, D y Q representan los efectos autorregresivos, de diferenciación y de medias móviles estacionales, respectivamente, con un período estacional \(s\).

Estos se identifican a partir del comportamiento de la ACF y la PACF, observando los rezagos múltiplos de \(s\).

1. Diferenciación estacional (D)

El parámetro \(D\) indica cuántas veces debe diferenciarse la serie con un rezago igual al período estacional \(s\), para eliminar patrones repetitivos.

La diferenciación estacional se calcula como:

\[(1 - L^s)^D y_t\]

Cómo identificar D:

  • Si la serie muestra un patrón estacional estable (por ejemplo, picos anuales o trimestrales regulares), probablemente \(D = 0\).

  • Si la serie muestra una tendencia estacional creciente o decreciente (es decir, los picos o valles aumentan o disminuyen con el tiempo), suele requerirse una diferenciación estacional, es decir, \(D = 1\).

  • Si después de aplicar una diferencia estacional la serie se vuelve estacionaria (ACF y PACF dentro de las bandas), el valor correcto es \(D = 1\).

Ejemplo:

Para datos mensuales \(s=12\):

\[y'_t = y_t - y_{t-12}\]

2. Componente autorregresivo (AR) estacional (P)

El parámetro \(P\) representa el número de rezagos estacionales autorregresivos, es decir, la dependencia de la serie con sus valores anteriores separados por \(s\) períodos.

Se identifica a partir de la PACF, observando los rezagos múltiplos de \(s\) (por ejemplo, 12, 24, 36 si \(s = 12\).

Regla práctica:

  • Si en la PACF se observa un pico significativo en el rezago s, seguido de caídas rápidas, indica un AR estacional de orden 1, es decir \(P = 1\).

  • Si hay dos o más rezagos estacionales significativos (por ejemplo, 12 y 24), puede sugerirse \(P = 2\).

3. Componente de medias móviles (MA) estacional (Q)

El parámetro \(Q\) representa el número de rezagos estacionales de medias móviles, es decir, la dependencia del error actual con errores estacionales anteriores.

Se identifica a partir de la ACF, observando los rezagos múltiplos de \(s\).

Regla práctica:

  • Si la ACF muestra un pico significativo en el rezago s, sugiere \(Q = 1\).

  • Si aparecen dos o más rezagos estacionales significativos (por ejemplo, 12 y 24), puede sugerirse \(Q = 2\).

Resumen de identificación visual

Tipo de componente

A partir de

Patrón típico

Parámetro

Tendencia no estacional

Serie original

Creciente o decreciente

d

Tendencia estacional

Serie original

Aume nto/disminución en picos estacionales

D

AR no estacional

PACF (rezagos cortos)

Corte brusco tras p rezagos

p

MA no estacional

ACF (rezagos cortos)

Corte brusco tras q rezagos

q

AR estacional

PACF (rezagos s, 2s, 3s)

Corte brusco en rezago s

P

MA estacional

ACF (rezagos s, 2s, 3s)

Corte brusco en rezago s

Q

Ejemplo práctico

Para una serie mensual \(s = 12\):

  • La ACF muestra un pico claro en el rezago 12 → sugiere \(Q = 1\).

  • La PACF muestra un pico claro en el rezago 12 → sugiere \(P = 1\).

  • La serie muestra tendencia estacional creciente → \(D = 1\).

Entonces el modelo propuesto sería:

\[SARIMA(p,d,q)(1,1,1)_{12}\]

Consejo final

  • Primero determina \(d\) y \(D\) (diferencias necesarias).

  • Luego analiza la ACF y la PACF de la serie diferenciada para identificar \(p, q, P, Q\).

  • Si los gráficos no son concluyentes, usa auto-arima o criterios AIC/BIC para ajustar y comparar modelos candidatos.

Análisis de los residuales en un modelo SARIMA#

Después de ajustar un modelo SARIMA(p,d,q)(P,D,Q)ₛ, es fundamental analizar los residuales.

Estos deben comportarse como ruido blanco, es decir:

  • Tener media cero,

  • Ser incorrelacionados,

  • Presentar varianza constante (homocedasticidad),

  • Seguir aproximadamente una distribución normal.

Qué ocurre si en la ACF o PACF de los residuales hay valores significativos

Si, luego del ajuste, se observa que la ACF o la PACF de los residuales tiene rezagos significativos, esto indica que el modelo no ha capturado toda la estructura temporal de la serie.

En otras palabras, los residuales aún conservan correlación temporal → el modelo está mal especificado o incompleto.

Interpretación práctica según el patrón detectado

  1. Rezagos significativos no estacionales (por ejemplo, 1, 2, 3…)

    • Indican que los componentes AR o MA no estacionales no fueron suficientes.
    • Posibles soluciones:

      • Aumentar el orden \(p\) (AR) si los picos aparecen en la PACF.

      • Aumentar el orden \(q\) (MA) si los picos aparecen en la ACF.

      • Reajustar el modelo probando combinaciones cercanas (por ejemplo, pasar de SARIMA(1,1,1) a SARIMA(2,1,1)).

  2. Rezagos significativos estacionales (por ejemplo, 12, 24…)

    • Indican que la componente estacional del modelo no está bien representada.

    • Posibles soluciones:

      • Aumentar el orden \(P\) (AR estacional) si el pico aparece en la PACF en múltiplos de \(s\).

      • Aumentar el orden \(Q\) (MA estacional) si el pico aparece en la ACF en múltiplos de \(s\).

      • Verificar si la diferenciación estacional (D) fue adecuada: en algunos casos se requiere \(D = 1\).

  3. Patrón de alternancia o ciclos persistentes en la ACF

    • Indica que persiste un componente periódico o cíclico no capturado.

    • Posibles acciones:

      • Probar otro valor de periodicidad estacional (s).

      • Incorporar variables exógenas (SARIMAX) si existe una causa externa (por ejemplo, clima, demanda).

Pasos recomendados tras detectar autocorrelación en los residuales

  1. Revisar la diferenciación aplicada:

    • Si la serie está sobre-diferenciada (ACF con picos negativos), reducir \(d\) o \(D\).

    • Si la serie sigue con tendencia o estacionalidad, aumentar \(d\) o \(D\).

  2. Reajustar el modelo con órdenes modificados:

    • Explorar combinaciones cercanas de \(p, q, P, Q\) alrededor del modelo actual.

    • Comparar los nuevos modelos usando criterios AIC, BIC y análisis de residuales.

  3. Verificar la estacionalidad:

    • Asegurarse de que el valor de \(s\) corresponde al patrón real (por ejemplo, 12 meses, 52 semanas, 7 días).

  4. Probar un modelo alternativo:

    • Si la estructura es compleja o hay correlaciones persistentes, se puede intentar con modelos SARIMAX, ETS o redes neuronales recurrentes (LSTM).

Conclusión

Cuando la ACF o PACF de los residuales muestra significancia:

  • El modelo no ha captado toda la dinámica temporal.

  • No se deben usar los pronósticos de ese modelo hasta corregirlo.

  • El siguiente paso es ajustar un modelo alternativo modificando los órdenes (p, q, P, Q) o la diferenciación (d, D),
    y volver a evaluar los residuales hasta que sean ruido blanco.

Regla práctica final

Situación observada en residuales

Posible causa

Acción recomendada

Picos en ACF (rezagos cortos)

MA insuficiente

Aumentar q

Picos en PACF (rezagos cortos)

AR insuficiente

Aumentar p

Picos en ACF (rezagos 12, 24…)

MA estacional insuficiente

Aumentar Q

Picos en PACF (rezagos 12, 24…)

AR estacional insuficiente

Aumentar P

Tendencia o patrón no eliminado

Falta de diferenciación

Aumentar d o D

Picos negativos alternos

Sobre-diferenciación

Reducir d o D

Cuándo usar D = 1 en lugar de D = 0 en un modelo SARIMA

El parámetro D representa el número de diferencias estacionales aplicadas a la serie, es decir, cuántas veces se resta la observación actual con la del mismo período anterior (por ejemplo, con el valor del mismo mes del año anterior si \(s = 12\)).

Matemáticamente, la diferenciación estacional se expresa como:

\[(1 - L^s)^D y_t\]

Donde: - \(L\) es el operador de rezago \(Ly_t = y_{t-1}\).

  • \(s\) es el período estacional (por ejemplo, 12 para datos mensuales o 4 para trimestrales).

1. Caso D = 0: No se requiere diferenciación estacional

Se utiliza \(D = 0\) cuando la serie ya es estacionalmente estacionaria, es decir, los patrones estacionales se repiten cada año con una magnitud y nivel aproximadamente constantes.

Indicadores visuales y estadísticos de que D = 0:

  • El gráfico de la serie muestra picos estacionales regulares y estables en el tiempo (no crecen ni decrecen).

  • La media y la varianza de cada estación (por ejemplo, cada mes del año) son aproximadamente constantes.

  • En la ACF, los picos en múltiplos de \(s\) (12, 24, 36, …) disminuyen rápidamente o se encuentran dentro de las bandas de confianza.

  • Las pruebas de estacionariedad (como ADF o KPSS aplicadas a la serie estacionalmente ajustada) no rechazan la hipótesis de estacionariedad.

Ejemplo:

Si la producción mensual de energía siempre sube en diciembre y baja en enero, pero esos aumentos son similares cada año, entonces \(D = 0\).

2. Caso D = 1: Se requiere una diferenciación estacional

Se utiliza \(D = 1\) cuando la serie presenta una tendencia en su patrón estacional, es decir, cuando las fluctuaciones estacionales cambian de nivel o intensidad a lo largo del tiempo.

La diferencia estacional elimina esos cambios sistemáticos de nivel entre ciclos.

Fórmula:

\[y'_t = y_t - y_{t-s}\]

Indicadores visuales de que se necesita D = 1:

  • Los picos o valles estacionales aumentan o disminuyen progresivamente con el tiempo (la estacionalidad no es constante).

  • La serie muestra una tendencia de largo plazo superpuesta a la estacionalidad.

  • La ACF presenta picos muy fuertes y persistentes exactamente en los múltiplos de \(s\) (por ejemplo, en 12, 24, 36…) que no desaparecen rápidamente.

  • La PACF también puede mostrar picos fuertes en múltiplos de \(s\), lo cual indica autocorrelación estacional no eliminada.

  • Después de aplicar una diferencia estacional, la ACF de la nueva serie se vuelve mucho más plana y los picos en múltiplos de \(s\) desaparecen.

Ejemplo:

Si la demanda eléctrica mensual crece cada año, y los picos de diciembre son cada vez más altos (por crecimiento de la población o de la economía), la estacionalidad no es estable → se necesita \(D = 1\).

3. Cuándo no usar D = 1 (riesgo de sobre-diferenciación)

Usar una diferencia estacional cuando no es necesaria puede generar:

  • Una serie excesivamente ruidosa, con picos negativos alternantes en la ACF.

  • Pérdida de estructura temporal (la serie se vuelve más difícil de modelar).

  • Estimaciones inestables y errores de predicción más altos.

Signos de sobre-diferenciación (D demasiado alto):

  • La ACF muestra valores negativos significativos en los primeros rezagos estacionales.

  • La serie diferenciada oscila erráticamente alrededor de cero sin estructura.

  • La varianza aumenta en lugar de estabilizarse.

4. Recomendación práctica

  1. Analiza primero la serie original:

    • Si tiene estacionalidad visible y creciente → prueba \(D = 1\).

    • Si tiene estacionalidad estable → usa \(D = 0\).

  2. Verifica luego la ACF y PACF:

    • Si hay picos persistentes en los múltiplos de \(s\), prueba una diferencia estacional.

    • Si tras aplicar la diferencia estacional los picos desaparecen → \(D = 1\) es adecuado.

  3. Evalúa los residuales del modelo:

    • Si con \(D = 0\) aún hay autocorrelación estacional en la ACF de los residuales, cambia a \(D = 1\).

    • Si con \(D = 1\) los residuales parecen ruido blanco, el ajuste es correcto.

Ejemplo visual:

Supongamos una serie mensual \(s = 12\) con picos cada diciembre:

  • En los primeros años, los picos son de 100 unidades.

  • Luego aumentan a 150, 200, 250… → La estacionalidad está creciendo con el tiempo.

En este caso, aplicar una diferencia estacional elimina esa tendencia creciente:

\[y'_t = y_t - y_{t-12}\]

Después de esta transformación, la serie se estabiliza y los picos en los múltiplos de 12 desaparecen de la ACF → confirmando que \(D = 1\) era necesario.

Resumen práctico

Situación de la serie

Patrón en ACF

Recomendación

Estacionalidad estable, picos regulares

Picos pequeños que decaen rápidamente

D = 0

Picos estacionales aumentan/disminuyen con el tiempo

Picos grandes y persistentes en múltiplos de s

D = 1

Serie sin estacionalidad visible

ACF sin picos regulares

D = 0

ACF muestra picos negativos alternos tras diferenciar

Serie sobrediferenciada

Reducir D

Conclusión

El parámetro \(D\) controla si eliminamos o no la tendencia en la estacionalidad.

  • \(D = 0\) cuando la estacionalidad es estable.

  • \(D = 1\) cuando la estacionalidad es inestable o creciente.

El mejor criterio es verificar la ACF estacional antes y después de aplicar la diferencia: si los picos desaparecen, el valor de \(D\) elegido es el correcto.

Importancia relativa de las diferenciaciones d y D en un modelo SARIMA

En un modelo SARIMA(p,d,q)(P,D,Q)ₛ existen dos tipos de diferenciación:

  1. d → diferenciación no estacional (de corto plazo).

  2. D → diferenciación estacional (de largo plazo, con período s).

Ambas se aplican para lograr que la serie sea estacionaria, pero cada una elimina un tipo distinto de tendencia.

1. Diferenciación no estacional (d)

Representa el número de veces que se resta la serie con su valor inmediato anterior:

\[(1 - L)^d y_t\]

Propósito:

  • Eliminar tendencias lineales o determinísticas en la serie.

  • Corregir la no estacionariedad de nivel o tendencia global.

Ejemplo:

Si el precio de la energía sube mes a mes con una tendencia ascendente, pero sin estacionalidad fuerte, aplicar una diferencia no estacional (d = 1) elimina esa tendencia.

Indicadores de que se necesita d = 1:

  • La serie muestra un crecimiento o descenso sostenido.

  • La ACF decae lentamente y no corta a cero (signo de no estacionariedad).

  • Después de diferenciar una vez, la serie oscila alrededor de una media estable.

2. Diferenciación estacional (D)

Representa el número de diferencias aplicadas con un rezago igual al período estacional \(s\):

\[(1 - L^s)^D y_t\]

Propósito:

  • Eliminar tendencias o patrones repetitivos de largo plazo, típicos de la estacionalidad.

  • Corregir la no estacionariedad estacional (por ejemplo, variaciones anuales, trimestrales o semanales crecientes).

Ejemplo:

Si los picos anuales de demanda o producción son cada vez mayores con el paso de los años, aplicar una diferencia estacional (D = 1) estabiliza esas fluctuaciones.

Indicadores de que se necesita D = 1:

  • La serie muestra patrones estacionales que cambian de nivel (picos o valles crecientes).

  • En la ACF, hay picos grandes y persistentes en los múltiplos de \(s\) (por ejemplo, 12, 24, 36…).

  • Después de aplicar una diferencia estacional, los picos en los múltiplos de \(s\) desaparecen.

3. ¿Cuál diferenciación es más importante?

No se trata de que una sea “más importante” en general, sino de cuál es más determinante según la estructura de la serie:

Tipo de no estacionariedad

Diferenciación clave

Razón

Tendencia lineal o exponencial (nivel creciente o decreciente)

d

Co ntrola la ten dencia g eneral de la serie.

Tendencia o patrón estacional cambiante (picos cada año más altos o más bajos)

D

Co ntrola la es tacion alidad cre ciente o ines table.

Serie con ambas tendencias (global + estacional)

Ambas (d y D)

Re quiere el iminar ambas formas de no esta cionar iedad.

En la práctica:

  • Si la serie tiene una tendencia fuerte pero estacionalidad estable → la clave es \(d\).

  • Si la serie tiene una estacionalidad cambiante pero sin tendencia general fuerte → la clave es ( D ).

  • Si tiene ambas, primero se elimina la estacionalidad \(D = 1\) y luego la tendencia \(( d = 1 )\).

4. Orden recomendado de aplicación

  1. Primero probar la diferencia estacional \((1 - L^s)\):

    Esto suele estabilizar la estacionalidad sin afectar el nivel general.

  2. Luego, si la serie aún muestra tendencia, aplicar la diferencia no estacional \((1 - L)\).

    Esto estabiliza el nivel.

Razón: La estacionalidad tiende a ser más fuerte y visible, por lo que se corrige primero.
Si se hace al revés, la serie puede sobrediferenciarse.

5. Signos de sobrediferenciación

  • Si al aplicar d o D la ACF muestra valores negativos alternos.

  • Si la serie diferenciada pierde estructura y se vuelve puramente ruido.

  • Si el modelo ajustado muestra varianza creciente o parámetros inestables.

En ese caso, se debe reducir el orden de diferenciación (usar d = 0 o D = 0).

Resumen comparativo

A specto

Diferenciación no estacional (d)

Diferenciación estacional (D)

Ob jetivo

Eliminar tendencia general o de nivel

Eliminar tendencia o patrón estacional repetitivo

Op erador

\((1 - L)^d\)

\((1 - L^s)^D\)

Det ectada con

ACF y PACF en rezagos cortos

ACF y PACF en múltiplos de s

I mpacto

Corrige crecimiento o descenso sostenido

Corrige estacionalidad cambiante

Efecto visual

Serie pasa de creciente a oscilante

Picos estacionales desaparecen

Riesgo si se usa en exceso

Oscilación artificial o ruido blanco

Pérdida de estructura estacional real