Borradores de Economía - Pronosticando inflaciones de canastas de alimentos desagregadas en Colombia usando un modelo XGBoost

Tenga en cuenta

La serie Borradores de Economía, de la Subgerencia de Estudios Económicos del Banco de la República, contribuye a la difusión y promoción de la investigación realizada por los empleados de la institución. Esta serie se encuentra indexada en Research Papers in Economics (RePEc).

En múltiples ocasiones estos trabajos han sido el resultado de la colaboración con personas de otras instituciones nacionales o internacionales. Los trabajos son de carácter provisional, las opiniones y posibles errores son responsabilidad exclusiva del autor y sus contenidos no comprometen al Banco de la República ni a su Junta Directiva.

Los modelos tipo XGBoost son más precisos pronosticando la inflación de alimentos que los modelos lineales para la mayoría de las 33 canastas estudiadas, especialmente para horizontes de pronóstico más lejanos. 

Fecha de publicación
Jueves, 11 diciembre 2025

Enfoque

Este artículo tiene como objetivo desarrollar modelos estadísticos para pronosticar la inflación mensual de los próximos 12 meses para 33 canastas que conforman el Índice de Precios al Consumidor (IPC) de alimentos. Para ello, se emplean tanto modelos tradicionales de series de tiempo como enfoques basados en Machine Learning. Cada canasta se modela de manera independiente, incorporando 4 grupos de variables explicativas relevantes para la oferta de alimentos: variables climáticas, la tasa de cambio nominal, precios de materias primas, y costos de transporte y energía. Los precios de las materias primas y la energía influyen en la inflación de alimentos al afectar los costos de producción, transporte y procesamiento. Además, el clima impacta la producción agrícola al alterar el crecimiento de cultivos, la calidad del suelo y la salud del ganado. Por otro lado, el documento busca interpretar los pronósticos mediante el uso de valores SHAP (SHapley Additive exPlanations), una herramienta ampliamente utilizada para explicar las predicciones de modelos de machine learning.

Contribución

Esta investigación contribuye a la literatura de pronósticos de inflación de alimentos al probar que los modelos basados en arboles de decisión tipo XGBoost realizan pronósticos más acertados que modelos de series de tiempo lineales. Por otro lado, mostramos que es posible descomponer las predicciones de este modelo en contribuciones de variables explicativas fundamentales. Las dinámicas de cada canasta de alimentos responden a variables como el clima, precios de materias primas, costos de transporte y el comportamiento de la tasa de cambio.  

La interpretación de las predicciones de estos modelos es lograda gracias a un proceso exhaustivo de selección de las variables explicativas y a un algoritmo que proponemos para seleccionar los rezagos óptimos de las variables explicativas. Este algoritmo permite reducir el número de variables, lo que simplifica la interpretación y reduce costos computacionales.  

Resultados

Los modelos tipo XGBoost son más precisos pronosticando la inflación de alimentos que los modelos lineales para la mayoría de las 33 canastas estudiadas, especialmente para horizontes de pronóstico más lejanos. Los errores de pronóstico del modelo XGBoost fueron entre un 5% y un 60% menores que los de los modelos lineales, dependiendo de la canasta y del horizonte de pronóstico, y para la canasta agregada de inflación los errores fueron en promedio 25% menores.

Existe un alto grado de heterogeneidad en cuanto a la explicación de los pronósticos dependiendo de la canasta a estudiar. Para ciertos grupos de alimentos, como los alimentos perecederos, el clima y la persistencia de la inflación son factores relevantes. En contraste, otros alimentos, como los industriales, son principalmente explicados por costos de materias primas y persistencia de la inflación.