Una de las macroseries de conocimiento cuantitativo: un modelo de predicción de PPI basado en el aprendizaje automático

Principales puntos de vista:

El precio y la inflación son partes importantes del análisis macroscópico. Este trabajo analiza los defectos y dificultades de los métodos comunes de predicción de PPI, y trata de deconstruir PPI y modelar la predicción basada en el aprendizaje automático.

¿Cuáles son los métodos tradicionales de predicción del PPI y cuáles son los puntos dolorosos?

Hay tres tipos principales de predicción de PPI: método de predicción de índice líder, método de reducción de frecuencia de índice de alta frecuencia y método de síntesis de precios de productos industriales.

El método de predicción del índice principal, a través de la minería de los principales indicadores que se ajustan a la Ley de funcionamiento económico, determina el mejor período de avance y luego lleva a cabo la predicción de regresión, por ejemplo, el índice de materias primas industriales CRB está por delante del PPI durante 2 - 3 meses, Debido a la inestabilidad de la correlación y el período de liderazgo, la precisión a menudo es baja.

Hacer el proceso de reducción de frecuencia al índice de alta frecuencia, conciso y eficaz, la correlación entre el índice de precios de los medios de producción y el PPI al contado es de hasta 0,98. Debido a que la relación entre la variable independiente y la variable dependiente no está clara, no se puede ajustar el parámetro y optimizar el modelo.

La relación lógica es clara, la credibilidad y la capacidad de ajuste son fuertes, y el efecto de ajuste es el mejor entre los tres tipos de predicción. Hay dos dificultades en la investigación anterior: 1) Hay muchos tipos de precios de los medios de producción, el problema de la colinealidad del modelo tradicional de Ols lineal es grave, la varianza del modelo es grande, y es fácil de sobreajustar, por lo que es necesario seleccionar las variables adecuadas para determinar los principales factores impulsores del PPI; La Oficina de Estadística divulga menos información sobre el peso de las subpartidas del PPI, por lo que es especialmente importante comprender el peso y la forma de ajustar el peso en el proceso estadístico.

¿Cómo entender el peso del PPI y el ajuste del peso?

El peso de la subsección de la industria PPI es la proporción de la producción de ventas de la industria, que se sustituye por la proporción de ingresos de la industria. La Oficina de Estadística calculó el PPI actual sobre la base de las ponderaciones de la industria correspondientes al mismo período del año pasado.

Según la Oficina de Estadística, "la ponderación de cada bien y servicio en el IPC se basa en la proporción del gasto de consumo de ese tipo de bienes y servicios en el gasto total de la cesta". En 2019, la peste porcina africana se extendió rápidamente, las cerdas reproductoras y las existencias de cerdos en todo el país cayeron, los precios de la carne de cerdo en noviembre de 19 y febrero de 20 años alcanzaron dos altos, y el peso de la carne de cerdo en noviembre de 20 años ascendió a un máximo del 4,6%, a partir de la curva histórica, los precios de la carne de cerdo están a la zaga de unos 12 meses. El índice PPI y el índice IPC se compilan de acuerdo con las estadísticas, todos adoptan la fórmula de tracción de la cadena, deducen razonablemente que la Oficina de Estadística utiliza la proporción del valor de las ventas industriales en el mismo per íodo del año pasado (t - 12) en el cálculo del IPC en comparación con el mismo per íodo del año pasado, y el peso del período anterior (t - 1) en el cálculo de la relación PPI.

El PPI calculado sobre la base de la ponderación de la proporción de ingresos de la industria en la fase T - 12 es el más cercano al valor real. Ponderamos 39 IPC sectoriales según la proporción de ingresos de cada período, de los cuales la correlación entre T - 12, T - 11 y T - 10 y el IPC real es superior al 99,85%, pero la desviación media de T - 12 es la más pequeña y el efecto es el mejor.

Modelo de predicción del PPI basado en el aprendizaje automático

Preprocesamiento de datos: de enero de 2016 a diciembre de 2021, el tiempo de inicio y fin de los datos, la eliminación de series temporales demasiado cortas de cemento Portland ordinario, caucho natural. Tomando el precio medio mensual de los medios de producción y calculando año tras año, se obtuvieron 48 variables características.

Resolver el problema de la colinealidad mediante la selección de variables basadas en Lasso. Lasso a ñade un término de penalización al coeficiente de regresión Ols, y obtiene la solución escasa del modelo (el coeficiente parcial es cero). Después de dividir el conjunto de datos, la regresión Lasso extrajo 9 variables clave de 48 variables independientes, eliminó los factores no significativos, y conservó 5 variables de tubos de acero sin soldadura, diesel, gasolina, parafina y antracita. La Potencia de interpretación del modelo r ^ 2 fue del 97,1%.

Con el fin de ajustar el peso, la variable se retrasa 12 veces para ajustar el efecto de la fluctuación del valor de venta de los medios de producción en el año siguiente. Después de la optimización, la Potencia de interpretación del modelo aumentó al 99,0%. La hipótesis subyacente de este enfoque alternativo es que la fluctuación de los precios de los productos industriales puede representar el cambio en el valor de las ventas de productos industriales, pero durante la reforma de la oferta, el aumento de los precios de las materias primas disminuyó, por lo que a principios de 2017 las previsiones de PPI y el valor real de la PPI se desviaron en cierta medida.

El modelo predice un PPI del 9,1% en febrero

El 4 de marzo, la Oficina de Estadística publicó los precios de los medios de producción en el ámbito de la circulación a finales de febrero, el carbón, el petróleo y los fertilizantes aumentaron en febrero, lo que dio lugar a una nueva ronda de productos básicos al alza en la crisis ruso - ucraniana y a una mayor presión inflacionaria mundial.

En febrero, el retraso de los tubos de acero sin soldadura, el gasóleo, la gasolina, la parafina, la antracita, el gasóleo y la antracita fue de 11,0%, 51,3%, 41,1%, 43,5%, 93,6%, 10,3% y - 9,5%, respectivamente. El modelo de Aprendizaje automático basado en la regresión de Lasso predijo un PPI de 9,1% en febrero.

Indicación del riesgo

El conflicto ruso - ucraniano trae consigo la interferencia, el modelo puede tener el riesgo de fallo.

- Advertisment -