A RIMA significa Autoregressive Integrated Moving Average modelos. Univariante (vector único) ARIMA es una técnica de previsión que proyecta los valores futuros de una serie basada enteramente en su propia inercia. Su aplicación principal es en el área de pronósticos a corto plazo que requieren al menos 40 puntos de datos históricos. Funciona mejor cuando los datos muestran un patrón estable o consistente en el tiempo con una cantidad mínima de valores atípicos. A veces llamado Box-Jenkins (después de los autores originales), ARIMA suele ser superior a las técnicas de suavización exponencial cuando los datos son razonablemente largos y la correlación entre las observaciones pasadas es estable. Si los datos son cortos o muy volátiles, entonces algún método de suavizado puede funcionar mejor. Si usted no tiene por lo menos 38 puntos de datos, debe considerar algún otro método que ARIMA. El primer paso para aplicar la metodología ARIMA es verificar la estacionariedad. La estacionariedad implica que la serie permanece a un nivel bastante constante en el tiempo. Si existe una tendencia, como en la mayoría de las aplicaciones económicas o de negocios, sus datos NO son estacionarios. Los datos también deben mostrar una variación constante en sus fluctuaciones en el tiempo. Esto se ve fácilmente con una serie que es muy estacional y que crece a un ritmo más rápido. En tal caso, los altibajos en la estacionalidad se harán más dramáticos con el tiempo. Si no se cumplen estas condiciones de estacionariedad, no se pueden calcular muchos de los cálculos asociados con el proceso. Si un gráfico gráfico de los datos indica nonstationarity, entonces usted debe diferenciar la serie. La diferenciación es una excelente forma de transformar una serie no estacionaria en una serie estacionaria. Esto se hace restando la observación en el período actual a la anterior. Si esta transformación se realiza sólo una vez en una serie, se dice que los datos se han diferenciado primero. Este proceso esencialmente elimina la tendencia si su serie está creciendo a una tasa bastante constante. Si está creciendo a un ritmo creciente, puede aplicar el mismo procedimiento y diferenciar los datos de nuevo. Sus datos entonces serían segundos diferenciados. Las autocorrelaciones son valores numéricos que indican cómo una serie de datos se relaciona a sí misma con el tiempo. Más precisamente, mide cuán fuertemente están correlacionados los valores de datos en un número específico de períodos separados entre sí a lo largo del tiempo. El número de períodos separados se llama generalmente el retraso. Por ejemplo, una autocorrelación en el retardo 1 mide cómo los valores 1 período aparte están correlacionados entre sí a lo largo de la serie. Una autocorrelación en el retraso 2 mide cómo los datos dos períodos aparte están correlacionados a lo largo de la serie. Las autocorrelaciones pueden variar de 1 a -1. Un valor próximo a 1 indica una alta correlación positiva, mientras que un valor cercano a -1 implica una correlación negativa alta. Estas medidas se evalúan con mayor frecuencia a través de tramas gráficas llamadas correlagramas. Un correlagrama traza los valores de autocorrelación para una serie dada con diferentes retardos. Esto se conoce como la función de autocorrelación y es muy importante en el método ARIMA. La metodología ARIMA intenta describir los movimientos en una serie temporal estacionaria como una función de lo que se llaman parámetros de media móvil y autorregresiva. Estos parámetros se denominan parámetros AR (autoregessivos) y MA (medias móviles). Un modelo de AR con un solo parámetro se puede escribir como. X (t) A (1) X (t-1) E (t) donde X (t) serie temporal bajo investigación A (1) el parámetro autorregresivo de orden 1 X (t-1) (T) el término de error del modelo Esto simplemente significa que cualquier valor dado X (t) puede explicarse por alguna función de su valor anterior, X (t-1), más algún error aleatorio inexplicable, E (t). Si el valor estimado de A (1) fue de 0,30, entonces el valor actual de la serie estaría relacionado con 30 de su valor hace 1 período. Por supuesto, la serie podría estar relacionada con más de un valor pasado. Por ejemplo, X (t) A (1) X (t-1) A (2) X (t-2) E (t) Esto indica que el valor actual de la serie es una combinación de los dos valores inmediatamente anteriores, X (t-1) y X (t-2), más algún error aleatorio E (t). Nuestro modelo es ahora un modelo autorregresivo de orden 2. Modelos de media móvil: Un segundo tipo de modelo de Box-Jenkins se denomina modelo de media móvil. Aunque estos modelos parecen muy similares al modelo de AR, el concepto detrás de ellos es muy diferente. Los parámetros de la media móvil relacionan lo que sucede en el período t sólo con los errores aleatorios que ocurrieron en períodos de tiempo pasados, es decir, E (t-1), E (t-2), etc., en lugar de X (t-1), X T-2), (Xt-3) como en los enfoques autorregresivos. Un modelo de media móvil con un término MA puede escribirse como sigue. El término B (1) se denomina un MA de orden 1. El signo negativo delante del parámetro se utiliza para la convención solamente y se imprime generalmente La mayoría de los programas de ordenador. El modelo anterior simplemente dice que cualquier valor dado de X (t) está directamente relacionado solamente al error aleatorio en el período anterior, E (t-1), y al término de error actual, E (t). Como en el caso de modelos autorregresivos, los modelos de media móvil pueden extenderse a estructuras de orden superior que abarcan diferentes combinaciones y longitudes móviles. La metodología ARIMA también permite la construcción de modelos que incorporen parámetros tanto de autorregresión como de media móvil. Estos modelos se refieren a menudo como modelos mixtos. Aunque esto hace que sea una herramienta de pronóstico más complicada, la estructura puede simular mejor la serie y producir un pronóstico más preciso. Los modelos puros implican que la estructura consiste solamente en los parámetros AR o MA - no ambos. Los modelos desarrollados por este enfoque usualmente se llaman modelos ARIMA porque usan una combinación de autoregresión (AR), integración (I), que se refiere al proceso inverso de diferenciación para producir las operaciones de predicción y de media móvil (MA). Un modelo de ARIMA se indica generalmente como ARIMA (p, d, q). Esto representa el orden de los componentes autorregresivos (p), el número de operadores de diferenciación (d) y el orden más alto del término medio móvil. Por ejemplo, ARIMA (2,1,1) significa que usted tiene un modelo autorregresivo de segundo orden con un componente de media móvil de primer orden cuya serie se ha diferenciado una vez para inducir la estacionariedad. Elegir la especificación correcta: El principal problema en el clásico Box-Jenkins es tratar de decidir qué especificación ARIMA utilizar-i. e. Cuántos AR y / o MA parámetros para incluir. Esto es lo que gran parte de Box-Jenkings 1976 se dedicó al proceso de identificación. Dependía de la eva - luación gráfica y numérica de las funciones de autocorrelación de la muestra y de autocorrelación parcial. Bueno, para sus modelos básicos, la tarea no es demasiado difícil. Cada uno tiene funciones de autocorrelación que se ven de cierta manera. Sin embargo, cuando se sube en complejidad, los patrones no se detectan tan fácilmente. Para hacer las cosas más difíciles, sus datos representan sólo una muestra del proceso subyacente. Esto significa que los errores de muestreo (valores atípicos, errores de medición, etc.) pueden distorsionar el proceso teórico de identificación. Es por ello que el modelado ARIMA tradicional es un arte más que una ciencia. El orden de un modelo ARIMA (media móvil integrada autorregresiva) se denomina generalmente por la notación ARIMA (p, d, q), donde está el orden de la parte autorregresiva Es el orden de la diferenciación es el orden del proceso de media móvil Si no se realiza ninguna diferenciación (d 0), los modelos se denominan normalmente modelos ARMA (p. El modelo final en el ejemplo anterior es un modelo ARIMA (1,1,1) ya que la instrucción IDENTIFY especificada d 1 y la instrucción ESTIMATE final especificada p 1 y q 1. Notación para modelos ARIMA puros Matemáticamente se escribe el modelo ARIMA puro Como es la serie de respuesta o una diferencia de la serie de respuestas es el término medio es el operador autorregresivo, representado como un polinomio en el operador de retroceso: es el operador de media móvil, representado como un polinomio en el operador de retroceso: es la perturbación independiente , También llamado error aleatorio La serie se calcula mediante la instrucción IDENTIFY y es la serie procesada por la instrucción ESTIMATE. Por lo tanto, es la serie de respuestas Y o una diferencia de especificado por los operadores de diferenciación en la instrucción IDENTIFY. Para la diferenciación simple (no estacional),. Para la diferencia estacional, donde d es el grado de diferenciación no estacional, D es el grado de diferenciación estacional, y s es la longitud del ciclo estacional. Por ejemplo, la forma matemática del modelo ARIMA (1,1,1) estimada en el ejemplo anterior es8,5. Modelos ARIMA no estacionales Si combinamos la diferenciación con la autorregresión y un modelo de media móvil, obtenemos un modelo ARIMA no estacional . ARIMA es un acrónimo de AutoRegressive Integrated Moving Average (la integración en este contexto es el reverso de la diferenciación). El modelo completo se puede escribir como donde y es la serie diferenciada (puede haber sido diferenciada más de una vez). Los predictores en el lado derecho incluyen tanto los valores rezagados de yt como los errores rezagados. Llamamos a esto un modelo de ARIMA (p, d, q). Donde p orden de la parte autorregresiva d grado de primera diferencia implicaba q orden de la parte media móvil. Las mismas condiciones de estacionariedad e invertibilidad que se usan para los modelos de media autorregresiva y móvil se aplican a este modelo ARIMA. Una vez que comencemos a combinar componentes de esta manera para formar modelos más complicados, es mucho más fácil trabajar con la notación de cambio de marcha atrás. Entonces la ecuación (ref) se puede escribir como begin (1-phi1B-cdots-phip Bp) amp (1-B) dy amp ampc (1 theta1 B cdots thetaq Bq) y uparrow amp uparrow amp ampuparrow Los valores apropiados para p, dyq pueden ser difíciles. La función auto. arima () en R lo hará automáticamente. Más adelante en este capítulo, aprenderemos cómo funciona la función, y algunos métodos para elegir estos valores usted mismo. Muchos de los modelos que ya hemos discutido son casos especiales del modelo ARIMA como se muestra en la siguiente tabla. Descripción de los modelos ARIMA La función auto. arima () es muy útil, pero cualquier cosa automatizada puede ser un poco peligrosa, y vale la pena entender algo del comportamiento de los modelos incluso cuando Usted confía en un procedimiento automático para elegir el modelo para usted. La constante c tiene un efecto importante en los pronósticos a largo plazo obtenidos de estos modelos. Si c0 y d0, las previsiones a largo plazo pasarán a cero. Si c0 y d1, los pronósticos a largo plazo pasarán a una constante distinta de cero. Si c0 y d2, las previsiones a largo plazo seguirán una línea recta. Si cne0 y d0, los pronósticos a largo plazo irán a la media de los datos. Si cne0 y d1, las previsiones a largo plazo seguirán una línea recta. Si cne0 y d2, los pronósticos a largo plazo seguirán una tendencia cuadrática. El valor de d también tiene un efecto en los intervalos de predicción cuanto mayor es el valor de d, más rápidamente los intervalos de predicción aumentan de tamaño. Para d0, la desviación estándar pronosticada a largo plazo irá a la desviación estándar de los datos históricos, por lo que los intervalos de predicción serán todos esencialmente iguales. Este comportamiento se observa en la figura 8.8 donde d0 y cne 0. En esta figura, los intervalos de predicción son los mismos para los últimos horizontes de pronóstico, y los pronósticos de puntos son iguales a la media de los datos. El valor de p es importante si los datos muestran ciclos. Para obtener pronósticos cíclicos, es necesario tener pge2 junto con algunas condiciones adicionales sobre los parámetros. Para un modelo AR (2), el comportamiento cíclico ocurre si phi124phi2t0. En ese caso, el período promedio de los ciclos es 1 frac (-phi1 (1-phi2) / (4phi2)). Parcelas ACF y PACF Normalmente no es posible decir, simplemente a partir de un gráfico de tiempo, qué valores de p y q son apropiados para los datos. Sin embargo, a veces es posible usar la gráfica ACF, y el diagrama de PACF estrechamente relacionado, para determinar valores apropiados para p y q. Recuerde que un gráfico ACF muestra las autocorrelaciones que miden la relación entre yt yy para diferentes valores de k. Ahora si yt yy están correlacionados, entonces yyy también deben estar correlacionados. Pero entonces yt yy podrían estar correlacionados, simplemente porque ambos están conectados a y, en lugar de debido a cualquier nueva información contenida en y que pudiera usarse en pronosticar yt. Para superar este problema, podemos usar autocorrelaciones parciales. Estos miden entre yyy después de eliminar los efectos de otros retrasos de tiempo - 1, 2, 3, puntos, k - 1. Así, la primera autocorrelación parcial es idéntica a la primera autocorrelación, porque no hay nada entre ellos para eliminar. Las autocorrelaciones parciales para los retardos 2, 3 y mayores se calculan de la siguiente manera: Variando el número de términos en el lado derecho de este modelo de autorregresión se dan alfak para diferentes valores de k. (En la práctica, hay algoritmos más eficientes para calcular alphak que encajar todas estas autorregresiones, pero dan los mismos resultados.) La Figura 8.9 muestra las gráficas ACF y PACF para los datos de consumo de los Estados Unidos mostrados en la Figura 8.7. Las autocorrelaciones parciales tienen los mismos valores críticos de pm 1,96 / sqrt que para autocorrelaciones ordinarias, y éstas se muestran típicamente en la gráfica como en la Figura 8.9. Gráfico 8.9: ACF y PACF de cambio porcentual trimestral en el consumo estadounidense. Una manera conveniente de producir un diagrama de tiempo, trazado ACF y trazado PACF en un comando es utilizar la función tsdisplay en R. par 40 mfrow c 40 1. 2 41 41 Acf 40 usconsumption 91. 1 93, main quotquot 41 Pacf 40 usconsumption Si los datos proceden de un modelo ARIMA (p, d, 0) o ARIMA (0, d, q), los gráficos ACF y PACF pueden ser útiles para determinar el valor de p o q . Si p y q son positivos, entonces las gráficas no ayudan a encontrar valores adecuados de p y q. Los datos pueden seguir un modelo ARIMA (p, d, 0) si las gráficas ACF y PACF de los datos diferenciados muestran los siguientes patrones: el ACF está en descomposición exponencial o sinusoidal hay un pico significativo al retardo p en PACF, pero ninguno más allá Retraso Los datos pueden seguir un modelo ARIMA (0, d, q) si las gráficas ACF y PACF de los datos diferenciados muestran los siguientes patrones: el PACF está en descomposición exponencial o sinusoidal hay un pico significativo al retraso q en ACF, pero ninguno más allá Lag q. En la Figura 8.9, vemos que hay tres picos en la ACF y luego no hay picos significativos a partir de entonces (aparte de uno justo fuera de los límites en el retardo 14). En el PACF, hay tres picos que disminuyen con el retraso, y después ningún pico significativo a partir de entonces (aparte de uno apenas fuera de los límites en el retraso 8). Podemos ignorar un pico significativo en cada parcela si está justo fuera de los límites, y no en los primeros rezagos. Después de todo, la probabilidad de que un pico sea significativo por casualidad es aproximadamente uno de cada veinte, y estamos trazando 21 picos en cada parcela. El patrón en los primeros tres picos es lo que cabría esperar de un ARIMA (0,0,3) ya que el PACF tiende a decaer exponencialmente. Así que en este caso, el ACF y el PACF nos llevan al mismo modelo que se obtuvo usando el procedimiento automático. Arco cos es la función coseno inversa. Deberías poder encontrarlo en tu calculadora. Puede ser etiquetado como acos o cos .1608617
No comments:
Post a Comment