Moyennes mobiles pondérées: les bases Au fil des ans, les techniciens ont trouvé deux problèmes avec la moyenne mobile simple. Le premier problème réside dans le laps de temps de la moyenne mobile (MA). La plupart des analystes techniques croient que l'action prix. Le prix d'ouverture ou de clôture de l'action, ne suffit pas à dépendre de prédire correctement les signaux d'achat ou de vente de l'action de crossover MA. Pour résoudre ce problème, les analystes attribuent désormais plus de poids aux données de prix les plus récentes en utilisant la moyenne mobile exponentiellement lissée (EMA). Un exemple Par exemple, en utilisant un MA de 10 jours, un analyste prendrait le cours de clôture du 10e jour et multiplier ce nombre par 10, le neuvième jour par neuf, le huitième Jour par huit et ainsi de suite à la première de la MA. Une fois que le total a été déterminé, l'analyste divise ensuite le nombre par l'addition des multiplicateurs. Si vous ajoutez les multiplicateurs de l'exemple MA de 10 jours, le nombre est 55. Cet indicateur est connu comme la moyenne mobile pondérée linéairement. De nombreux techniciens sont convaincus de la moyenne mobile exponentiellement lissée (EMA). Cet indicateur a été expliqué de tant de manières différentes qu'il confond les étudiants et les investisseurs. Peut-être la meilleure explication vient de John J. Murphys Analyse technique des marchés financiers, (publié par le New York Institute of Finance, 1999): La moyenne mobile exponentiellement lissée répond aux deux problèmes associés à la moyenne mobile simple. Tout d'abord, la moyenne exponentiellement lissée attribue un poids plus important aux données les plus récentes. Par conséquent, il s'agit d'une moyenne mobile pondérée. Mais si elle attribue moins d'importance aux données sur les prix passés, elle inclut dans son calcul toutes les données de la vie de l'instrument. En outre, l'utilisateur peut ajuster la pondération pour donner plus ou moins de poids au prix des jours les plus récents, qui est ajouté à un pourcentage de la valeur des jours précédents. La somme des deux valeurs en pourcentage s'élève à 100. Par exemple, le prix des derniers jours pourrait être attribué à un poids de 10 (0,10), qui est ajouté au poids des jours précédents de 90 (0,90). Cela donne le dernier jour 10 de la pondération totale. Ce serait l'équivalent d'une moyenne de 20 jours, en donnant le prix des derniers jours une valeur plus petite de 5 (0,05). Figure 1: Moyenne mobile lissée exponentiellement Le graphique ci-dessus montre l'indice composite Nasdaq de la première semaine d'août 2000 au 1er juin 2001. Comme vous pouvez le voir clairement, l'EMA qui utilise les données de clôture sur un Neuf jours, a des signaux de vente définis le 8 septembre (marqué par une flèche vers le bas noire). C'était le jour où l'indice est passé au-dessous du niveau de 4.000. La deuxième flèche noire montre une autre jambe que les techniciens attendaient. Le Nasdaq ne pouvait pas générer assez de volume et d'intérêt des investisseurs de détail pour briser la marque de 3000. Il a ensuite plongé vers le bas de nouveau à fond à 1619,58 le 4 avril. La tendance haussière du 12 avril est marquée par une flèche. Ici, l'indice a fermé à 1,961.46, et les techniciens ont commencé à voir les gestionnaires de fonds institutionnels commencent à ramasser quelques bonnes affaires comme Cisco, Microsoft et certaines des questions liées à l'énergie. Les processus autorégressifs d'erreurs moyennes mobiles (ARMA) et d'autres modèles impliquant des retards de termes d'erreur peuvent être estimés à l'aide d'instructions FIT et d'erreurs simulées ou simulées. En utilisant les instructions SOLVE. Les modèles ARMA pour le processus d'erreur sont souvent utilisés pour les modèles à résidus autocorrélés. La macro AR peut être utilisée pour spécifier des modèles avec des processus d'erreur autorégressive. La macro MA peut être utilisée pour spécifier des modèles avec des processus d'erreur moyenne mobile. Erreurs autorégressives Un modèle avec des erreurs autorégressives de premier ordre, AR (1), a la forme alors qu'un processus d'erreur AR (2) a la forme et ainsi de suite pour les processus d'ordre supérieur. Notez que les s sont indépendants et identiquement distribués et ont une valeur attendue de 0. Un exemple d'un modèle avec une composante AR (2) est et ainsi de suite pour les processus d'ordre supérieur. Par exemple, vous pouvez écrire un modèle de régression linéaire simple avec MA (2) erreurs de moyenne mobile où MA1 et MA2 sont les paramètres de la moyenne mobile. Notez que RESID. Y est automatiquement défini par PROC MODEL comme La fonction ZLAG doit être utilisée pour les modèles MA pour tronquer la récursivité des retards. Cela garantit que les erreurs retardées commencent à zéro dans la phase d'amorçage et ne propagent pas les valeurs manquantes lorsque des variables de période d'amorçage sont manquantes et il s'assure que les erreurs futures sont nulles plutôt que manquantes lors de la simulation ou de la prévision. Pour plus de détails sur les fonctions de retard, reportez-vous à la section Lag Logic. Ce modèle écrit à l'aide de la macro MA est le suivant: Forme générale pour les modèles ARMA Le processus général ARMA (p, q) a la forme suivante Un modèle ARMA (p, q) peut être spécifié comme suit: où AR i et MA j représentent Les paramètres autorégressifs et de moyenne mobile pour les différents décalages. Vous pouvez utiliser tous les noms que vous voulez pour ces variables, et il existe de nombreuses façons équivalentes que la spécification pourrait être écrit. Les processus ARMA vectoriels peuvent également être estimés avec le MODÈLE PROC. Par exemple, un processus AR (1) à deux variables pour les erreurs des deux variables endogènes Y1 et Y2 peut être spécifié comme suit: Problèmes de convergence avec les modèles ARMA Les modèles ARMA peuvent être difficiles à estimer. Si les estimations des paramètres ne se situent pas dans la plage appropriée, les termes résiduels d'un modèle de moyenne mobile augmentent de façon exponentielle. Les résidus calculés pour les observations ultérieures peuvent être très importants ou peuvent déborder. Cela peut se produire soit parce que des valeurs de départ inappropriées ont été utilisées, soit parce que les itérations se sont éloignées de valeurs raisonnables. Il faut prendre soin de choisir les valeurs de départ pour les paramètres ARMA. Les valeurs initiales de 0,001 pour les paramètres ARMA fonctionnent habituellement si le modèle correspond bien aux données et que le problème est bien conditionné. Notez qu'un modèle MA peut souvent être approché par un modèle AR de haut niveau, et vice versa. Cela peut entraîner une collinearité élevée dans les modèles ARMA mixtes, ce qui peut entraîner un mauvais conditionnement dans les calculs et l'instabilité des paramètres estimés. Si vous avez des problèmes de convergence lors de l'estimation d'un modèle avec des processus d'erreur ARMA, essayez d'estimer par étapes. Tout d'abord, utilisez une instruction FIT pour estimer uniquement les paramètres structurels avec les paramètres ARMA maintenus à zéro (ou à des estimations antérieures raisonnables si disponibles). Ensuite, utilisez une autre instruction FIT pour estimer les paramètres ARMA uniquement, en utilisant les valeurs des paramètres structurels de la première exécution. Puisque les valeurs des paramètres structurels sont vraisemblablement proches de leurs estimations finales, les estimations des paramètres ARMA pourraient alors converger. Enfin, utilisez une autre instruction FIT pour produire des estimations simultanées de tous les paramètres. Comme les valeurs initiales des paramètres sont maintenant susceptibles d'être très proches de leurs estimations conjointes finales, les estimations devraient converger rapidement si le modèle est approprié pour les données. AR Conditions initiales Les retards initiaux des termes d'erreur des modèles AR (p) peuvent être modélisés de différentes façons. Les méthodes de démarrage d'erreurs autorégressives supportées par les procédures SASETS sont les suivantes: Procédures minimales conditionnelles (procédures ARIMA et MODEL) Procédures minimales inconditionnelles (procédures AUTOREG, ARIMA et MODEL) Procédure AUTOREG, pour une explication et une discussion sur les mérites de différentes méthodes de démarrage AR (p). Les initialisations CLS, ULS, ML et HL peuvent être effectuées par PROC MODEL. Pour les erreurs AR (1), ces initialisations peuvent être produites comme indiqué dans le tableau 18.2. Ces méthodes sont équivalentes dans de grands échantillons. Tableau 18.2 Initialisations effectuées par PROC MODEL: AR (1) ERRORS Les retards initiaux des termes d'erreur des modèles MA (q) peuvent également être modélisés de différentes façons. Les paradigmes de démarrage d'erreur moyenne mobile suivants sont supportés par les procédures ARIMA et MODEL: les moindres carrés conditionnels les moindres carrés inconditionnels La méthode des moindres carrés conditionnels pour estimer les termes d'erreurs moyennes mobiles n'est pas optimale car elle ignore le problème de démarrage. Cela réduit l'efficacité des estimations, bien qu'elles demeurent impartiales. Les résidus retardés initiaux, qui s'étendent avant le début des données, sont supposés être 0, leur valeur inconditionnelle attendue. Ceci introduit une différence entre ces résidus et les résidus des moindres carrés généralisés pour la covariance de la moyenne mobile qui, contrairement au modèle autorégressif, persiste à travers l'ensemble de données. Habituellement, cette différence converge rapidement vers 0, mais pour des processus de moyenne mobile non interchangeables, la convergence est assez lente. Pour minimiser ce problème, vous devriez avoir beaucoup de données, et les estimations des paramètres de la moyenne mobile devraient être bien dans la gamme inversible. Ce problème peut être corrigé au détriment d'écrire un programme plus complexe. On peut produire des estimations des moindres carrés inconditionnels pour le processus MA (1) en spécifiant le modèle comme suit: Les erreurs moyennes mobiles peuvent être difficiles à estimer. Vous devriez envisager d'utiliser une approximation AR (p) pour le processus de la moyenne mobile. Un processus à moyenne mobile peut généralement être bien approché par un processus autorégressif si les données n'ont pas été lissées ou différenciées. La macro AR La macro SAS AR génère des instructions de programmation pour le modèle PROC pour les modèles autorégressifs. La macro AR fait partie du logiciel SASETS et aucune option spéciale ne doit être définie pour utiliser la macro. Le processus autorégressif peut être appliqué aux erreurs d'équations structurelles ou aux séries endogènes elles-mêmes. La macro AR peut être utilisée pour les types d'autorégression suivants: autorégression vectorielle non restreinte autorégression vectorielle restreinte Autoregression univariée Pour modéliser le terme d'erreur d'une équation comme un processus autorégressif, utilisez l'instruction suivante après l'équation: Par exemple, supposons que Y est un Linéaire de X1, X2 et une erreur AR (2). Vous écririez ce modèle comme suit: Les appels à AR doivent venir après toutes les équations auxquelles s'applique le processus. L'invocation de la macro précédente, AR (y, 2), produit les instructions affichées dans la sortie LIST de la figure 18.58. Figure 18.58 Sortie d'option LIST pour un modèle AR (2) Les variables préfixées PRED sont des variables de programme temporaires utilisées de sorte que les retards des résidus sont les résidus corrects et non ceux qui sont redéfinis par cette équation. Notez que cela équivaut aux instructions explicitement écrites dans la section Formulaire général pour les modèles ARMA. Vous pouvez également restreindre les paramètres autorégressifs à zéro à des décalages sélectionnés. Par exemple, si vous voulez des paramètres autorégressifs aux lags 1, 12 et 13, vous pouvez utiliser les instructions suivantes: Ces instructions génèrent la sortie illustrée à la Figure 18.59. Figure 18.59 Sortie de l'option LIST pour un modèle AR avec Lags aux niveaux 1, 12 et 13 La liste des procédures MODEL de l'instruction de code du programme compilé est analysée PRED. yab x1 c x2 RESID. y PRED. y - ACTUAL. y ERROR. y PRED. Y-y OLDPRED. y PRED. y yl1 ZLAG1 (y-perdy) yl12 ZLAG12 (y-perdy) yl13 ZLAG13 (y-perdy) RESID. y PRED. y - ACTUAL. y ERROR. y PRED. y - y Il existe Variations selon la méthode des moindres carrés conditionnels, selon que les observations au début de la série sont utilisées pour réchauffer le processus AR. Par défaut, la méthode des moindres carrés conditionnels AR utilise toutes les observations et suppose des zéros pour les décalages initiaux des termes autorégressifs. En utilisant l'option M, vous pouvez demander à AR que vous utilisiez la méthode des moindres carrés inconditionnels (ULS) ou du maximum de vraisemblance (ML). Par exemple, les discussions sur ces méthodes sont fournies dans la section AR Conditions initiales. En utilisant l'option MCLS n, vous pouvez demander que les n premières observations soient utilisées pour calculer les estimations des retards autorégressifs initiaux. Dans ce cas, l'analyse commence par l'observation n 1. Par exemple: Vous pouvez utiliser la macro AR pour appliquer un modèle autorégressif à la variable endogène, au lieu du terme d'erreur, en utilisant l'option TYPEV. Par exemple, si vous voulez ajouter les cinq décalages passés de Y à l'équation de l'exemple précédent, vous pouvez utiliser AR pour générer les paramètres et les retards en utilisant les instructions suivantes: Les instructions précédentes génèrent la sortie illustrée à la figure 18.60. Figure 18.60 Option LIST Sortie pour un modèle AR de Y Ce modèle prédit Y comme une combinaison linéaire de X1, X2, une interception et les valeurs de Y dans les cinq dernières périodes. Autoregression vecteur non restreint Pour modéliser les termes d'erreur d'un ensemble d'équations comme un processus autorégressif vectoriel, utilisez la forme suivante de la macro AR après les équations: La valeur nomprocessus est tout nom que vous fournissez à AR à utiliser pour créer des noms pour l'autorégressif paramètres. Vous pouvez utiliser la macro AR pour modéliser plusieurs processus AR différents pour différents ensembles d'équations en utilisant différents noms de processus pour chaque ensemble. Le nom du processus garantit que les noms de variable utilisés sont uniques. Utilisez une valeur processname courte pour le processus si des estimations de paramètres doivent être écrites dans un jeu de données de sortie. La macro AR essaie de construire des noms de paramètres inférieurs ou égaux à huit caractères, mais limité par la longueur de nomprocessus. Qui est utilisé comme préfixe pour les noms de paramètres AR. La variable listlist est la liste des variables endogènes des équations. Supposons, par exemple, que les erreurs des équations Y1, Y2 et Y3 soient générées par un processus autorégressif vectoriel de second ordre. Vous pouvez utiliser les instructions suivantes: qui génèrent ce qui suit pour Y1 et un code similaire pour Y2 et Y3: Seule la méthode des moindres carrés conditionnels (MCLS ou MCLS n) peut être utilisée pour les processus vectoriels. Vous pouvez également utiliser le même formulaire avec des restrictions que la matrice de coefficients soit 0 aux décalages sélectionnés. Par exemple, les instructions suivantes appliquent un processus vectoriel de troisième ordre aux erreurs d'équation avec tous les coefficients au retard 2 restreint à 0 et avec les coefficients aux écarts 1 et 3 sans restriction: Vous pouvez modéliser les trois séries Y1Y3 comme un processus vectoriel autorégressif Dans les variables plutôt que dans les erreurs en utilisant l'option TYPEV. Si vous souhaitez modéliser Y1Y3 en fonction de valeurs passées de Y1Y3 et de certaines variables ou constantes exogènes, vous pouvez utiliser AR pour générer les états pour les termes de retard. Écrivez une équation pour chaque variable pour la partie non autorégressive du modèle, puis appelez AR avec l'option TYPEV. Par exemple, la partie non autorégressive du modèle peut être une fonction de variables exogènes, ou elle peut être des paramètres d'interception. S'il n'existe pas de composantes exogènes au modèle d'autorégression vectorielle, y compris les interceptions, affectez zéro à chacune des variables. Il doit y avoir une affectation à chacune des variables avant d'appeler AR. Cet exemple modélise le vecteur Y (Y1 Y2 Y3) comme une fonction linéaire uniquement de sa valeur dans les deux périodes précédentes et un vecteur d'erreur de bruit blanc. Le modèle a 18 (3 3 3 3) paramètres. Syntaxe de la macro AR Il existe deux cas de la syntaxe de la macro AR. Lorsque des restrictions sur un processus AR vectoriel ne sont pas nécessaires, la syntaxe de la macro AR a la forme générale spécifie un préfixe pour AR à utiliser dans la construction des noms de variables nécessaires pour définir le processus AR. Si l'endoliste n'est pas spécifié, la liste endogène prend par défaut le nom. Qui doit être le nom de l'équation à laquelle le processus d'erreur AR doit être appliqué. La valeur du nom ne peut pas dépasser 32 caractères. Est l'ordre du processus AR. Spécifie la liste des équations auxquelles le processus AR doit être appliqué. Si plus d'un nom est donné, un processus vectoriel non restreint est créé avec les résidus structurels de toutes les équations incluses comme régresseurs dans chacune des équations. Si non spécifié, endolist prend par défaut le nom. Spécifie la liste des délais auxquels les termes AR doivent être ajoutés. Les coefficients des termes aux décalages non listés sont mis à 0. Tous les retards indiqués doivent être inférieurs ou égaux à nlag. Et il ne doit pas y avoir de doubles. Si non spécifié, le laglist prend par défaut tous les retards 1 à nlag. Spécifie la méthode d'estimation à mettre en œuvre. Les valeurs valides de M sont CLS (estimations des moindres carrés conditionnels), ULS (estimations des moindres carrés inconditionnels) et ML (estimations du maximum de vraisemblance). MCLS est la valeur par défaut. Seul le MCLS est autorisé lorsque plus d'une équation est spécifiée. Les méthodes ULS et ML ne sont pas prises en charge par AR pour les modèles AR vectoriels. Spécifie que le processus AR doit être appliqué aux variables endogènes elles-mêmes plutôt qu'aux résidus structurels des équations. Auto-régression vectorielle restreinte Vous pouvez contrôler quels paramètres sont inclus dans le processus, en limitant à 0 ces paramètres que vous n'incluez pas. Tout d'abord, utilisez AR avec l'option DEFER pour déclarer la liste des variables et définir la dimension du processus. Ensuite, utilisez des appels AR supplémentaires pour générer des termes pour des équations sélectionnées avec des variables sélectionnées aux décalages sélectionnés. Les équations d'erreur produites sont les suivantes: Ce modèle indique que les erreurs pour Y1 dépendent des erreurs de Y1 et Y2 (mais pas de Y3) aux deux intervalles 1 et 2 et que les erreurs pour Y2 et Y3 dépendent Les erreurs précédentes pour les trois variables, mais seulement au décalage 1. Syntaxe AR Macro pour AR vectoriel restreint Une utilisation alternative d'AR est autorisée à imposer des restrictions sur un processus AR vectoriel en appelant AR plusieurs fois pour spécifier des termes AR différents et des décalages pour différents Équations. Le premier appel a la forme générale spécifie un préfixe pour AR à utiliser dans la construction de noms de variables nécessaires pour définir le processus vectoriel AR. Spécifie l'ordre du processus AR. Spécifie la liste des équations auxquelles le processus AR doit être appliqué. Spécifie que AR ne doit pas générer le processus AR mais doit attendre les informations supplémentaires spécifiées dans les appels AR ultérieurs pour la même valeur de nom. Les appels suivants ont la forme générale est la même que dans le premier appel. Spécifie la liste des équations auxquelles les spécifications de cet appel AR doivent être appliquées. Seuls les noms spécifiés dans la valeur endoliste du premier appel pour la valeur de nom peuvent apparaître dans la liste des équations dans eqlist. Spécifie la liste des équations dont les résidus structurels retardés doivent être inclus comme régresseurs dans les équations de eqlist. Seuls les noms de l'endoliste du premier appel de la valeur de nom peuvent apparaître dans varlist. Si non spécifié, varlist par défaut est endolist. Spécifie la liste des délais auxquels les termes AR doivent être ajoutés. Les coefficients des termes aux décalages non listés sont mis à 0. Tous les retards indiqués doivent être inférieurs ou égaux à la valeur de nlag. Et il ne doit pas y avoir de doubles. Si non spécifié, laglist prend par défaut tous les retards 1 à nlag. La macro MA La macro SAS MA génère des instructions de programmation pour le modèle PROC pour les modèles à moyenne mobile. La macro MA fait partie du logiciel SASETS et aucune option spéciale n'est nécessaire pour utiliser la macro. Le processus d'erreur moyenne mobile peut être appliqué aux erreurs d'équations structurelles. La syntaxe de la macro MA est la même que la macro AR sauf qu'il n'existe aucun argument TYPE. Lorsque vous utilisez les macros MA et AR combinées, la macro MA doit suivre la macro AR. Les instructions SASIML suivantes produisent un processus d'erreur ARMA (1, (1 3)) et l'enregistrent dans l'ensemble de données MADAT2. Les instructions PROC MODEL suivantes sont utilisées pour estimer les paramètres de ce modèle en utilisant la structure d'erreur de maximum de vraisemblance: Les estimations des paramètres produits par cette séquence sont présentées à la figure 18.61. Figure 18.61 Estimations d'un processus ARMA (1, (1 3)) Il existe deux cas de syntaxe pour la macro MA. Lorsque des restrictions sur un processus MA vectoriel ne sont pas nécessaires, la syntaxe de la macro MA a la forme générale spécifie un préfixe pour MA à utiliser dans la construction de noms de variables nécessaires pour définir le processus MA et est l'endoliste par défaut. Est l'ordre du processus MA. Spécifie les équations auxquelles le processus MA doit être appliqué. Si plus d'un nom est donné, l'estimation CLS est utilisée pour le processus vectoriel. Spécifie les délais auxquels les termes MA doivent être ajoutés. Tous les retards indiqués doivent être inférieurs ou égaux à nlag. Et il ne doit pas y avoir de doubles. Si non spécifié, le laglist prend par défaut tous les retards 1 à nlag. Spécifie la méthode d'estimation à mettre en œuvre. Les valeurs valides de M sont CLS (estimations des moindres carrés conditionnels), ULS (estimations des moindres carrés inconditionnels) et ML (estimations du maximum de vraisemblance). MCLS est la valeur par défaut. Seul le MCLS est autorisé lorsque plus d'une équation est spécifiée dans l'endoliste. MA Syntaxe macro pour le déplacement de vecteur restreint Une utilisation alternative de MA est autorisée à imposer des restrictions sur un processus MA vectoriel en appelant MA plusieurs fois pour spécifier différents termes de MA et des décalages pour différentes équations. Le premier appel a la forme générale spécifie un préfixe pour MA à utiliser dans la construction de noms de variables nécessaires pour définir le processus MA vecteur. Spécifie l'ordre du processus MA. Spécifie la liste des équations auxquelles le processus MA doit être appliqué. Spécifie que MA ne doit pas générer le processus MA mais doit attendre des informations supplémentaires spécifiées dans les appels MA ultérieurs pour la même valeur de nom. Les appels suivants ont la forme générale est la même que dans le premier appel. Spécifie la liste des équations auxquelles les spécifications de cet appel MA doivent être appliquées. Spécifie la liste des équations dont les résidus structurels retardés doivent être inclus comme régresseurs dans les équations de eqlist. Spécifie la liste des décalages auxquels les termes MA doivent être ajoutés.2.1 Modèles de moyennes mobiles (modèles MA) Les modèles de séries chronologiques connus sous le nom de modèles ARIMA peuvent inclure des termes autorégressifs ou des termes de moyenne mobile. Dans la semaine 1, nous avons appris un terme autorégressif dans un modèle de série chronologique pour la variable x t est une valeur décalée de x t. Par exemple, un terme autorégressif de retard 1 est x t-1 (multiplié par un coefficient). Cette leçon définit les termes moyens mobiles. Un terme moyen mobile dans un modèle de séries chronologiques est une erreur passée (multipliée par un coefficient). Soit (wt overet N (0, sigma2w)), ce qui signifie que les w t sont identiquement, indépendamment distribués, chacun avec une distribution normale ayant une moyenne 0 et la même variance. Le modèle de moyenne mobile du 1er ordre, noté MA (1) est (xt mu wt theta1w) Le modèle de moyenne mobile du 2 e ordre, noté MA (2) est (xt mu wt theta1w theta2w) , Désignée par MA (q) est (xt mu wt theta1w theta2w points thetaqw) Note. De nombreux manuels et logiciels définissent le modèle avec des signes négatifs avant les termes. Cela ne change pas les propriétés théoriques générales du modèle, bien qu'il renverse les signes algébriques des valeurs des coefficients estimés et des termes (non carrés) dans les formules pour les ACF et les variances. Vous devez vérifier votre logiciel pour vérifier si des signes négatifs ou positifs ont été utilisés pour écrire correctement le modèle estimé. R utilise des signes positifs dans son modèle sous-jacent, comme nous le faisons ici. Propriétés théoriques d'une série temporelle avec un modèle MA (1) Notez que la seule valeur non nulle dans l'ACF théorique est pour le lag 1. Toutes les autres autocorrélations sont 0. Ainsi, un échantillon ACF avec une autocorrélation significative seulement au décalage 1 est un indicateur d'un modèle MA (1) possible. Pour les étudiants intéressés, les preuves de ces propriétés sont une annexe à ce document. Exemple 1 Supposons qu'un modèle MA (1) soit x t 10 w t .7 w t-1. Où (wt dépasse N (0,1)). Ainsi, le coefficient 1 0,7. L'ACF théorique est donné par Un tracé de cette ACF suit. Le graphique qui vient d'être montré est l'ACF théorique pour un MA (1) avec 1 0,7. En pratique, un échantillon ne fournira habituellement qu'un tel motif clair. En utilisant R, nous avons simulé n 100 échantillons en utilisant le modèle x t 10 w t .7 w t-1 où w t iid N (0,1). Pour cette simulation, un schéma chronologique des données de l'échantillon suit. Nous ne pouvons pas dire beaucoup de cette intrigue. L'échantillon ACF pour les données simulées suit. Nous observons un pic au décalage 1 suivi par des valeurs généralement non significatives pour les décalages au-delà de 1. Notez que l'échantillon ACF ne correspond pas au modèle théorique du MA (1) sous-jacent, c'est-à-dire que toutes les autocorrélations Un échantillon différent aurait un ACF d'échantillon légèrement différent indiqué ci-dessous, mais aurait probablement les mêmes caractéristiques générales. Propriétés théoriques d'une série temporelle avec un modèle MA (2) Pour le modèle MA (2), les propriétés théoriques sont les suivantes: Noter que les seules valeurs non nulles dans l'ACF théorique sont pour les lags 1 et 2. Les autocorrélations pour les décalages supérieurs sont 0 . Ainsi, un échantillon ACF avec des autocorrélations significatives aux décalages 1 et 2, mais des autocorrélations non significatives pour des décalages plus élevés indique un modèle MA (2) possible. Iid N (0,1). Les coefficients sont 1 0,5 et 2 0,3. Parce qu'il s'agit d'une MA (2), l'ACF théorique aura des valeurs non nulles uniquement aux lags 1 et 2. Les valeurs des deux autocorrélations non nulles sont: Un tracé de la théorie ACF suit. Comme presque toujours le cas, les données d'échantillon ne se comporteront pas aussi parfaitement que la théorie. Nous avons simulé n 150 échantillons pour le modèle x t 10 w t .5 w t-1 .3 w t-2. Où w t iid N (0,1). Le tracé de la série chronologique des données suit. Comme avec le graphique de la série temporelle pour les données d'échantillon MA (1), vous ne pouvez pas en dire beaucoup. L'échantillon ACF pour les données simulées suit. Le modèle est typique pour les situations où un modèle MA (2) peut être utile. Il y a deux pointes statistiquement significatives aux écarts 1 et 2, suivies des valeurs non significatives pour les autres retards. Notez qu'en raison de l'erreur d'échantillonnage, l'ACF de l'échantillon ne correspondait pas exactement au modèle théorique. ACF pour les modèles General MA (q) Une propriété des modèles MA (q) en général est qu'il existe des autocorrélations non nulles pour les q premiers lags et autocorrélations 0 pour tous les retards gt q. Non-unicité de la connexion entre les valeurs de 1 et (rho1) dans MA (1) Modèle. Dans le modèle MA (1), pour toute valeur de 1. La valeur réciproque 1 1 donne la même valeur pour. Par exemple, utilisez 0,5 pour 1. Puis utilisez 1 (0,5) 2 pour 1. Vous obtiendrez (rho1) 0,4 dans les deux cas. Pour satisfaire une restriction théorique appelée invertibilité. Nous limitons les modèles MA (1) à des valeurs dont la valeur absolue est inférieure à 1. Dans l'exemple donné, 1 0,5 sera une valeur de paramètre admissible, alors que 1 10,5 2 ne le sera pas. Invertibilité des modèles MA Un modèle MA est dit inversible s'il est algébriquement équivalent à un modèle d'ordre infini convergent. En convergeant, nous voulons dire que les coefficients AR décroissent à 0 lorsque nous retournons dans le temps. Invertibilité est une restriction programmée dans le logiciel de séries temporelles utilisé pour estimer les coefficients de modèles avec des termes MA. Ce n'est pas quelque chose que nous vérifions dans l'analyse des données. Des informations supplémentaires sur la restriction d'inversibilité pour les modèles MA (1) sont données en annexe. Théorie avancée. Pour un modèle MA (q) avec un ACF spécifié, il n'existe qu'un seul modèle inversible. La condition nécessaire à l'inversibilité est que les coefficients ont des valeurs telles que l'équation 1- 1 y-. - q y q 0 a des solutions pour y qui tombent en dehors du cercle unitaire. Code R pour les exemples Dans l'exemple 1, nous avons représenté l'ACF théorique du modèle x t 10 w t. 7w t-1. Puis a simulé n 150 valeurs à partir de ce modèle et a représenté graphiquement la série chronologique de l'échantillon et l'échantillon ACF pour les données simulées. Les r commandes utilisées pour tracer l'ACF théorique sont: acfma1ARMAacf (mac (0.7), lag. max10) 10 lags de ACF pour MA (1) avec theta1 0.7 lags0: 10 crée une variable nommée lags qui va de 0 à 10. plot Abline (h0) ajoute un axe horizontal à la trame La première commande détermine l'ACF et la stocke dans un objet (a0) Nommé acfma1 (notre choix de nom). La commande plot (la 3ème commande) trace des retards par rapport aux valeurs ACF pour les lags 1 à 10. Le paramètre ylab étiquette l'axe y et le paramètre principal place un titre sur la trame. Pour voir les valeurs numériques de l'ACF, utilisez simplement la commande acfma1. La simulation et les parcelles ont été effectuées avec les commandes suivantes. (X, typeb, mainSimulated MA (1) data) xcarima. sim (n150, list (mac (0.7))) Simule n 150 valeurs de MA (1) xxc10 ajoute 10 pour faire la moyenne 10. La simulation (X, xlimc (1,10), mainACF pour des données d'échantillon simulées) Dans l'exemple 2, nous avons représenté graphiquement l'ACF théorique du modèle xt 10 wt.5 w t-1 .3 w t-2. Puis a simulé n 150 valeurs à partir de ce modèle et a représenté graphiquement la série chronologique de l'échantillon et l'échantillon ACF pour les données simulées. Les ordres R utilisés étaient: ACFma2ARMAacf (mac (0,5,0,3), lag. max10) acfma2 lags0: 10 tracé (lags, acfma2, xlimc (1,10), ylabr, typeh, ACF principal pour MA (2) avec theta1 0,5, (X, typeb, principale série MA (2) simulée) acf (x, xlimc (1,10), x2) (1) Pour les étudiants intéressés, voici des preuves des propriétés théoriques du modèle MA (1). (Ht) text (wt) text (wt) text (theta1w) sigma2w theta21sigma2w (1theta21) sigma2w) Lorsque h 1, l'expression précédente 1 w 2. Pour tout h 2, l'expression précédente 0. La raison en est que, par définition de l'indépendance du poids. E (w k w j) 0 pour tout k j. En outre, parce que w t ont une moyenne 0, E (w j w j) E (w j 2) w 2. Pour une série chronologique, appliquer ce résultat pour obtenir l'ACF ci-dessus. Un modèle inversible MA est celui qui peut être écrit comme un modèle AR d'ordre infini qui converge de sorte que les coefficients AR convergent vers 0 alors que nous avançons infiniment dans le temps. Bien démontrer l'inversibilité pour le modèle MA (1). On substitue alors la relation (2) pour w t-1 dans l'équation (1) (3) (zt wt theta1 (z - theta1w) wt theta1z - theta2w) Au temps t-2. L'équation (2) devient Nous substituons alors la relation (4) pour w t-2 dans l'équation (3) (zt wt theta1 z - theta21w wt theta1z - theta21 (z - theta1w) wt theta1z - theta12z theta31w) Si nous devions continuer On notera cependant que si 1 1, les coefficients multipliant les décalages de z augmentent (infiniment) en taille à mesure que l'on se déplace vers l'arrière temps. Pour éviter cela, nous avons besoin de 1 lt1. C'est la condition pour un modèle inversible MA (1). Infinite Order MA model Dans la semaine 3, voyez bien qu'un modèle AR (1) peut être converti en un modèle d'ordre infini MA: (xt - mu wt phi1w phi21w points phik1 w dots sum phij1w) Cette sommation des termes de bruit blanc passé est connue Comme la représentation causale d'un AR (1). En d'autres termes, x t est un type spécial de MA avec un nombre infini de termes revenant dans le temps. C'est ce qu'on appelle un ordre infini MA ou MA (). Un ordre fini MA est un ordre infini AR et tout ordre fini AR est un ordre infini MA. Rappelons à la semaine 1, nous avons noté qu'une exigence pour un AR stationnaire (1) est que 1 lt1. Calculons le Var (x t) en utilisant la représentation causale. Cette dernière étape utilise un fait de base sur les séries géométriques qui nécessite (phi1lt1) sinon la série diverge. La navigation
No comments:
Post a Comment