La notion de moment en mathématiques, notamment en théorie des probabilités, a pour origine la notion de moment en physique[réf. nécessaire].
Soit une fonction f : I → ℝ continue sur un intervalle I (non réduit à un point) de ℝ.
Étant donné un entier naturel r, le moment d’ordre r de f est défini, sous réserve d’existence, par[réf. nécessaire] :
-
Ce moment d’ordre r est considéré comme existant si et seulement si xr f(x) est intégrable, c’est-à-dire si et seulement si ∫x∈I |xr f(x)| dx converge.
Ainsi, même si le moment est une intégrale impropre convergente[1], ce moment est tout de même considéré comme non existant.
De cette manière, si un moment n’existe pas à un ordre donné, alors tous les moments d’ordre supérieur n’existent pas non plus. Réciproquement, si un moment existe à un ordre donné, alors tous les moments d’ordre inférieur existent également.
Pour un entier naturel r donné, l’ensemble des fonctions continues sur I dont le moment d’ordre r existe est un espace vectoriel réel, et l’application mr : f ↦ mr(f) est une forme linéaire sur cet espace vectoriel.
Soit X une variable aléatoire réelle définie sur I, de fonction de répartition FX et de loi de probabilité p.
Le moment (ou moment ordinaire, ou moment en 0) d’ordre r ∈ ℕ de X est défini, s’il existe, par :
-
On a donc, d’après le théorème de transfert :
-
Cette intégrale de Stieltjes peut se réécrire :
- si X est discrète :
- si X est absolument continue :
D’après le deuxième axiome des probabilités, on a alors m0 = 1.
On notera que, p étant positive ou nulle sur I (premier axiome des probabilités), le critère d’existence du moment d’ordre r est la convergence de ∑k∈I |k|r pk ou de ∫x∈I |x|r p(x) dx selon le cas.
Le moment centré d’ordre r ∈ ℕ de X est défini, s’il existe, par :
-
On a donc, d’après le théorème de transfert :
-
Cette intégrale de Stieltjes peut se réécrire :
- si X est discrète :
- si X est absolument continue :
Par construction, on a alors μ0 = 1 et μ1 = 0.
D’après le théorème de transfert, on peut également écrire μr(X) = mr(X - 𝔼(X)).
En posant μ = m1 et σ = √μ2, le moment centré réduit d’ordre r ∈ ⟦2;+∞⟦ de X est défini, s’il existe, par :
-
On a donc βr = μr⁄σr et, par construction, β0 = 1.
Les moments spectraux permettent l'étude des vibrations aléatoires dans le domaine fréquentiel. En considérant la densité spectrale de puissance Φ d'une vibration aléatoire, le moment spectral d'ordre i, noté , peut s'écrire:
-
Certains moments, utilisés couramment pour caractériser une variable aléatoire réelle X, sont connus sous un nom particulier :
- l’espérance, moment d’ordre un : ;
- la variance, moment centré d’ordre deux : , ainsi que sa racine carrée l’écart type : ;
- le coefficient d’asymétrie, moment centré réduit d’ordre trois[2] : ;
- le kurtosis non normalisé, moment centré réduit d’ordre quatre : .
Fonction génératrice des moments
modifier
La fonction génératrice des moments MX d’une variable aléatoire réelle X est la série génératrice exponentielle associée à la suite (mr)r ∈ ℕ des moments de X, définie au voisinage de 0 et sous réserve d’existence de tous les moments :
-
Elle peut également s’écrire, au voisinage de 0 et sous réserve d’existence de l’espérance :
-
Les dérivées itérées en 0 de cette série génératrice exponentielle valent :
-
Soit [X] la dimension de la variable aléatoire réelle X.
Les moments ordinaire et centré d’ordre r, s’ils existent, ont pour dimension [X]r.
Démonstration
Dans l’écriture ∫x∈I xr dFX(x) du moment d’ordre r, la variable x a pour dimension [X].
La mesure de probabilité ℙ étant une grandeur sans dimension, la fonction de répartition FX, définie par ∀ x ∈ I, FX(x) = ℙ(X ≤ x), est également adimensionnelle, de même donc pour son infinitésimal dFX(x).
Donc mr = ∫x∈I xr dFX(x) a pour dimension [Xr].
𝔼(X) = m1 ayant pour dimension [X], c’est également le cas de x - 𝔼(X), donc μr = ∫x∈I [x - 𝔼(X)]r dFX(x) a également pour dimension [Xr].
Le moment centré réduit d’ordre r, s’il existe, est une grandeur sans dimension.
Démonstration
μ2 ayant pour dimension [X2], σ = √μ2 a pour dimension [X], donc βr-2 = μr⁄σr a pour dimension [Xr⁄Xr] = [1].
Le moment ordinaire d’ordre 1, s’il existe, est linéaire :
-
Démonstration
Soit Λ = {λ} la variable aléatoire constante valant λ avec une probabilité 1.
La translation de longueur λ des valeurs d’une variable aléatoire correspond à la somme de cette variable aléatoire et de Λ : θ X + λ ≜ θ X + Λ.
Sachant que 𝔼(Λ) = λ, on a donc, par linéarité de l’espérance :
-
Le moment ordinaire d’ordre r > 1 de θ X + λ, s’il existe, ne s’exprime pas uniquement en fonction du moment d’ordre r de X :
-
Démonstration
En développant le binôme (θ X + λ)r et par linéarité de l’espérance, on a :
-
On retrouve ainsi la linéarité de m1 et la constance de m0.
Le moment centré d’ordre r, s’il existe, est invariant par translation et homogène de degré r :
-
Démonstration 1
Sachant que 𝔼(θ X + λ) = θ 𝔼(X) + λ (voir transformation affine sur le moment ordinaire d’ordre 1), on a :
-
Par linéarité de l’espérance, on a donc :
-
Démonstration 2
Sachant que μr(X) = mr(X - 𝔼(X)), la fonction génératrice des moments centrés de X est donc la fonction génératrice des moments ordinaires de X - 𝔼(X) :
-
Sachant que (θ X + λ) - 𝔼(θ X + λ) = θ [X - 𝔼(X)] (voir démonstration 1), on a donc :
-
Par dérivation itérée de cette fonction composée, on a donc :
-
D’où, en 0 :
-
Sur les moments centrés réduits
modifier
Par transformation affine de coefficient directeur non nul (afin que σ soit non nul), le moment centré réduit d’ordre r, s’il existe, est simplement multiplié par le signe du coefficient directeur élevé à la puissance r :
-
La valeur absolue d’un moment centré réduit est donc invariante par transformation affine de pente non nulle.
Démonstration
L’écart type de θ X + λ vaut :
-
Le moment centré réduit d’ordre r de θ X + λ vaut donc :
-
En distinguant selon le signe de θ et la parité de r, on peut donc écrire :
-
Soient X et Y deux variables aléatoires réelles, on a alors :
-
Si X et Y sont indépendantes, on a en outre :
-
-
Cette propriété d’additivité n’existe que pour les trois moments particuliers cités[3]. Les mesures de risque vérifiant cette propriété sont appelés les cumulants.
Relations entre moments ordinaires et moments centrés
modifier
Moments centrés en fonction des moments ordinaires
modifier
Le moment centré d’ordre r, s’il existe, s’écrit :
-
Démonstration
En développant le binôme dans l’expression de μr et par linéarité de l’espérance, on a :
-
Puis, en rappelant que Ck
n = Cn-k
n, on obtient la seconde écriture par le changement de variable i ↦ r - i.
En rappelant que m0 = 1, les premiers moments centrés s’expriment donc, en fonction des moments ordinaires :
-
-
-
-
-
Moments ordinaires en fonction des moments centrés
modifier
Réciproquement, en posant μ = 𝔼(X), le moment ordinaire d’ordre r, s’il existe, s’écrit :
-
Démonstration
En développant le binôme dans l’expression de mr et par linéarité de l’espérance, on a :
-
Puis, en rappelant que Ck
n = Cn-k
n, on obtient la seconde écriture par le changement de variable i ↦ r - i.
En rappelant que μ0 = 1 et μ1 = 0, les premiers moments ordinaires s’expriment donc, en fonction des moments centrés et de μ :
-
-
-
-
-
Estimateur non biaisé des moments ordinaires
modifier
À partir d’un échantillon {X1, X2, …, Xn} de la variable aléatoire réelle X, on peut utiliser comme estimateur sans biais du moment ordinaire d’ordre r, s’il existe, l’estimateur suivant :
-
Tandis que le calcul des moments consiste à déterminer les moments mr d’une loi de probabilité p donnée, le problème des moments consiste inversement à étudier l’existence et l’unicité d’une loi de probabilité p dont les moments mr sont donnés.
Extension de la notion de moment
modifier
Sur le modèle des moments 𝔼(Xr), d’autres moments peuvent être définis :
- le moment inverse en 0 d’ordre r sur I ∌ 0 : ;
- le moment logarithmique d’ordre r sur I ⊂ ℝ*
+ ;
- le moment factoriel d’ordre r : (factorielle décroissante).
- ↑ Ce cas arrive par exemple pour les moments d’ordre impair d’une fonction paire définie sur ℝ : même si ∫x∈ℝ |xr f(x)| dx diverge, la fonction x ↦ xr f(x) est impaire donc a une primitive paire, d’où ∀ t ∈ ℝ, ∫t
-t xr f(x) dx = 0, donc ∫x∈ℝ xr f(x) dx est une intégrale impropre convergente valant 0.
- ↑ Pour des raisons historiques et en accord avec la notation des cumulants réduits, le coefficient d’asymétrie est noté γ1 plutôt que β1.
- ↑ Formellement parlant, sachant que μ1 = 0, on pourrait ajouter le cas dégénéré μ1(X + Y) = μ1(X) + μ1(Y), mais cela n’apporte aucune information utile à l’étude de X + Y.