Données de composition
En statistiques, les données de composition, ou données compositionnelles, sont des données relatives décrivant des parties d'un ensemble, sous forme de pourcentage ou de proportions. Mathématiquement, les données compositionnelles appartiennent au simplexe.
Espace des données de composition
modifierEn 1982, John Aitchison définit les données compositionnelles comme étant des proportions d'un ensemble[1]. En particulier, une composition peut être représentée par un vecteur à composantes positives, dont la somme vaut le plus souvent 1. L'espace des données de composition est un simplexe:
où D est le nombre de parts (ou de composants). Puisque la seule information est le ratio entre les composants, l'information d'une composition est préservée par la multiplication par une constante positive. Ainsi, le simplexe peut toujours être considéré comme étant un simplexe standard, avec .
Références
modifier- John Aitchison, « The Statistical Analysis of Compositional Data », Journal of the Royal Statistical Society. Series B (Methodological), vol. 44, no 2, , p. 139–177 (DOI 10.1111/j.2517-6161.1982.tb01195.x)
- (en) Cet article est partiellement ou en totalité issu de l’article de Wikipédia en anglais intitulé « Compositional data » (voir la liste des auteurs).