PCA
Applicable uniquement à PredictiveInsight.
Syntaxe
PCA(data)
Paramètres
data
Valeurs numériques dont les composants principaux doivent être calculés. Il peut s'agir d'une constante, d'une colonne, d'une plage de cibles ou d'une expression convertie comme l'une de ces valeurs.
Description
PCA effectue l'analyse des composants principaux de la plage de données spécifiée. Il recherche les vecteurs propres orthogonaux à la plage de données spécifiée par data à l'aide d'une décomposition en valeurs simples. Il renvoie une nouvelle colonne pour chacune des n colonnes spécifiées en entrée, plus une colonne supplémentaire. Les n premières colonnes contiennent les vecteurs propres (chaque vecteur propre est lu comme une ligne des n colonnes). La dernière colonne renvoyée contient les ampleurs correspondantes des valeurs propres. Les vecteurs propres sont classés en fonction de leur valeur propre.
*
Les valeurs manquantes (par exemple, les cibles vides et les cibles ???) sont comptées comme des zéros. Les colonnes les plus courtes de data sont complétées par des zéros jusqu'à la longueur de la colonne la plus longue.
Voici les détails du calcul de PCA :
*
Chacune des k lignes de data est un vecteur à n dimensions (n représente le nombre de colonnes dans data). Elles sont utilisées pour calculer la matrice de corrélation A comme suit :
*
La matrice de corrélation A n par n est décomposée en valeurs simples dans trois matrices :
Les lignes de U sont les vecteurs propres de A et est une matrice diagonale dans laquelle chaque élément diagonal représente l'ampleur des valeurs propres de A.
La fonction macro PCA renvoie U dans les n premières colonnes et les éléments diagonaux de dans la dernière colonne.
Exemples
Crée deux colonnes nommées TEMP et VX, contenant respectivement les valeurs -1 et 0.
Crée deux colonnes nomméesTEMP et VX. La colonne TEMP contient la valeur un et la colonne VX contient la valeur propre correspondante.
Crée quatre colonnes nommées TEMP, VX, VY et VZ. Les valeurs des trois colonnes contiennent un vecteur propre par ligne pour les données des colonnes V1-V3. La valeur de la colonne VZ contient les valeurs propres correspondantes.
Fonctions associées