|
La plage de données data est automatiquement normalisée à l'aide de la méthode "moyenne nulle, variance unité". En d'autres termes,
|
|
L'analyse des composants principaux est effectuée sur la plage de données normalisée pour générer ses vecteurs propres (voir les informations détaillées de la fonction macro PCA). Cette opération est automatique pour data si base_data n'est pas fourni. Elle est effectuée par l'appel explicite de la fonction macro PCA si base_data est fourni.
|
|
Chaque ligne () de la plage de données (data) est transformée en nouveau système de coordonnées () en fonction des num_features (m) premiers vecteurs propres qui composent :
|
|
|
Le calcul de PCA sur une plage de données pouvant s'avérer intensif, il est bien plus efficace d'utiliser la fonction macro BUFFER sur le caclcul PCA. Par exemple : PCA_FEATURES(num_features, range, BUFFER(PCA(base_data)))
|
Crée cinq colonnes nommées TEMP, VW, VX, VY et VZ contenant les cinq premières fonctions de la plage de données V1:V7. La plage de données V1:V7 est utilisée comme base de la transformation.
|
Crée trois colonnes nommées TEMP, VX et VY, contenant les trois premières fonctions de la plage de données V1:V4. La plage de données V10:V13 est utilisée comme base de la transformation.
|
Crée trois colonnes nommées TEMP, VX et VY, contenant les trois premières fonctions de la plage de données V1:V4. La plage de données V10:V13 est utilisée comme base de la transformation. Une fois que les composants principaux de la plage de données V10:V13 ont été calculés, ces valeurs sont stockées comme constantes. Si les valeurs de données des colonnes V10 à V13 sont changées, ils n'ont aucun impact sur cette définition de fonction.
|
Copyright IBM Corporation 2015. All Rights Reserved.
|