EXTRACT
Applicable uniquement à PredictiveInsight.
Syntaxe
EXTRACT(predicate_col, data)
Paramètres
predicate_col
Colonne de valeurs booléennes ou expression convertie en une colonne de valeurs booléennes. Les valeurs booléennes sont interprétées comme des nulles ou non nulles. Cette colonne doit contenir au moins autant de lignes que la plage de données de laquelle les données sont extraites. Sinon, predicate_col constitue une limite du nombre de lignes traitées par la fonction macro EXTRACT (voir "Description" ci-dessous).
data
Valeurs à extraire. Il peut s'agir d'une valeur constante, d'une colonne, d'une plage de cibles ou d'une expression convertie comme l'une de ces valeurs. Pour la définition du format de data, voir la section "Paramètres des fonctions macro" du chapitre du présent document correspondant à votre produit IBM ® .
Description
EXTRACT renvoie les lignes de la plage de données spécifiée qui possèdent la valeur un dans la ligne correspondante de la colonne de prédicat. Cette fonction macro réduit la quantité de données en "excluant" toutes les lignes dont la valeur correspondante dans predicate_col est zéro. EXTRACT renvoie une nouvelle colonne par colonne d'entrée, chacune contenant les valeurs de la colonne d'entrée correspondante pour laquelle la valeur correspondante dans predicate_col est un. Les lignes de données extraites occupent les n premières cibles des colonnes en sortie, où n représente le nombre de uns dans predicate_col.
EXTRACT fonctionnant ligne par ligne, il génère un résultat pour chaque ligne jusqu'à la dernière valeur de la colonne la plus courte (c'est-à-dire la colonne la plus courte entre predicate_col et les colonnes de la plage de données data). Toutes les valeurs non nulles de predicate_col possèdent la valeur 1.
*
En général, une colonne de prédicat est créée à l'aide de l'une des fonctions macro de comparaison (par exemple, ==, >, <, ISEVEN, ISODD, etc.). Vous pouvez ensuite extraire les lignes qui vous intéressent d'une plage de données spécifiée à l'aide de la fonction macro EXTRACT. Cela peut être utile pour "éliminer " les points de données incorrects (par exemple, lorsqu'une valeur particulière dépasse la valeur maximale ou minimale d'une variable de données). Cela permet également de consolider tous les exemple d'une classe particulière (par exemple, si la colonne V3 contient des uns et des zéros pour l'une des classes en sortie, utilisez V4=EXTRACT(V3, V1:V2) pour extraire les entrées V1 et V2). EXTRACT condensant toutes les lignes extraites comme un bloc de données (à savoir, il remplit la plage de cibles VX[1:n}:VY), où n représente le nombre de lignes extraites, cette fonction est utile pour copier une plage de cibles de leurs emplacements de ligne actuels vers les lignes 1 à n de la feuille de calcul.
Exemples
Crée une colonne nommée TEMP contenant une copie de la colonne V1.
Crée deux colonnes nommées TEMP et VX contenant des valeurs dans les 51 premières cibles. Les valeurs de la colonne TEMP correspondent aux cibles 50 à 100 de la colonne V1 et les valeurs de la colonne VX correspondent aux cibles 50 à 100 de la colonne V2.
Crée deux colonnes nomméesTEMP et VX. Pour chaque ligne dont la valeur de la colonne V3 est un, la ligne correspondante dans les colonnes V1 et V2 est extraite dans les colonnes TEMP et VX, respectivement.
Crée une colonne nommée TEMP contenant toutes les valeurs de la colonne V1 supérieures aux valeurs correspondantes dans la colonne V2.
Crée deux colonnes nomméesTEMP et VX. Pour les lignes 10 à 20 dont la valeur de la colonne V3 est un, la ligne correspondante dans les colonnes V1 et V2 est extraite dans les colonnes TEMP et VX, respectivement.
Fonctions associées