HISTOGRAM
Applicable uniquement à PredictiveInsight.
Syntaxe
HISTOGRAM(data, bin_col)
Paramètres
data
Plage de cibles dont l'histogramme doit être calculé. Il peut s'agir d'une valeur constante, d'une colonne, d'une plage de cibles ou d'une expression convertie comme l'une de ces valeurs. Toutes les colonnes de data doit être de même type (à savoir, numérique ou chaîne de texte). Pour la définition du format de data, voir la section "Paramètres des fonctions macro" du chapitre du présent document correspondant à votre produit IBM ® .
bin_col
Valeurs des limites de l'ensemble. Il peut s'agir d'une valeur constante, d'une colonne, d'une plage de cibles dans une colonne ou d'une expression convertie comme l'une de ces valeurs. Le type de données de bin_col doit être le même que celui de data. Pour la définition du format de data, voir la section "Paramètres des fonctions macro" du chapitre du présent document correspondant à votre produit IBM ® .
Description
HISTOGRAM calcule l'histogramme (c'est-à-dire fréquence d'occurrence des valeurs des divers ensembles) des valeurs de la plage de données spécifiée. Il renvoie une colonne unique avec le nombre de valeurs dans data comprises dans la plage de l'ensemble correspondant spécifiée par bin_col.
Pour les valeurs numériques, deux lignes adjacentes de bin_col constituent un "ensemble". Toute valeur de data comprise dans un ensemble est accumulée pour cet ensemble. La colonne en sortie contient le nombre final de valeurs de chaque ensemble. La valeur de la première limite est incluse dans l'ensemble ; la valeur de la deuxième limite est exclue. Par exemple, la paire de valeurs limites 1 et 2 contient le nombre de valeurs de data supérieures ou égales à 1 et inférieures à 2. La longueur de la colonne en sortie est un moins la longueur de bin_col.
Pour les chaînes de texte, seules les correspondances exactes de la chaîne de texte de bin_col sont comptées dans cet ensemble. La longueur de la colonne en sortie correspond à la longueur de bin_col. Pour les données numériques, si bin_col est scalaire (il contient une seule valeur de cible), le nombre d'éléments de data est compté.
*
La fonction macro HISTOGRAM place les points de données dans les ensembles de manière différente de l'histogramme d' IBM ® PredictiveInsight . L'histogramme exclut la valeur minimale (excepté pour l'ensemble le plus à gauche) et inclut la valeur maximale de chaque limite d'ensemble.
Exemples
Crée une colonne nommée TEMP contenant les valeurs 2 et 7.
Crée une colonne nommée TEMP contenant les valeurs 2, 1 et 0.
Crée une colonne nommée TEMP contenant quatre valeurs. La première valeur correspond au nombre de valeurs de la colonne V1 supérieures ou égales à 1 et inférieures à 25. La deuxième valeur correspond au nombre de valeurs de la colonne V1 supérieures ou égales à 25 et inférieures à 50. Les troisième et quatrième valeurs contiennent les nombres de valeurs dans les troisième et quatrième quartiles, respectivement.
Crée une colonne nommée TEMP, dans laquelle chaque valeur correspond au nombre de valeurs des colonnes V1 à V3 comprises dans les limites de l'ensemble spécifiées par la colonne V4.
Crée une colonne nommée TEMP contenant 10 valeurs. Chaque valeur représente le nombre de valeurs dans les lignes 50 à 100 des colonnes V1 à V5 comprises dans les limites de l'ensemble spécifiées par les lignes 1 à 10 de la colonne V6.
Fonctions associées