HISTOGRAM
Sólo se aplica a PredictiveInsight.
Sintaxis
HISTOGRAM(data, bin_col)
Parámetros
data
El rango de celdas para calcular el histograma. Este puede ser un valor constante, una columna, un rango de celdas o una expresión que evalúa a uno de los elementos anteriores. Todas las columnas en data deben ser del mismo tipo de datos (es decir, numérico o cadena de texto). Para obtener la definición de formato de data, consulte la sección "Parámetros de función de macro" en el capítulo de esta guía para el producto de IBM® .
bin_col
Los valores para los límites de las agrupaciones. Puede ser un valor constante, una columna, un rango de celdas de una sola columna o una expresión que evalúa a cualquiera de los anteriores. El tipo de datos de bin_col debe ser igual al de data. Para obtener la definición de formato de data, consulte la sección "Parámetros de función de macro" en el capítulo de esta guía para el producto de IBM® .
Descripción
HISTOGRAM calcula el histograma (es decir, la frecuencia de aparición de los valores de datos en diversas agrupaciones) de los valores del rango de datos especificado. Devuelve una única columna con el número de valores de datos de data que caen dentro del rango de agrupación correspondiente especificado por bin_col.
Para valores numéricos, se forma una "agrupación" cada dos filas adyacentes de bin_col. Cualquier valor de data que esté dentro de una agrupación es acumulado para esa agrupación. La columna de salida contiene el último recuento del número de valores de datos dentro de cada agrupación. El primer valor límite está incluido en la agrupación; el segundo está excluido. Por ejemplo, el par de valores límite 1 y 2 contendrán un recuento de todos los valores en data mayores o iguales a 1 y menores que 2. La longitud de la columna de salida es uno menos que la longitud de bin_col.
Para cadenas de texto, solo cuentan en la agrupación las coincidencias exactas de la cadena de texto en bin_col. La longitud de la columna de salida es la longitud de bin_col. Para datos numéricos, si bin_col es escalar (es decir, contiene un único valor de celda), se cuenta el número de elementos en data.
*
La función de macro HISTOGRAM coloca puntos de datos en agrupaciones en forma diferente que el gráfico de histograma de IBM® PredictiveInsight . El gráfico del histograma excluye el mínimo (excepto por la agrupación más a la izquierda) e incluye el máximo de cada límite de agrupación.
Ejemplos
Crea una nueva columna denominada TEMP que contiene los valores 2 y 7.
Crea una nueva columna denominada TEMP que contiene los valores 2, 1 y 0.
Crea una nueva columna denominada TEMP que contiene cuatro valores. El primer valor es el número de valores de la columna V1 mayores o iguales a 1 y menores que 25. El segundo valor es el número de valores en la columna V1 mayores o iguales a 25 y menores que 50. El tercer y el cuarto valor contienen los recuentos del tercer y cuarto cuartil respectivamente.
Crea una nueva columna denominada TEMP, donde cada valor es un recuento del número de valores en las columnas V1 a V3 que se encuentran dentro de los límites de la agrupación especificados por la columna V4.
Crea una nueva columna denominada TEMP que contiene 10 valores. Cada valor es el número de valor de datos en las filas 50 a 100 de las columnas V1 a V5 que se encuentran dentro de los límites de la agrupación especificados por las filas 1 a 10 de la columna V6.
Funciones relacionadas