NORM_SIGMOID
Sólo se aplica a PredictiveInsight.
Sintaxis
NORM_SIGMOID(data [, keyword]) NORM_SIGMOID(data, mean, std [, keyword]) NORM_SIGMOID(data, base_data [, keyword])
Parámetros
data
Los valores para normalizar. Este puede ser un valor constante, una columna, un rango de celdas o una expresión que evalúe a cualquiera de los anteriores. Para obtener la definición de formato de data, consulte la sección "Parámetros de función de macro" en el capítulo de esta guía para el producto de IBM® .
mean, std
Estos dos parámetros proporcionan la desviación estándar y promedio a utilizar para la normalización. Deben ser constantes, excepto con la palabra clave ROW, en donde pueden ser constantes o columnas.
base_data
Este parámetro especifica un rango de datos a utilizar para calcular la desviación estándar y promedio a utilizar para la normalización de data.
keyword
Esta palabra clave opcional determina cómo se realiza el cálculo sobre el rango de datos de entrada. Seleccione una de las opciones siguientes:
ALL - Realiza el cálculo en todas las celdas de data (valor predeterminado)
COL - Realiza el cálculo por separado para cada columna de data
ROW - Realiza el cálculo por separado para cada fila de data
Para obtener más detalles sobre la utilización de las palabras claves en IBM® Campaign, consulte Especificaciones de formato.
Para obtener más detalles sobre la utilización de palabrasclave en IBM® PredictiveInsight, consulte Especificaciones de formato.
Descripción
NORM_SIGMOID calcula los valores normalizados del rango de datos especificado. Una normalización sigmoidal redistribuye datos a lo largo de una curva sigmoidal, devolviendo valores entre -1,0 y +1,0, incluido. Básicamente, todos los datos dentro de una desviación estándar del promedio están distribuidos de forma lineal en el rango medio del sigmoide. Los valores atípicos están representados en las colas del sigmoide. Esto le permite conservar puntos de datos de valores atípicos muy grandes sin tener que sacrificar la capacidad de discriminación entre los puntos que sean cercanos al promedio.
La normalización sigmoidal se realiza de la siguiente manera:
donde
y promedio y std se determinan de la siguiente manera:
*
Si mean y std se proporcionan, estos valores se utilizan para la desviación promedio y estándar, respectivamente. Si se proporciona estos parámetros con la palabra clave ROW, mean y std pueden ser columnas, especificando una desviación estándar y promedio para cada fila de data. Si min y max son columnas, las columnas deben tener la misma longitud que data o escalar (es decir, contener un único valor que se utiliza como una constante que se aplica a todos los valores de la correspondiente columna de data).
*
Si se proporciona base_data, se calculan la desviación promedio y estándar de este rango de datos y se utilizan para normalizar data. Las columnas de base_data deben contener dos o más valores de celda.
*
NORM_SIGMOID siempre devuelve un rango de datos con las mismas dimensiones que el rango de datos de entrada. La palabra clave ALL especifica que se debe calcular la desviación estándar y promedio sobre todo el rango de datos de entrada. La palabra clave COL especifica que se debe calcular una desviación estándar y promedio para cada columna de entrada y utilizar esos valores para normalizar esa columna. La palabra clave ROW especifica que se debe calcular una desviación estándar y promedio para cada fila del rango de datos especificado y utilizar esos valores para normalizar esa fila.
*
*
Para normalizar los datos utilizando el mismo rango base_data (por ejemplo, en funciones de usuario recortadas), haga de mean y std constantes (esto puede realizarse utilizando la función de macro CONSTANT).
Ejemplos
Crea una nueva columna denominada TEMP que contiene los valores -0,55, 0 y 0,55.(La desviación promedio y estándar [4 y 0.816] se calculan automáticamente a partir del rango de datos).
Crea una nueva columna denominada TEMP que contiene los valores -0,21, 0,21 y 0,55.(En esta ocasión la desviación promedio y estándar [3.5 y 1.2] se proporcionan como argumentos).
TEMP = NORM_SIGMOID(V1) o TEMP = NORM_SIGMOID(V1,ALL)
Crea una nueva columna denominada TEMP que contiene los valores normalizados del contenido de la columna V1. La desviación estándar y promedio que se utiliza para la normalización se calcula sobre la columna V1.
Crea tres nuevas columnas denominadas TEMP, VX y VY. Cada una contiene los valores normalizados del contenido de las columnas V1, V2 y V3, respectivamente. La desviación estándar y promedio que se utiliza para la normalización se calcula sobre las columnas V1, V2 y V3.
Crea tres nuevas columnas denominadas TEMP, VX y VY, cada una con valores en las filas 1 a 41. El contenido de la columna TEMP es los valores normalizados de las filas 10 a 50 de la columna V1, el contenido de la columna VX es los valores normalizados de las filas 10 a 50 de la columna V2 y el contenido de la columna VY es los valores normalizados de las filas 10 a 50 de la columna V3. La desviación promedio y estándar para la normalización se calculan sobre las filas 10 a 50 de las columnas V1-V3.
Crea tres nuevas columnas denominadas TEMP, VX y VY. Cada una contiene los valores normalizados del contenido de las columnas V1, V2 y V3, respectivamente. La desviación estándar y promedio que se utiliza para la normalización se calcula sobre la columna V4.
Crea tres nuevas columnas denominadas TEMP, VX y VY. Cada una contiene los valores normalizados del contenido de las columnas V1, V2 y V3, respectivamente. La desviación estándar y promedio que se utiliza para la normalización se calcula sobre las columnas V4-V8.
Crea tres nuevas columnas denominadas TEMP, VX y VY. Cada una contiene los valores normalizados del contenido de las columnas V1, V2 y V3, respectivamente. La desviación promedio y estándar utilizada para la normalización se calcula para cada columna independientemente, (es decir, se calcula una desviación estándar y promedio para la columna V1, se calcula otra desviación estándar y promedio para la columna V2, etc.).
Crea tres nuevas columnas denominadas TEMP, VX y VY, cada una con valores en las filas 1 a 41. El contenido de la columna TEMP es los valores normalizados de las filas 10 a 50 de la columna V1, el contenido de la columna VX es los valores normalizados de las filas 10 a 50 de la columna V2 y el contenido de la columna VY es los valores normalizados de las filas 10 a 50 de la columna V3. La desviación promedio y estándar para la normalización se calculan sobre las filas 10 a 50 de las columnas V1-V3. La desviación promedio y estándar para la normalización se calculan independientemente para cada columna.
Crea tres nuevas columnas denominadas TEMP, VX y VY. Cada una contiene los valores normalizados del contenido de las columnas V1, V2 y V3, respectivamente. La desviación estándar y promedio utilizada para la normalización se calcula para cada columna, de forma independiente, utilizando las columnas V4-V6 (es decir, una desviación estándar y promedio se calcula sobre la columna V4 para normalizar la columna V1, una desviación estándar y promedio independiente se calcula sobre la columna V5 para normalizar la columna V2, etc.).
Crea tres nuevas columnas denominadas TEMP, VX y VY. Cada una contiene los valores normalizados del contenido de las columnas V1, V2 y V3, respectivamente. La desviación promedio y estándar utilizada para la normalización se calcula independientemente sobre cada fila de las columnas V1, V2 y V3.
Crea tres nuevas columnas denominadas TEMP, VX y VY, cada una con valores en las filas 1 a 41. El contenido de la columna TEMP es los valores normalizados de las filas 10 a 50 de la columna V1, el contenido de la columna VX es los valores normalizados de las filas 10 a 50 de la columna V2 y el contenido de la columna VY es los valores normalizados de las filas 10 a 50 de la columna V3. La desviación promedio y estándar para la normalización se calculan sobre las filas 10 a 50 de las columnas V1-V3. La desviación promedio y estándar para la normalización se calculan sobre cada fila de las columnas V1-V3.
Crea tres nuevas columnas denominadas TEMP, VX y VY. Cada una contiene los valores normalizados del contenido de las columnas V1, V2 y V3, respectivamente. La desviación promedio y estándar utilizada para la normalización se calcula independientemente para cada fila de las columnas V4-V10.
Funciones relacionadas