HISTOGRAM
PredictiveInsight에만 적용됩니다.
구문
HISTOGRAM(data, bin_col)
매개변수
data
히스토그램을 계산할 셀 범위입니다. 이 매개변수는 상수 값, 열, 셀 범위 또는 이 중 하나로 평가되는 표현식일 수 있습니다. data의 모든 열은 같은 데이터 유형(숫자 또는 텍스트 문자열)이어야 합니다. data의 형식 정의는 IBM® 제품용 본 안내서의 장에서 "매크로 함수 매개변수" 절을 참조하십시오.
bin_col
구획 경계 값입니다. 이 매개변수는 상수 값, 열, 단일 열 셀 범위 또는 이 중 하나로 평가되는 표현식일 수 있습니다. bin_col의 데이터 유형은 data와 같아야 합니다. data의 형식 정의는 IBM® 제품용 본 안내서의 장에서 "매크로 함수 매개변수" 절을 참조하십시오.
설명
HISTOGRAM은 지정된 데이터 범위에 있는 값의 히스토그램(즉, 여러 구획에 있는 데이터 값의 발생 빈도)을 계산합니다. 이 함수는 bin_col에 지정된 해당 구획 범위에 속하는 data의 데이터 값 수를 포함하는 단일 열을 리턴합니다.
숫자 값의 경우 bin_col의 인접한 두 행이 각각 "구획"이 됩니다. 구획에 속하는 data 값은 해당 구획에 대해 누적됩니다. 출력 열에는 각 구획 내에 있는 최종 데이터 값 수가 포함됩니다. 첫 번째 경계 값은 구획에 포함되지만, 두 번째 경계 값은 제외됩니다. 예를 들어 경계 값 1과 2 쌍에는 1보다 크거나 같고 2보다 작은 모든 data 값 수가 포함됩니다. 출력 열의 길이는 bin_col의 길이보다 작습니다.
텍스트 문자열의 경우 bin_col의 텍스트 문자열과 정확하게 일치하는 텍스트 문자열만 해당 구획에서 계산됩니다. 출력 열의 길이는 bin_col의 길이입니다. 숫자 데이터의 경우 bin_col이 스칼라(단일 셀 값 포함)이면 data의 항목 수가 계산됩니다.
*
HISTOGRAM 매크로 함수는 IBM® PredictiveInsight 의 히스토그램과 다르게 데이터 요소를 구획에 배치합니다. 히스토그램 그래프의 경우 최소값(가장 왼쪽 구획의 경우 제외)은 제외되고 각 구획 경계의 최대값은 포함됩니다.
예제
27을 포함하는 TEMP라는 열을 새로 작성합니다.
2, 10을 포함하는 TEMP라는 열을 새로 작성합니다.
네 개의 값을 포함하는 TEMP라는 열을 새로 작성합니다. 첫 번째 값은 V1 열에서 1보다 크고 25보다 작은 값 수입니다. 두 번째 값은 V1 열에서 25보다 크고 50보다 작은 값 수입니다. 세 번째와 네 번째 값은 세 번째와 네 번째 4분위수의 개수를 각각 포함합니다.
각 값이 V4 열에 지정된 구획 경계 내에 속하는 V1 - V3 열의 값 수인 TEMP라는 열을 새로 작성합니다.
10개의 값을 포함하는 TEMP라는 열을 새로 작성합니다. 각 값은 V6 열의 1-10 행에 지정된 구획 경계 내에 속하는 V1 - V5 열 50-100 행의 데이터 값 수입니다.
관련 함수