PCA_FEATURES
PredictiveInsight에만 적용됩니다.
구문
PCA_FEATURES(num_features, data [, PCA(base_data)])
매개변수
num_features
PCA(Principal Component Analysis)를 사용하여 지정된 데이터 범위에서 추출할 기능 수입니다. 이 값은 1부터 data에 지정된 데이터 범위의 열 수까지의 양수입니다.
data
기능을 추출할 숫자 값입니다. 이 매개변수는 열, 셀 범위 또는 이 중 하나로 평가되는 표현식일 수 있습니다. data의 형식 정의는 IBM® 제품용 본 안내서의 장에서 "매크로 함수 매개변수" 절을 참조하십시오.
PCA(base_data)
이 선택적 매개변수를 제공할 경우 PCA는 이 base_data 데이터 범위에서 수행되며, 생성되는 고유 벡터가 data 데이터 범위에서 기능을 추출하는 데 사용됩니다. base_data(data와 같음)의 형식 정의는 IBM® 제품용 본 안내서의 장에서 "매크로 함수 매개변수" 절을 참조하십시오. base_data의 열 수는 data의 열 수와 같아야 합니다.
설명
PCA_FEATURES는 지정된 데이터 범위에서 상위 num_features개의 기능을 추출하며, 데이터 범위 base_data(제공된 경우)에서 PCA에 의해 생성되는 고유 벡터를 사용하여 num_features개의 열을 리턴합니다. 제공되지 않은 경우, data를 사용하여 고유 벡터를 생성합니다. 이 경우 data는 PCA 이전에 제로 평균 단위 변형 방법을 사용하여 자동으로 정규화됩니다.
기능은 다음과 같이 계산됩니다.
*
data는 제로 평균 단위 변형 방법을 사용하여 자동으로 정규화됩니다. 즉, 다음과 같습니다.
PCA_FEATURES(num_features, data)
위 함수는 다음과 같습니다.
PCA_FEATURES(num_features, data,PCA(data, COL))
data에 대한 정규화는 자동으로 제공되지 않습니다. NORM_ZSCORE를 사용하여 data를 정규화하려면 다음을 지정하면 됩니다.
PCA_FEATURES(num_features, data, PCA(NORM_ZSCORE(data, COL)))
*
PCA는 정규화된 데이터 범위에서 수행되어 고유 벡터를 생성합니다. PCA 매크로 함수에 대해 설명된 세부사항을 참조하십시오. base_data가 제공되지 않은 경우 이 작업은 data에 대해 자동으로 수행됩니다. base_data가 제공된 경우 PCA 매크로 함수를 명시적으로 호출하여 수행됩니다.
*
데이터 범위(data)의 각 행()이 을 구성하는 상위 num_features(m)위의 고유 벡터를 기준으로 새 좌표계()로 변환됩니다.
*
변환된 데이터( - )의 k 행이 리턴됩니다(n개 열).
base_data 데이터 범위가 제공된 경우 열 수가 data 데이터 범위와 같아야 합니다. 그렇지 않으면 오류가 리턴됩니다.
*
데이터 범위에서 PCA를 계산하는 것은 연산 집약적이므로, PCA 계산 시 BUFFER 매크로 함수를 사용하는 것이 더 효율적입니다. 예: PCA_FEATURES(num_features, range, BUFFER(PCA(base_data)))
예제
데이터 범위 V1:V7의 기능을 5개 포함하는 TEMP, VW, VX, VYVZ라는 5개의 열을 새로 작성합니다. 데이터 범위 V1:V7은 변환 기초로 사용됩니다.
데이터 범위 V1:V4의 상위 세 개 기능을 포함하는 TEMP, VXVY라는 세 개의 열을 새로 작성합니다. 데이터 범위 V10:V13은 변환 기초로 사용됩니다.
데이터 범위 V1:V4의 상위 세 개 기능을 포함하는 TEMP, VXVY라는 세 개의 열을 새로 작성합니다. 데이터 범위 V10:V13은 변환 기초로 사용됩니다. 데이터 범위 V10:V13의 프린시펄 구성요소가 계산되면 해당 값은 상수로 저장됩니다. V10 - V13 열의 데이터 값이 변경되더라도 이 함수 정의에는 영향을 미치지 않습니다.
관련 함수