CV_FOLDS
PredictiveInsight에만 적용됩니다.
구문
CV_FOLDS(num_folds, data [, class_data] [seed])
매개변수
num_folds
상호 유효성 검사를 위해 작성할 폴드 수입니다. 이 값은 1보다 큰 양수여야 합니다. 이 값은 65,536 미만 또는 data의 행 수 중에서 더 작은 값이어야 합니다.
data
입력 변수입니다. 이 매개변수는 열, 셀 범위 또는 이 중 하나로 평가되는 표현식일 수 있습니다. data의 형식 정의는 IBM® 제품용 본 안내서의 장에서 "매크로 함수 매개변수" 절을 참조하십시오.
class_data
이 선택적 데이터 범위를 제공할 경우, CV_FOLDS 매크로 함수가 클래스 확률을 유지하면서 폴드를 작성합니다. class_data의 컨텐츠는 해당 입력 패턴 각각에 대한 출력으로 사용됩니다.
class_data가 단일 열일 경우, CV_FOLDS는 지정된 열에 여러 출력 클래스에 대한 값이 포함되어 있다고 간주합니다. 즉, 각 구별 값은 별도의 클래스로 간주됩니다. class_data가 데이터 범위일 경우, 각 출력 열은 서로 다른 클래스로 간주됩니다. 데이터 범위를 사용할 경우 패턴이 해당 클래스에 속하면 각 열의 값이 1이고, 패턴이 해당 클래스에 속하지 않으면 0입니다.
class_data(data와 같음)의 형식 정의는 IBM® 제품용 본 안내서의 장에서 "매크로 함수 매개변수" 절을 참조하십시오.
seed
난수 생성기에 사용할 시드 값으로, 정수여야 합니다.
설명
CV_FOLDS는 입력 데이터를 지정된 폴드 수로 균등하게 나눕니다. 각 폴드에는 같은 수의 입력 패턴이 포함됩니다. 2 1 - num_folds 범위의 폴드 번호를 포함하는 새 열을 리턴하여 입력 데이터 범위의 각 행을 폴드에 배치합니다.
선택적 매개변수 class_data를 제공할 경우, 출력 클래스 정보를 사용하여 출력 클래스 확률이 유지되도록 상호 유효성 검사 폴드를 작성합니다. 즉, 각 폴드 내에서는 각 출력 클래스의 확률이 같습니다. 3
예제
V1 열의 각 행에 대한 값을 포함하는 TEMP라는 열을 새로 작성합니다. TEMP 열은 서로 다른 세 폴드에 대한 값 1, 2, 3을 포함합니다. 클래스 확률은 유지되지 않습니다. 값 0은 난수 생성기에 대한 시드로 사용됩니다.
V1-V15에서 가장 짧은 열의 각 행에 대한 값을 포함하는 TEMP라는 열을 새로 작성합니다. TEMP 열은 서로 다른 100개의 폴드에 대한 1-100 값을 포함합니다. 클래스 확률은 유지되지 않습니다. 랜덤 시드가 선택됩니다.
V1-V10에서 가장 짧은 열의 각 행에 대한 값을 포함하는 TEMP라는 열을 새로 작성합니다. TEMP 열은 서로 다른 50개의 폴드에 대한 1-50 값을 포함합니다. V11 열은 출력 클래스를 포함합니다. 각 폴드는 같은 출력 클래스 확률을 갖습니다. 랜덤 시드가 선택됩니다.
V1-V10에서 가장 짧은 열의 각 행에 대한 값을 포함하는 TEMP라는 열을 새로 작성합니다. TEMP 열은 서로 다른 10개의 폴드에 대한 1-10 값을 포함합니다. 출력 열 V11-V15 각각은 출력 클래스를 나타냅니다. 각 폴드는 같은 출력 클래스 확률을 갖습니다. 값 96은 난수 생성기에 대한 시드로 사용됩니다.