2.
|
6.
|
입력 목록을 사용하여 샘플링할 셀을 선택하십시오. 목록에는 샘플 프로세스에 연결된 프로세스의 모든 출력 셀이 포함됩니다. 둘 이상의 소스 셀을 사용하려면 다수의 셀 옵션을 선택하십시오. 둘 이상의 소스 셀이 선택된 경우 각 소스 셀에서 동일한 샘플링이 수행됩니다.
|
7.
|
샘플/출력 셀 수 필드를 사용하여 각 입력 셀에서 작성할 샘플 수를 지정하십시오. 기본적으로 각 입력 셀에 대해 세 개의 샘플이 작성되며 기본 이름은 Sample1, Sample2, Sample3입니다.
|
8.
|
기본 샘플 이름을 변경하려면 출력 이름 열에서 샘플을 두 번 클릭하고 새 이름을 입력하십시오. 문자, 숫자, 공백을 조합하여 사용할 수 있습니다. 마침표(.) 또는 슬래시(/ 또는 \)는 사용하지 마십시오.
|
|
백분율로 레코드 분할: %로 크기 지정을 선택하고 크기 필드를 두 번 클릭하여 각 샘플에 사용할 레코드의 백분율을 표시하십시오. 샘플 크기를 제한하려는 경우 최대 크기 필드를 사용하십시오. 기본값은 무제한입니다. 출력 이름 열에 나열된 각 샘플에 대해 반복하거나 나머지 모두 선택란을 사용하여 해당 샘플에 나머지 모든 레코드를 지정합니다. 한 출력 셀에 대해서만 나머지 모두를 선택할 수 있습니다.
|
|
레코드 수로 크기 지정: 레코드 수로 크기 지정을 선택하고 최대 크기 필드를 두 번 클릭하여 첫 번째 샘플 그룹에 지정할 최대 레코드 수를 지정합니다. 출력 이름 열의 다음 샘플에 대한 최대 크기를 지정하거나 나머지 모두 선택란을 사용하여 나머지 모든 레코드를 해당 샘플에 지정합니다. 한 출력 셀에 대해서만 나머지 모두를 선택할 수 있습니다.
|
10.
|
11.
|
샘플링 방법 섹션에서 샘플을 빌드하는 방법을 지정하십시오.
|
|
무작위 샘플: 이 옵션을 사용하여 통계적으로 유효한 제어 그룹 또는 테스트 세트를 작성합니다. 이 옵션은 지정된 시드에 기반하여 난수 생성기를 사용해 샘플 그룹에 무작위로 레코드를 지정합니다. 시드는 이 단계에서 나중에 설명합니다.
|
|
X개마다 하나씩: 이 옵션은 지정된 샘플 수만큼 첫 번째 샘플에 첫 번째 레코드를 넣고 두 번째 샘플에 두 번째 레코드를 넣습니다. 이 프로세스는 샘플 그룹에 모든 레코드를 할당할 때까지 반복됩니다. 이 옵션을 사용하려면 정렬 기준 옵션을 지정하여 그룹에서 레코드를 정렬하는 방법을 결정해야 합니다. 정렬 기준 옵션은 이 단계에서 나중에 설명합니다.
|
|
순차 부분: 이 옵션은 첫 번째 샘플에 처음 N개 레코드를, 두 번째 샘플에 다음 레코드 세트를 할당하는 식으로 작동합니다. 이 옵션은 일부 정렬된 필드(예: 누적 구매 또는 모델 점수)에 기반한 상위 10분위(또는 일부 다른 크기)에 따라 그룹을 작성한 경우에 유용합니다. 이 옵션을 사용하려면 정렬 기준 옵션을 지정하여 그룹에서 레코드를 정렬하는 방법을 결정해야 합니다. 정렬 기준 옵션은 이 단계에서 나중에 설명합니다.
|
12.
|
무작위 샘플을 선택한 경우 대부분 기본 시드를 승인할 수 있습니다.
|
13.
|
a.
|
b.
|
14.
|
기본 프로세스 이름 및 출력 셀 이름을 수정하려는 경우 일반 탭을 클릭하십시오. 기본적으로 출력 셀 이름은 프로세스 이름과 다음에 나오는 샘플 이름 및 숫자로 구성됩니다. 기본 셀 코드를 허용하거나 셀 코드 자동 생성 상자를 선택 취소하고 코드를 수동으로 지정할 수 있습니다. 참고를 입력하여 샘플 프로세스의 용도를 명확히 설명하십시오.
|
15.
|
확인을 클릭하십시오.
|
Copyright IBM Corporation 2015. All Rights Reserved.
|