将联系人划分为样本组
要创建目标和控制组,请使用“样本”流程。有几个采样方法:随机创建在统计上有效的控制组或测试集。每隔 X 每隔一个记录将记录分配到一个样本组。顺序部分将一些记录分配到后续样本中。
1.
2.
3.
4.
5.
此时显示过程配置对话框。
6.
使用输入列表来选择您要采样的单元。该列表包含来自连接到样本过程的任何过程的所有输出单元。要使用多个源单元,请选择多个单元选项。 如果选择了多个源单元,那么在每个源单元上执行相同采样。
*
7.
使用样本/输出单元数字段来指定要为每个输入单元创建多少个样本。缺省情况下,将为每个输入单元创建三个样本,缺省名称为“Sample1”、“Sample2”和“Sample3”。
8.
要更改缺省样本名称,在输出名称列中双击样本,然后输入新的名称。您可以使用字母、数字和空格的任何组合。请勿使用句点 (.) 或斜杠(/ 或 \)。
*
9.
*
要按百分比来划分记录:请选择按百分比指定大小,然后双击大小字段来指示记录的百分比以用于每个样本。如果您希望限制样本大小,请使用最大记 录数字段。缺省值是无限。为列示在“输出名称”列中的每个样本选择副本,或者使用所有 剩余的复选框将所有剩余的记录分配给该样本。您只能为一个输出单位选择所有剩余的
*
要为每个样本大小指定记录数:请选择按记录数指定大小, 然后双击最大大小 字段来指定最大记录数以分配至第一个样本组。为“输出名称”列中的下一个样本指定最大大小 或者使用所有剩余的复选框以将所有剩余的记录分配给该样本。您只能为一个输出单位选择所有剩余的
(可选)单击样本大小计算器,然后使用该计算器来确定最佳样本大小。复制计算器中最小样本大小字段中的值,单击完成以关闭计算器,然后将该值粘贴到按记录数指定大小最大大小字段中。
10.
确保输出名称列表中每个样本定义了大小或者选中了所有剩余的
11.
采样方法部分中,指定如何构建样本:
*
随机采样:使用此选项来创建在统计上有效的控制组或测试集。此选项使用基于指定种子值的随机数生成器来随机地将记录分配到样本组。稍后在这些步骤中说明种子值。
*
每隔 X:此选项将第一个记录置于第一个样本,第二个记录置于第二个样本,直到指定的样本数。此流程将重复,直到已将所有记录分配到样本组。要使用此选项,您必须指定排序依据选项以确定如何将记录排序到组中。稍后在这些步骤中描述排序依据选项。
*
顺序部分:此选项将前 N 个记录分配到第一个样本,将下一组记录分配到第二个样本,以此类推。此选项可用于基于某些排序字段的最大十分位(或其他某些大小)创建组(例如,累计采购或模型分数)。 要使用此选项,您必须指定排序依据选项以确定如何将记录排序到组中。稍后在这些步骤中描述排序依据选项。
12.
如果选择随机采样,那么在大多数情况下,您可以接受缺省种子值。
在极少的情况下,您可能希望单击挑选来随机生成新种子值,或者在种子值字段中输入数值。 您可能需要使用新种子值的时机的示例是:
*
*
13.
如果您选择每隔 X顺序部分,那么必须指定排序顺序以确定将记录分配到样本组的方式:
a.
从下拉列表选择排序依据字段,或者单击派生字段来使用派生的字段。
b.
选择升序按升序将数字字段排序(低到高)以及按字母顺序将字母字段排序。如果选择降序,排序顺序将相反。
14.
如果您希望修改缺省的过程名称输出单元名称,请单击常规选项卡。缺省情况下,输出单元名称由后跟样本名称和一个数字的过程名称组成。您可以接受缺省单元代码或者取消选中自动生成单元代码框,然后手动分配代码。输入注释以清楚地描述样本过程的目的。
15.
单击确定
在流程图中,该过程已配置且已启用。您可以测试运行此过程以验证其是否返回您预期的结果。