配置抽样进程
1.
在处于“编辑”模式下的流程图中,请确保“抽样”进程连接到一个或多个已配置的进程,这些进程的输出单元将用作“抽样”进程的输入。
2.
将显示进程配置对话框。
3.
使用“输入”下拉列表选择要采样的单元。 下拉列表中将列出连接到该抽样进程的任何进程中的所有输出单元。 若要使用多个源单元,请选择“多个单元”选项。 如果选择多个源单元,则会对每个源单元执行相同的采样。
*
4.
确定要为每个输入单元创建的样本数,并在“样本/输出单元数”字段中输入该数目。 默认情况下,会为每个输入单元创建 3 个样本,其默认名称为“Sample1”、“Sample2”和“Sample3”。
5.
若要更改默认样本名称,请在“输出名称”列下选择该样本。 将启用“编辑输出单元”部分。 将光标置于“单元名称”文本框中,然后键入相应内容以修改样本名称。 可使用字母、数字和空格的任意组合。 不要使用任何句点 (.) 或斜杠(/ 或 \)。
*
6.
若要说明希望如何指定样本的大小,请选择“按百分比指定大小”“按记录数指定大小”选项。
*
如果选择“按百分比指定大小”,则在单击“输出名称”列下的每个输出单元时,尽管您可以编辑这些值,系统也会自动计算“大小”“最大大小”
*
如果选择“按记录数指定大小”,则在单击“输出名称”列下的每个输出单元时,会启用“大小”列,但该列为空。
7.
“编辑输出单元”部分,在“最大记录数”字段中输入选定单元的最大记录数。
*
如果选择了“按记录数指定大小”,则还可修改输出单元信息。
8.
选中“所有剩余项”复选框,以指定由其他单元的大小来确定选定输出单元的大小;会向该输出单元分配计算其他单元之后的剩余记录数/百分比。 只能为其中一个输出单元选择“所有剩余项”
9.
(可选)单击“样本大小计算器”以使用“样本大小计算器”,它可帮助您在评估市场活动结果时了解样本大小的统计显著性。 可通过输入误差界并计算所需的样本大小来指定所需的准确度级别,或者可输入样本大小并计算将生成的误差界。 将在 95% 的信任级别报告结果。
10.
“采样方法”部分,选择您希望 Campaign 在执行采样时使用的方法。 可创建完全随机的样本,使用每第 x 个记录的样本,或创建分层样本。
*
随机采样 — 此选项使用基于指定种子的随机数生成器随机将记录放在样本组中。 若要创建统计上有效的控制组或测试集,应使用“随机采样”选项。
*
每隔 X — 此选项将第一个记录放在第一个样本中,将第二个记录放在第二个样本中,直到指定的样本数 ( x)。 第 ( x+1) 个记录进入第一个样本,第 ( x+2) 个记录进入第二个样本,依次类推。 若要使用“每隔 X”选项,必须指定记录排序顺序所基于的字段。
*
连续部分 — 此选项会创建样本组,方法是将前 N 个记录放在第一个样本中,将接下来的一组记录放在第二个样本中,依次类推。 此选项用于基于前十分之一(或一些其他大小)、基于一些排序的字段(例如累积购买、模型分数等)创建组。 若要使用“连续部分”选项,必须指定记录排序顺序所基于的字段。
11.
如果选择了“随机采样”,则可选择指定 Campaign 使用的默认种子之外的其他随机种子。 将数值直接输入“种子”字段或单击“挑选”随机选择新种子值。
在以下情形中,可能需要使用新随机样本种子值:
*
*
12.
如果选择“每隔 X”“连续部分”,则还必须指定排序字段和排序顺序。
a.
从下拉列表中选择“排序方式”字段,或通过单击“派生字段”使用派生字段。
b.
选择“升序”“降序”选项以指定将对记录进行排序的方向。 如果选择“升序”,则数值字段会以增长的顺序进行排序,字母字段会以字母顺序进行排序。 如果选择“降序”,则排序顺序相反。
13.
单击“常规”选项卡,以便在其中有选择地修改“进程名称”“输出单元”名称或“单元代码”,并输入关于进程的“注释”
14.
单击“确定”

将配置该进程,并且它在流程图中将显示为启用。 可测试该进程以验证它是否返回预期结果。



IBM Unica Campaign
 
8.5.0
For more information, see our support and community site: Customer Central