与样本有关的配置问题
要在处理大量数据时不牺牲结果的质量,并同时在可接受的时间量内获得结果, 那么要满足会话中有关建议联系人组成的某些要求。
Optimize 所用的其中一项策略是将建议的联系人数据细分为与客户数量大致相等的随机子集。然后它独立地优化这些各个样本的建议联系人。如果您的硬件已配置并支持多个线索,那么将并行处理这些客户样本。
有一类问题可导致错误或非最佳的结果,这是客户样本方法的副作用。通过将 PCT 中的客户数除以配置参数 Optimize|AlgorithmTuning| CustomerSampleSize 的值来确定会话运行所用的客户样本数。重要的是存在与每个容量规则相匹配的足够多的建议联系人,以便相对于容量规则使用的每个功能,每个随机客户样本在统计上均类似。
例如,假定我们有 1 百万客户,并且配置的客户样本大小为 1000。此配置表示我们有 1000 个客户样本。设想我们将容量规则设置如下:最少 1 封电子邮件,最多 5000 封电子邮件。在此示例中,Optimize 将接受此规则约束并对其进行修改以在所有客户样本中广泛采用该规则。在此示例中,最多 5000 封电子邮件的约束将除以样本数,从而按最多 5 封电子邮件的约束来处理每个样本。但是,对于最少 1 封电子邮件的约束,我们将如何处理?我们不能对每个样本要求最少 1/1000 封电子邮件!
我们改为按最少 1 封电子邮件约束来处理随机挑选的一个样本,而其他 999 个样本则按没有最少电子邮件约束来处理。除非使用电子邮件的建议联系人不够多,无法确保所有 1000 个样本均能至少获得一封电子邮件,否则此过程运行一切良好。如果建议的联系人仅包含 500 个使用电子邮件的联系人,那么特定样本含有电子邮件的可能性将小于 50%。这意味着,即使对建议联系人设有最少 500 次联系,您面临会话退出但有错的可能性也仍在 50% 以上,因为无法达到最少次数。为避免出现此情况,应相对于样本数,较好地表示容量规则中使用的任何功能。