学习属性
学习模块学习使用访问者属性和商品接受数据。您可以选择要监视的访问者属性。这些访问者属性可以是客户概要文件中的任何对象,包括您在交互式流程图中引用的维表中存储的属性,或者您实时收集的某些事件参数。
尽管您可以配置任意数量的属性来进行监视,但是 IBM® 建议您配置 10 个以内的静态与动态学习属性之间的学习属性,并遵循以下准则。
*
请勿选择类似属性。例如,如果您创建一个名为 HighValue 的属性,并且该属性由某个基于工资的计算来定义,那么不要同时选择 HighValue 和 Salary。类似属性无助于学习算法。
*
如果属性具有值范围,那么您必须选择一个确切值。例如,如果您希望使用工资作为属性,那么您应为每个工资范围提供一个特定值:范围 20,000-30,000 应为 A,30,001-40,000 应为 B,以此类推。
*
您可以跟踪的属性数量取决于您的性能需求以及您的 Interact 安装。 如果可以,请使用其他建模工具(如 PredictiveInsight)来确定前十个预测属性。您可以将学习模块配置为自动清理非预测性并且还具有性能成本的属性。
您可以通过同时定义监视的属性数量以及要对每个属性监视的值数量来管理性能。maxAttributeNames 属性定义您跟踪的访问者属性的最大数量。maxAttributeValues 属性定义了您为每个属性跟踪的值的最大数量。所有其他值都将被分配到 otherAttributeValue 属性的值所定义的类别中。 但是,学习引擎仅跟踪其遇到的第一个值。 例如,您正在跟踪访问者属性“眼睛颜色”。您仅关注于值“blue”、“brown”和“green”,因此您将 maxAttributeValues 设置为 3。但是前三个访问者的值为“blue”“brown”和“hazel”。 这意味着,绿色眼睛的所有访问者将被分配到 otherAttributeValue
您还可以使用动态学习属性,它使您可以更加具体地定义您的学习标准。动态学习属性使您可以作为单个条目来学习两个属性的组合。例如,请考虑以下概要文件信息:
如果您使用标准学习属性,那么您只能单独学习卡类型和余额。根据“卡类型”,访问者 1 和 2 将被一起分到同一个组;根据“卡余额”,访问者 2 和 4 将被分到同一个组。这可能不是商品接受行为的精确谓词。如果金卡持有人趋向于具有更高的余额,那么访问者 2 的行为可能完全不同于访问者 4,这将偏离标准学习属性。但是,如果您使用动态学习属性,将单独学习其中每个访问者,并且预测将更加精确。
如果您使用动态学习属性,并且访问者对某个属性具有两个有效值,那么学习模块将选择其发现的第一个值。
如果将 enablePruning 属性设置为 yes,那么学习模块将通过算法来确定哪些属性不可预测并且在计算权重时停止考虑这些属性。例如,如果您在跟踪一个表示头发颜色的属性,并且学习模块根据访问者的头发颜色确定不存在接受商品的模式,那么学习模块将停止考虑头发颜色属性。每次学习聚集过程运行时(由 aggregateStatsIntervalInMinutes 属性来定义),便对属性进行重新评估。 还将清理动态学习属性。