Comprendre l'apprentissage dans Interact

Le module d'apprentissage Interact surveille le réponses des visiteurs aux offres, ainsi que les attributs des visiteurs. Le module d'apprentissage a deux modes généraux :

Exploration — le module d'apprentissage présente les offres afin afin de collecter suffisamment de données de réponse pour optimiser l'estimation utilisée plus tard au cours de l'exploitation. Les offres présentées pendant l’exploration ne correspondent pas nécessairement au choix optimal.

Exploitation — Lorsque suffisamment de données ont été collectées par la phase d'exploration, le module d'apprentissage utilise les probabilités pour vous aider à sélectionner les offres à proposer.

Le module d'apprentissage alterne entre l'exploration et l'exploitation en fonction de deux propriétés : un niveau de confiance que vous configurez avec la propriété confidenceLevel et une probabilité de présentation d'une offre aléatoire que vous configurez avec la propriété percentRandomSelection.

Vous pouvez définir le confidenceLevel sur un pourcentage qui représente le degré de certitude (ou de confiance) que doit avoir le module d'apprentissage avant que ses résultats pour une offre soient utilisés dans l'arbitrage. Au départ, lorsque le module d’apprentissage ne dispose d’aucune donnée, il s’appuie donc uniquement sur le score marketing. Lorsque chaque offre a été présentée autant de fois que cela a été défini dans minPresentCountThreshold, le module d'apprentissage passe en mode exploration. En l'absence d'une quantité importante de données, le module d’apprentissage n’est pas sûr que les pourcentages qu’il calcule sont corrects. Il reste alors par conséquent en mode d'exploration.

Le module d'apprentissage attribue des pondérations à chaque offre. Pur calculer les pondérations, il applique une formule qui prend comme base de départ le niveau de confiance configuré ainsi que les données historisées d'acceptation et les données de la session en cours. La formule établit une équilibre inhérent entre exploration et exploitation et renvoie la pondération adéquate.

Pour éviter que le système favorise trop l'offre optimale dès les premières phases, Interact présente une offre aléatoire en appliquant la propriété percentRandomSelection qui correspond à un pourcentage de temps. Cela force le module d'apprentissage à recommander d'autres offres que les plus certaines de réussir, afin de déterminer si d'autres offres réussissaient mieux si elles avaient une plus grande exposition. Par exemple, si vous configurez percentRandomSelection sur 5, cela signifie que pendant 5% du temps, le module d'apprentissage présente une offre aléatoire et ajoute les données de réponse à ses calculs.

Le module d'apprentissage détermine les offres présentées de la manière suivante.

Par exemple, le module d’apprentissage détermine qu’un visiteur a 30 % de chances d’accepter l’offre A et 70 % de chances d’accepter l’offre B et qu’il doit donc utiliser cette information. Selon la règle de traitement, le score marketing de l'offre A est de 75 et de 55 pour l'offre B. Toutefois, les calculs de l'étape 3 établissent que le score final de l'offre B est supérieur à celui de l'offre A. L'environnement d'exécution recommande donc l'offre B.

L'apprentissage est également basé sur la propriété recencyWeightingFactor et la propriété recencyWeightingPeriod. Ces propriétés vous permettent d'attribuer une pondération plus importante aux données les plus récentes. recencyWeightingFactor est le pourcentage de pondération des données récentes. recencyWeightingPeriod correspond à la durée considérée comme récente. Par exemple, vous configurez recencyWeightingFactor sur 0,30 et recencyWeightingPeriod sur 24. Cela signifie que les 24 heures de données précédentes représentent 30% de toutes les données prises en compte. Si vous avez l'équivalent d'une semaine de données, toutes les données servant à établir la moyenne sur les six premiers jours représentent 70% des données, tandis que le dernier jour correspond à 30% des données.