Configuration d'un processus d'échantillonnage
1.
Dans un diagramme en mode Edition, connectez au moins un processus configuré (tel qu'un processus Sélection) au processus d'échantillonnage.
2.
La boîte de dialogue de configuration des processus apparaît.
3.
A l'aide de la liste déroulante Source, sélectionnez les cibles à échantillonner. Cette liste inclut toutes les cibles de sortie de tout processus connecté au processus d'échantillonnage. Pour utiliser plusieurs cibles source, sélectionnez l'option Cibles multiples. Si vous sélectionnez plusieurs cibles source, le même échantillonnage est effectué sur chaque cible source.
*
4.
Spécifiez le nombre d'échantillons à créer pour chaque cible source, à l'aide de la zone # échant. à générer. Par défaut, trois échantillons sont créés pour chaque cible source, avec les noms par défaut "Sample1", "Sample2" et "Sample3."
5.
Pour modifier les noms d'échantillon par défaut, cliquez deux fois sur un échantillon dans la colonne Nom généré, puis entrez un nouveau nom. Vous pouvez utiliser toute combinaison de lettres, de nombres et d'espaces. N'utilisez pas de points (.) ou de barres obliques (/ ou \).
*
6.
*
Pour définir la taille de l'échantillon par pourcentage : sélectionnez Effectif en %, puis cliquez deux fois sur la zone Taille pour indiquer le pourcentage d'enregistrements à utiliser pour chaque échantillon. Utilisez la zone Effectif max. si vous souhaitez limiter la taille de l'échantillon. La valeur par défaut est Illimité. Répétez l'opération pour chaque échantillon de la colonne Nom généré ou cochez la case Tout le reste pour affecter tous les enregistrements restants à cet échantillon. Vous ne pouvez sélectionner Tout le reste que pour une cible générée.
*
Pour spécifier le nombre d'enregistrements pour chaque taille d'échantillon : sélectionnez Effectif en # d'enreg., puis cliquez deux fois sur la zone Effectif max. pour indiquer le nombre maximum d'enregistrements à allouer au premier groupe d'échantillons. Définissez l'Effectif max. pour l'échantillon suivant dans la colonne Nom généré ou cochez la case Tout le reste pour affecter tous les enregistrements restants à cet échantillon. Vous ne pouvez sélectionner Tout le reste que pour une cible générée.
7.
Vérifiez que pour chaque échantillon de la liste Nom généré, une taille est définie ou l'option Tout le reste est cochée.
8.
(Facultatif) Cliquez sur Calcul de l'effectif par échantillon afin d'utiliser la calculatrice pour vous aider à comprendre l'importance statistique des tailles d'échantillon dans l'évaluation des résultats de campagne. Vous pouvez spécifier un niveau de précision en entrant une borne d'erreur et en calculant la taille d'échantillonnage requise ou vous pouvez entrez une taille d'échantillonnage et calculer la borne d'erreur résultante. Les résultats sont indiqués avec un niveau de confiance de 95 %.
9.
Dans la section Méthode d'échantillonnage, indiquez comment les échantillons doivent être générés :
*
Aléatoire : Utilisez cette option pour créer des groupes de contrôle ou des jeux de test statistiquement valides. Cette option affecte des enregistrements aux groupes d'échantillons de manière aléatoire, à l'aide d'un générateur de nombre aléatoire et de la valeur de départ spécifiée. Les valeurs de départ sont expliquées ultérieurement plus loin dans cette procédure.
*
Tous les X enreg. : Cette option place le premier enregistrement dans le premier échantillon, le deuxième enregistrement dans le deuxième échantillon et ce, jusqu'au nombre d'échantillons spécifié. Ce processus se répète jusqu'à ce que tous les enregistrements aient été alloués à un groupe d'échantillons. Pour utiliser cette option, vous devez spécifier les options Trié par afin de déterminer comment les enregistrements sont triés en groupes. Les options Trié par sont expliquées plus loin dans cette procédure.
*
Séquentielle : Cette option alloue les N premiers enregistrements au premier échantillon, l'ensemble d'enregistrements suivant au deuxième échantillon et ainsi de suite. Cette option est utile pour créer des groupes en fonction du premier décile (ou d'une autre taille) et de la zone triée (par exemple, les achats cumulés ou les scores des modèles). Pour utiliser cette option, vous devez spécifier les options Trié par afin de déterminer comment les enregistrements sont triés en groupes. Les options Trié par sont expliquées plus loin dans cette procédure.
10.
Si vous avez sélectionné Aléatoire, dans la plupart des cas, vous pouvez simplement accepter la valeur de départ par défaut.
Dans certains cas assez rares, il se peut que vous souhaitiez cliquer sur Sélect. pour générer aléatoirement une nouvelle valeur de départ ou entrer une valeur numérique dans la zone Valeur de départ. Exemples de cas où vous pouvez avoir besoin d'utiliser une nouvelle valeur de départ :
*
*
11.
Si vous avez sélectionné Tous les X enreg. ou Séquentielle, vous devez indiquer comment les enregistrements seront triés. L'ordre de tri détermine la manière dont les enregistrements sont alloués aux groupes d'échantillons :
a.
Sélectionnez une zone Trié par dans la liste déroulante ou utilisez une zone dérivée en cliquant sur Zones dérivées.
b.
Sélectionnez Croissant pour trier les zones numériques dans l'ordre croissant (de faible à élevé) et les zones alphabétiques dans l'ordre alphabétique. Si vous choisissez Décroissant, l'ordre de tri est inversé.
12.
Cliquez sur l'onglet Général si vous souhaitez modifier la valeur par défaut de Nom du processus et Nom cible générée. Par défaut, les noms de cible générée sont constituées du nom du processus suivi du nom de l'échantillon et d'un chiffre. Vous pouvez accepter les codes cibles par défaut ou désélectionner la case Générer codes de cible auto. et affecter des codes manuellement. Entrez une note pour décrire précisément l'objet du processus d'échantillonnage.
13.
Le processus est configuré et activé dans le diagramme. Vous pouvez le tester pour vérifier qu'il renvoie les résultats escomptés.