1.
|
「編集」モードのフローチャートで、少なくとも 1 つの構成済みプロセス (選択プロセスなど) をサンプル・プロセス・ボックスに接続します。
|
3.
|
「入力」ドロップダウン・リストを使用して、サンプリングするセルを選択します。リストには、サンプル・プロセスに接続されたプロセスのすべての出力セルが含まれています。複数のソース・セルを使用するには、「複数セル」オプションを選択します。 複数のソース・セルが選択されている場合、それぞれの ソース・セルで同じ サンプリングが実行されます。
|
4.
|
「サンプル数」フィールドを使用して、入力セルごとに作成するサンプルの数を指定します。デフォルトでは、入力セルごとに 3 つのサンプルが作成され、デフォルト名の「サンプル1」、「サンプル2」、および「サンプル3」が使用されます。
|
5.
|
デフォルトのサンプル名を変更するには、「出力名」列でサンプルをダブルクリックしてから、新しい名前を入力します。 文字、数字、およびスペースの任意の組み合わせを使用できます。ピリオド (.) またはスラッシュ (/ または ¥) は使用しないでください。
|
|
パーセンテージでサンプル・サイズを定義する場合: 「パーセント (%) でサイズを指定」を選択した後、「サイズ」フィールドをダブルクリックし、各サンプルで使用するレコードのパーセンテージを指定します。 サンプルのサイズを制限する場合は、「最大データ件数」フィールドを使用します。 デフォルトは「無制限」です。「出力名」列にリストされているそれぞれのサンプルで繰り返すか、または「残りすべて」チェック・ボックスを使用して、残りのすべてのレコードをそのサンプルに割り当てます。 「残りすべて」が選択できるのは、1 つの出力セルに対してのみです。
|
|
各サンプル・サイズにレコード数を指定する場合: 「レコード数でサイズを指定」を選択した後、「最大データ件数」フィールドをダブルクリックして、最初のサンプル・グループに割り振るレコードの最大数を指定します。 「出力名」列の次のサンプルに「最大データ件数」を指定するか、または「残りすべて」チェック・ボックスを使用して、残りのすべてのレコードをそのサンプルに割り当てます。 「残りすべて」が選択できるのは、1 つの出力セルに対してのみです。
|
7.
|
8.
|
(オプション) 「サンプル・サイズ計算」をクリックして、キャンペーン結果を評価する際に、サンプル・サイズの統計的な重みの理解に役立つ計算器を使用します。エラー限度値を入力して、必要なサンプル・サイズを計算することにより、正確性のレベルを指定できます。あるいは、サンプル・サイズを入力して、結果として生じるエラー限度値を計算することもできます。 報告される結果の信頼性レベルは 95% です。
|
9.
|
「サンプリング方法」セクションで、以下のいずれかのオプションを使用して、サンプルの作成方法を指定します。
|
|
ランダム・サンプル: 統計的に有効なコントロール・グループまたはテスト・セットを作成する場合に、このオプションを使用します。このオプションは、指定されたシードに基づいて乱数発生ルーチンを使用して、サンプル・グループにレコードをランダムに割り当てます。シードについては、これらのステップの後半で説明しています。
|
|
レコードをソート順に各サンプルに配分: このオプションは、最初のレコードを最初のサンプルに、2 番目のレコードを 2 番目のサンプルに配置するという方法で、指定されたサンプル数になるまでレコードを順番に配置します。このプロセスは、すべてのレコードがサンプル・グループに割り当てられるまで繰り返されます。このオプションを使用するには、「ソート条件」オプションを指定して、グループへのレコードのソート方法を決定する必要があります。「ソート条件」オプションについては、これらのステップの後半で説明しています。
|
|
レコードをソート順に分割: このオプションは、最初の N 件のレコードを最初のサンプルに、次のレコードのセットを 2 番目のサンプルに割り振るという方法で、レコードを順番に割り振ります。このオプションは、ソートされた何らかのフィールド (例えば、累積の購買額またはモデル・スコアなど) に基づくトップ十分位数 (またはその他の何らかのサイズ) をベースとしてグループを作成する場合に有用です。このオプションを使用するには、「ソート条件」オプションを指定して、グループへのレコードのソート方法を決定する必要があります。「ソート条件」オプションについては、これらのステップの後半で説明しています。
|
10.
|
「ランダム・サンプル」を選択した場合は、ほとんどの場合にデフォルトのシードを受け入れるだけ済みます。
|
11.
|
「レコードをソート順に各サンプルに配分」または「レコードをソート順に分割」を選択した場合、レコードのソート方法を指定する必要があります。 以下のとおり、ソート順はレコードがサンプル・グループに割り振られる方法を決定します。
|
a.
|
b.
|
12.
|
デフォルトの 「プロセス名」および「出力セル名」を変更する場合は、「全般」タブをクリックします。デフォルトでは、出力セル名は、プロセス名、およびその後続のサンプル名と 1 桁の数字から構成されます。デフォルトの「セル・コード」を受け入れるか、「セル・コードを自動生成」ボックスのチェック・マークを外して、コードを手動で割り当てることができます。「説明」に、サンプル・プロセスの目的について明確な説明を入力します。
|
13.
|
「OK」をクリックします。
|
Copyright IBM Corporation 2015. All Rights Reserved.
|