CV_FOLDS
PredictiveInsight のみに適用されます。
構文
CV_FOLDS(num_folds, data [, class_data] [seed])
パラメーター
num_folds
相互検証用に作成する折り返しの数。この値は 1 より大きい正の整数でなければなりません。 この値は 65,536 または data の行数のいずれか小さい方より 小さくなければなりません。
data
入力変数。 これは列、セル範囲、またはこれらのいずれかに評価される式になります。data のフォーマット定義については、このガイドの IBM ® 製品の章にある「マクロ関数パラメーター」セクションを参照してください。
class_data
このオプション・データ範囲が提供される場合、CV_FOLDS マクロ関数は 均等なクラス確率を維持しながら折り返しを作成します。 class_data の内容は、対応する各入力パターンの出力として使用されます。
class_data が単一列である場合、 CV_FOLDS は、指定された列に 複数の出力クラスの値が含まれていると想定します (つまり、 異なる各値は別個のクラスと見なされます)。class_data がデータ範囲である場合、 各出力列は異なるクラスとして見なされます。 (データ範囲では、各列の値は、パターンがそのクラスに属する場合は 1、 パターンがそのクラスに属さない場合は 0 です。)
class_data (data と同じ) のフォーマット定義については、 このガイドの IBM ® 製品の章にある「マクロ関数パラメーター」 セクションを参照してください。
seed
乱数発生ルーチンに使用するシード値。これは整数でなければなりません。
説明
CV_FOLDS は、 入力データを、指定された数の折り返しに均等に分割します。 各折り返しには、同数の入力パターンが含まれます。 2 値 1 から num_folds の範囲の折り返し数が含まれる新しい列を戻すことによって、 入力データ範囲の各行を 1 つの折り返しに配置します。
オプション・パラメーター class_data が提供される場合、 出力クラス情報を使用して相互検証の折り返しが作成され、出力クラス確率が維持されます。 つまり、各折り返し内では各出力クラスの確率は同じになります。 3
TEMP という名前で、 列 V1 の各行の値を含む新しい列を作成します。 列 TEMP には、3 つの異なる折り返しに対して値 1、2、および 3 が 含まれます。クラス確率は維持されません。 値 0 は乱数発生ルーチンのシードとして使用されます。
TEMP という名前で、 V1-V15 の中で最も短い列の各行の値を含む新しい列を作成します。 列 TEMP には、100 の異なる折り返しに対して値 1 から 100 が 含まれます。クラス確率は維持されません。ランダム・シードが選択されます。
TEMP という名前で、 V1-V10 の中で最も短い列の各行の値を含む新しい列を作成します。 列 TEMP には、50 の異なる折り返しに対して値 1 から 50 が 含まれます。列 V11 には出力クラスが含まれます。 各折り返しは同じ出力クラス確率を持ちます。 ランダム・シードが選択されます。
TEMP という名前で、 V1-V10 の中で最も短い列の各行の値を含む新しい列を作成します。 列 TEMP には、10 の異なる折り返しに対して値 1 から 10 が含まれます。 出力列 V11-V15 はそれぞれ、出力クラスを表します。 各折り返しは同じ出力クラス確率を持ちます。 値 96 は乱数発生ルーチンのシードとして使用されます。