メインコンテンツに移動
XLSTATはLumiveroグループに参加しています。詳しくはこちら

Excelでの順序ロジット・モデル・チュートリアル

このチュートリアルは、XLSTATソフトウェアを用いてExcel内で順序ロジット・モデル をセットアップして解釈する方法を示します。

順序ロジット・モデルの原理

順序ロジット・モデルは、順序モダリティによって説明される変数のための伝統的なロジット・モデルの代替からなります(この手法は、順序ロジスティック回帰とも呼ばれます)。これは、量的および質的記述変数の値が与えられた場合に、あるイベントが発生する累積確率をモデルすることができます。

このもモデルの目的は、以下のとおりです: 順序質的応答変数での変数の集合の効果を理解または予測したいとします。したがって、モダリティの順序を考慮に入れながら、説明変数によるモダリティの選択の影響度を理解することができます。このモデルは、累積確率に基づきます。

順序ロジット・モデルは、市場でのブランドに関する満足度に関するいくつかの記述変数の効果をモデルするのに役立ちます。ロジット・モデルを実行するためのダイアログ・ボックスは、バイナリ・ロジスティック回帰 または 多項ロジスティック回帰 で使用するそれと同じです。

順序ロジット・モデルを実行するデータセット

我々の事例は、より高い教育コースに申し込むか否かの決定に影響する要因を検討します。高校生に大学への進学を申し込むことについて、"可能性がない(unlikely)""、"やや可能性がある(somewhat likely)"、"とても可能性が高い(very likely)"のいずれであるかを質問します。 したがって、我々の応答変数は、3つのカテゴリを持ちます。説明変数は、両親の教育レベル、高校の種類、調査された高校生の平均成績です。

リサーチャーは、これらの3点の間の "距離"が等しくないことを信じる根拠を持ちます。 たとえば、"unlikely"と"somewhat likely"の間の距離は、"somewhat likely"と"very likely"の間の距離よりも短いかもしれません。これは、3元の変数が量的変数として取り扱えると仮定すると、ANCOVAではなく順序ロジット・モデルを使用することになります。

データと結果のExcelシートは、このチュートリアルの最初のリンクをクリックしてダウンロードできます。

XLSTATでの順序ロジット・モデルのセットアップ

順序ロジット・モデルのダイアログ・ボックスを開くには、XLSTAT / データ・モデリング / ロジスティック回帰 機能を選択します。 ボタンをクリックすると、ロジスティック回帰ダイアログ・ボックスが現れます。 Graphical user interface  Description automatically generated

応答タイプ順序オプションを選択することで、順序ロジット・モデルが有効になります。応答変数は、説明される変数が置かれている列に対応します。

2つの質的説明変数があります; 高校のタイプ (private/public) および両親の教育水準(the parents' education level)。1つの量的説明変数があります: 高校での平均成績(the average grade obtained in high school)。 我々は変数ラベルを選択したので、変数ラベル・オプションを選択する必要があります。

ダイアログ・ボックスの他のタブには、多数の他のオプションがあります (詳細は、XLSTATヘルプを参照)。

OK ボタンをクリックすると、計算が実行されて、結果が表示されます。

順序ロジット・モデルの結果の解釈

適合度統計表は、モデルの品質(または適合度)の複数の指標を提供します。これらの結果は、線形回帰やANOVA表のR² に相当します。最も重要な値は、**対数比(L.R.)**に関連する Chi² (カイ2乗)です。これは線形回帰のFisherのF検定に相当します: 我々は、変数が応答変数の変動を説明するための有意な情報量を提供するかどうかを評価しようします。我々の事例では、この確率が 0.0001よりも低いので、我々は変数が有意な情報量をもたらすと結論づけできます。 モデル・パラメータ の表は、モデルに関する最初の詳細を提供し、モデル品質への変数の寄与度を評価することを助けます。これは多項ロジスティック回帰とは多少異なります。実際、応答変数(ここでは大学進学)の各モダリティで定数を持つ場合、説明変数の係数は各モダリティに共通です。 したがって、平均成績が高いほど、大学進学の確率が高くなると結論できます。実際は、この係数がかなり負値であり、我々のモデルは、参照モダリティ2(大学進学)を持ちます。したがって、0と1モダリティの予測値での負の係数は、平均が高いほど、0と1モダリティが発生可能性が低いことを示します。さらに、カイ2乗検定に関連する確率を踏まえて、我々は、生徒の選択に最も影響する変数が、彼らの両親の教育水準であることがわかります。一方、高校の種類は、有意な影響を持ちません。

次に予測値と残差の表を見ることができます。最初の生徒We can see that the first high school student (Obs1)は大学への進学を希望しています(モダリティ2 )が、モデルはたぶん彼は希望しない(モダリティ0)っと予測しています。実際、モダリティ 0 ("unlikely") が値 0.549 で最も高にですが、"somewhat likely" または"verey likely" モダリティの確率は、それぞれ 0.359 と 0.092 と推定されています。

有意な変化は、予測モダリティと観察モダリティの間の値の変化が有意であることを示します。2番目の列有意は、予測モダリティの確率が他の確率よりも高いかどうかを示します。これらの2列は、ダイアログ・ボックスで有意度分析オプションがチェックされた場合に現れます。 トレーニング標本での分類表 (混同行列ともいう)は、各モダリティで正しく分類された(真陽性および真陰性)のパーセンテージを可視化することを助けます。たとえば、"unlikely" モダリティのオブザベーションは正しく分類されました (91.36%) が、一方、"somewhat likely"モダリティのオブザベーションは21.43%.だけ正しく分類されました。結局、モダリティ "very likely" (コード 2) のオブザベーションは1つも正しく分類されませんでした。

混同プロット は、上記の表を合成的に可視化できます。対角線上の灰色の四角形は、各モダリティで観察された数を表します。オレンジの四角形は、各モダリティでの予測された数を表します。 "unlikely" モダリティ (コード 0)は、"somewhat likely" モダリティ (コード1)や "very likely" モダリティ (コード 2)とは異なり、四角形の面がほとんど完全に重なっているもとがわかります。言い換えると、モダリティ"unlikely" (コード0)では、モデルは220個の観察されたオブザベーションのうち201個のオブザベーションを予測しました。

この記事は役に立ちましたか?

  • ウイ
  • いいえ