メインコンテンツに移動

ExcelでのCox比例ハザード・モデル・チュートリアル

このチュートリアルは、XLSTATソフトウェアを用いてExcel内でCox比例ハザード・モデル をセットアップして解釈する方法を説明します。

Cox比例ハザード・モデル

比例ハザード・モデルは、Cox (1972) により導入されたもので、古典的な回帰のスキームに基づいています。モデルの推定は偏尤度と呼ばれる最大尤度推定の特別なタイプで実行されます。モデルの係数の推定は、比例ハザード仮説の保持を仮定して得られます。 Cox回帰モデルは、患者の生存時間での予測変数の影響度を判断するのに有用な手法です。 これは生存データ、つまり、時間変数、打ち切り変数(バイナリ変数)、および説明変数に適用します。このモデルは、Cox (1972)が開発した、いわゆる最大尤度推定に基づきます。

Cox比例ハザード・モデルを実行するデータセット

データは、Edmunson J.H., Fleming T.R., Decker D.G., Malkasian G.D., Jefferies J.A., Webb M.J., and Kvols L.K (Different Chemotherapeutic Sensitivities and Host Factors Affecting Prognosis in Advanced Ovarian Carcinoma vs. Minimal Residual Disease. Cancer Treatment Reports, 63:241-47, 1979) の中で得られたもので、卵巣癌の2つの治療法を比較するランダム化試験を表します。我々の目的は、どの共変量が生存時間に影響するかを判断することです。 futime変数は時間データで、fustat 変数は状態変数です。共変量は、調査を開始するときの患者の年齢 (age)、処置群(rx)、ECOG パフォーマンス・ステータス (ecog.ps)、および残存疾患である質的変数 (resid.ds: 1 = no, 2 = yes)です。

XLSTATでのCox比例ハザード・モデルのセットアップ

XLSTATを開いて、XLSTAT / 高度な機能 / 生存時間分析 / Cox比例ハザード モデル・コマンドを選択してくだい。

XLSTAT Survival Analysis menu

ボタンをクリックすると、Cox比例ハザード・モデル・ボックスが現れます。Excel シートでデータを選択してください。時間データ は、患者が死亡するか打ち切られるまでの期間です。状態インジケータは、任意の時間で患者が死亡したか、打ち切られた (打ち切りコード = 0)か を記述しています。 3つの共変量が測定されており、量的変数フィールドで選択でき、1つは質的変数で、質的変数フィールドで選択できます。

XLSTAT Cox proportional Hazards in Excel, general tab

モデルの層化、個体の残差計算、同値の取り扱い法の選択などの他のオプションが、ダイアログ・ボックスの他のタブで選択できます。 OKをクリックすると計算が始まります。そして、結果が新しいExcelシートに表示されます。

Cox比例ハザード・モデルの結果の解釈

最初の表は、データの要約を表示します。観察時間の数(時間ステップ)が、オブザベーションの数に等しいことがわかります。したがって、Breslow 法を選んでもEfron 法を選んでも、結果は同じになります。

XLSTAT Cox Summary Statistics

そして、各変数の記述統計量が表示されます。

XLSTAT Cox regression descriptive statistics

次の表は、モデルの品質(または適合度)の複数の指標を提供します。これらの結果は、線形回帰やAONOVAでのR2や分散分析表に相当します。注目すべき最も重要な値は、対数比でのカイ2乗検定の確率です。これはFisherのF検定に相当します: 定義されたモデルを共変量の影響を持たない単純なモデルと比較することにより、変数が有意な情報をもたらすかどうかを評価しようとします。この事例では、確率が 0.05よりも低いので、変数によって有意な情報がもたらされていると結論づけることができます。

XLSTAT Cox GOF statistics

続く表は、モデルの詳細を提供します。この表は、さまざまな変数の効果を理解するのに役立ちます。 XLSTAT Cox regression coefficients

この表で、カイ2乗の確率を見て、生存時間に最も影響を与える変数はageであることがわかります。これは調査の開始時の患者の年齢が、生存時間に有意な効果を持つことを示します。ハザード比が、パラメータ推定の指数として得られます。 続く表は比例検定の結果です。 rho 列は正規化Schoenfeld 残差と時間ベクトルの間の相関 (我々の事例では: 1 - Kaplan Meier)を提供します。他の2つの列は、検定の統計量と関連するp値です。

XLSTAT Cox regression  proportionality test

すべての共変量について、p値がアルファ = 0.05よりも大きいことに注意してください。これは比例リスク仮定の違反がないことを示します。 最後に、累積ハザード関数が表示されます:

XLSTAT Cox regression Excel  Survival Distribution Function

この調査は、有意な影響を持つ共変量は、ageだけであることを示しました。関連する係数は正で、1年経るごとにリスクが 1.13 (ハザード比) 増加することが言えます。他の共変量は、生存時間に有意な効果を持ちません。

この記事は役に立ちましたか?

  • ウイ
  • いいえ