ページの先頭です

フィナンシャルエンジニアリングレポート Vol.39

米国の株式と債券の相関に関する機械学習を用いた要因分析(2/2)

2023年12月
みずほリサーチ&テクノロジーズ マーケッツデジタルテクノロジー部 堤 太一

3. 分析結果

3-1 特徴量の重要度について

最初に、ランダムフォレストとLightGBM におけるSHAP値に基づく特徴量の重要度について評価する。図表5はその結果であるが、特に注目すべきは、両モデルでコアCPI(変化率)の重要度が際立って高いことである。このことから、株式と債券の相関において、コアCPIが重要な指標であることが示唆される。また、実質GDP(変化率)も両モデルで一定の重要度を持ち、コアCPI(変化率)に次いで大きな影響を持つことが確認された。一方で、「ボラティリティ」要因や「金融政策」要因に関連した特徴量の重要度は、M2(変化率)が上位にあるものの相対的に低い結果となった。つまり、これらの要因が株式と債券の相関に与える影響は限定的であることが示唆される。


図表5 SHAP値による特徴量の重要度
図5

  1. (資料)FRED, MSCIのHPを元に筆者作成

3-2 特徴量とSHAP値との関係について

次に、重要度の高い特徴量とSHAP値との関係について焦点を当て、その関連性を評価する。図表6はコアCPI(変化率)と実質GDP(変化率)と、ランダムフォレストによる各々のSHAP値(≒相関レジーム)との関係を散布図で示したものである*11。両特徴量ともにSHAP値に対して正の相関関係となっていた。つまり、これらの特徴量が大きくなるにつれて、株式と債券が「正の相関」になる傾向があると言える。更に散布図を詳細に見ると、両特徴量ともに+3%を超えるあたりからSHAP値が正の値になり、「正の相関」に向かう可能性が高まると考えられる。


図表6 重要度の高い特徴量とSHAP値の散布図(X軸:特徴量、Y軸:SHAP値)
図6

  1. (資料)FRED, MSCIのHPを元に筆者作成

3-3 SHAP値の時系列推移について

図表7はランダムフォレストによるSHAP値を主要因毎に集計し、その時系列推移を示したものである。最初に、計測期間の前半(1983年から2000年後半)に焦点を当てると、計測開始から1998年のロシア通貨危機発生頃まで、「インフレーション」要因が大きく寄与していた。その後、1998年以降の「負の相関」への転換期において、相関の主要ドライバーが「インフレーション」要因から「経済の成長見通し」要因にシフトしたのが確認できる。このシフト以降、「経済の成長見通し」要因の寄与度がかなりの部分を占めるようになり、「インフレーション」要因は小幅ながらマイナス値に転じていた。また、同時期に若干ではあるが「ボラティリティ」要因における寄与度の上昇も確認できる。「金融政策」要因は1990年頃から寄与度が上昇して、その後安定的に推移していた。

次に、計測期間の後半(2000年後半から2023年9月)を見ると、「インフレーション」要因がコロナショックのあった2020年頃まで長らく「負の相関」を牽引していた。その間、2008年に金融危機が発生したが、影響は限定的だったことが伺える。コロナショック後の「正の相関」への転換期においては、「金融政策」要因が大きく上昇し、「ボラティリティ」要因も若干上昇したものの、2022年に再び「正の相関」へ転換してからは、再び「インフレーション」要因が寄与する結果となった。また、「経済の成長見通し」要因については、「負の相関」の間では比較的安定的に推移していたが、「正の相関」に転換してから足元に至るまで、ほぼゼロで推移しているのが確認できる。これらの結果を踏まえると、足元における寄与度の状況は、かつての米国において高インフレ期だったと言われている1980年代前半(計測開始時点)の特徴と類似していることが伺える。


図表7 主要因別SHAP値の時系列推移(第2軸:相関レジーム(正:1、負:0))
図7

  1. (資料)FRED, MSCIのHPを元に筆者作成

4. 終わりに

本稿では、米国の経済指標を特徴量として取り上げ、機械学習(決定木+SHAP分析)による、米国の株式と債券の相関に関する要因分析を行った。

特徴量の重要度については、モデル間での大きな違いは見られず、コアCPI(変化率)が最も重要で、次いで実質GDP(変化率)が株式と債券の相関に大きな影響を与えていることが示された。これらの特徴量が上昇すると、株式と債券の相関が正に向かい、いずれも(年率)+3%を超えると「正の相関」の可能性が高まる傾向にある。この傾向を踏まえておくことは、株式と債券における相関の動向を見通していく上で有用だと考えている。

また、SHAP値の時系列推移については、時系列全体で「インフレーション」要因が大きく寄与する結果となったが、相関レジームの転換期では、「経済の成長見通し」要因や「金融政策」要因の上昇も確認された。この結果から、局面によっては特徴量の重要度に関わらず、ある特定のSHAP値が上昇する可能性が示唆される。この観点を踏まえ、今後も特徴量の重要度だけでなくSHAP値の動向について引き続き注視していきたい。

今後の課題として、本稿ではIlmanen(2003)の4つの主要因に焦点を当てたが、例えば地政学的要因など、他にも相関レジームに影響を与える要因が存在するかもしれない。そのため、引き続き新たに有用と思われる要因を探索し、影響の確認を行っていくことが必要だと考えている。また、本稿では相関レジームを分析対象(目的変数)としたが、相関係数自体を対象とした場合についても同様に分析し、双方の比較検証を行うことも重要と考えている。さらに、分析手法に関しては、SHAP分析を広範な機械学習モデルに適用して本分析結果の信頼性を検証すると同時に、SHAP分析以外のXAI手法を導入して異なる視点からの評価を行うことが、今後取り組むべき課題と考えている。

参考文献

  1. [1]毛利拓也(2023), 「LightGBM予測モデル実装ハンドブック」, 秀和システム
  2. [2]Antti Ilmanen(2003), "Stock-Bond Correlations", The Journal of Fixed Income, September 2003
  3. [3]Ewan Rankin and Muhummed Shah Idil(2014), "A Century of Stock-Bond Correlations", Reserve Bank of Australia Bulletin, September 2014, (PDF/450KB)
  4. [4]Scott Lundberg and Su-In Lee(2017), "A Unified Approach to Interpreting Model Predictions", NIPS 2017, December 2017
  5. [5]Laurens Swinkels(2019), "Treasury Bond Return Data Starting in 1962"

  1. *1投資家が選択できるリターンとリスクの組み合わせ全体を指す。図表1は株式と債券の2資産に限ったものではない点に留意されたい。
  2. *2MSCIのHP(https://www.msci.com/end-of-day-data-search)から取得可能である。
  3. *3リターンデータは公開されていないので、近似的にSwinkels(2019)のメソドロジーを使用してリターンを算出した。このメソドロジーではFRED(Federal Reserve Economic Data, https://fred.stlouisfed.org/)から入手可能である10年金利を用いている。
  4. *4いずれもMSCIのHP(https://www.msci.com/end-of-day-data-search)及びFRED(https://fred.stlouisfed.org/)から取得可能である。
  5. *5「実質GDP」は四半期毎の指標であるため、簡便的にその四半期間中は前年同月比が一定という仮定をおいて月次データを補間した。また、「失業率」にはU1~U6までの尺度があるが、その中で最も一般的に使用されるU3を使用した。なお、「コアCPI」は食料品やエネルギーを除いた消費者物価指数、「M2」は通貨供給量(マネーサプライ)の一種で現金や当座預金及びMMFなどを含む。変化率は年率換算したものを使用。
  6. *6どちらの手法もPythonのライブラリを利用。ハイパーパラメータは簡易なグリッドサーチより設定。
  7. *7Shapley値とは、協力して得られた報酬を各プレイヤーの貢献度に応じて公平に分配することで得られる数値。
  8. *8その他、特徴量同士の相互作用について評価できることも特長として挙げられるが、手元でPythonのshap.dependence_plotを用いて評価を行ったところ、特段目立った傾向が見られなかったので本稿では言及しない。
  9. *9全体の合計が各要素の合計と等しくなる性質のこと。
  10. *10Pythonにおけるランダムフォレストの分類用クラスであるRandomForestClassifierは、乱数シードによって結果が若干変化するので、安定した結果を得るために100個の異なる乱数シードを使用して計算したSHAP値の平均を用いた。一方で、LightGBMの分類用クラスであるLGBMClassifierは乱数シードを変えても安定した結果を得たので、デフォルト値(None)のままとした。
  11. *11ランダムフォレスト及びLightGBMによる散布図の特徴で大きな相違はなかったので、ランダムフォレストのみによる散布図を表示(以降の図表も同様の理由でランダムフォレストのみを表示)。
  • 本レポートは当部の取引先配布資料として作成しております。本稿におけるありうる誤りはすべて筆者個人に属します。
  • レポートに掲載されているあらゆる内容の無断転載・複製を禁じます。全ての内容は日本の著作権法及び国際条約により保護されています。

関連情報

過去のフィナンシャルエンジニアリングレポート


2022年3月
ポートフォリオの分散効果について
フィナンシャルエンジニアリングレポート Vol.38
2021年1月
米国社債のリターン特性と要因分解について
フィナンシャルエンジニアリングレポート Vol.37
2020年4月
スマートベータとリターン特性について
フィナンシャルエンジニアリングレポート Vol.36
ページの先頭へ