ページの先頭です

フィナンシャルエンジニアリングレポート Vol.39

米国の株式と債券の相関に関する機械学習を用いた要因分析(1/2)

2023年12月
みずほリサーチ&テクノロジーズ マーケッツデジタルテクノロジー部 堤 太一

1.はじめに

近年、iDeCo(個人型確定拠出年金)やNISA(少額投資非課税制度)などの制度の普及により、自身で資産クラスを選択して運用する機会が増えてきた。その中でも株式と債券は主要な資産クラスとして位置づけられる。両者はそれぞれ固有のリスク(価格の振れ幅)とリターンの特性を持っており、株式は債券に比べ高いリターンが期待される一方、リスクも高いとされる。対照的に、債券は比較的安定した収益をもたらすが、株式に比べリターンが低い傾向にある。このような特性を持つ株式と債券が逆相関(負の相関)にある場合、適切に組み合わせることで投資リスクの分散効果によりリターンの安定性が高まることが期待される(図表1)。従って、株式と債券でポートフォリオを構築する際には、両者の「相関」が重要な役割を果たし、どのような要因が相関に影響を与えているかを把握しておくことは有用と言えるだろう。


図表1 2資産からなる投資機会集合*1のイメージ図(横軸:リスク、縦軸:リターン)
図1


この株式と債券の相関に影響を与える要因については、Ilmanen(2003)やEwan and Muhummed(2014)などの先行研究が挙げられる。しかし、新たな手法として機械学習を活用した同様の研究は、筆者の認識範囲内では少ないように思われる。そこで本稿では、Ilmanen(2003)を基に経済指標を特徴量として選定し、機械学習を活用して要因分析を試みる。なお、本分析の主眼は過去データを用いて株式と債券の相関に影響を与える要因を調査することであり、将来予測などの精度検証には関与しない点に留意されたい。

2. 分析手法

2-1 使用データ(目的変数と特徴量)について

この分析では、計測期間を1983年1月から2023年9月までの約40年間とし、対象地域を米国とした。以下に、目的変数と特徴量の概要について説明する。

[目的変数]

はじめに、株式と債券の関連性の強さを示す相関係数の推移について見てみよう。図表2は、代表的な指標であるMSCI米国指数(MSCI USA Index)*2と米国10年国債の月次リターン*3に基づく36カ月のローリング相関係数の推移である。計測期間の前半は「正の相関」、後半は長らく「負の相関」が続いた後、終盤にかけて再び「正の相関」となっており、「正の相関」⇒「負の相関」⇒「正の相関」というレジーム(状態)がシフトしているように見受けられる。このような推移を踏まえ、本分析では相関係数自体ではなく、「正の相関」と「負の相関」というレジーム(以下、相関レジーム)に影響を与えている要因が存在するという仮説を立てた。そのため、目的変数として相関係数の符号で分類した2値(正の相関:1、負の相関:0)を使用した。


図表2 株式と債券の36カ月ローリング相関係数
図2

  1. (資料)FRED, MSCIのHPを元に筆者作成

[特徴量]

先行研究のIlmanen(2003)では、株式と債券のリターンに影響を与えるとされる以下の4つの主要因に焦点を当てていた。本稿でもIlmanen(2003)に倣い、これらの主要因に着目し、関連する米国の経済指標を特徴量の選定対象とした。経済指標の選定にあたり、実質GDPや失業率などの特に広く利用され、かつ過去のデータが公開されているものを取り上げた*4(図表3)。


主要因

  • Business cycle or growth outlook(以下、経済の成長見通し)
  • Inflation environment(以下、インフレーション)
  • Volatility conditions(以下、ボラティリティ)
  • Monetary policy stance(以下、金融政策)

また、相関係数のローリングウィンドウが36カ月であることに合わせ、各指標における36カ月の変化率、変化幅、平均値を算出し、これらを図表3にように特徴量として指標毎に使い分けた。なおボラティリティについては、株式と債券のヒストリカルボラティリティ(HV)を用い、月次リターンによる36カ月ローリング標準偏差を求め、同期間の変化幅を特徴量とした。


図表3 使用した特徴量*5

左右スクロールで表全体を閲覧できます

  主要因 特徴量 データソース等
1 経済の成長見通し 実質GDP(変化率) FRED
2 失業率(変化幅) FRED
3 失業率(平均) FRED
4 インフレーション CPI(変化率) FRED
5 コアCPI(変化率) FRED
6 ボラティリティ 株式HV(変化幅) MSCI USA Index(MSCI)
7 債券HV(変化幅) 米国10年国債
(FRED, Swinkels(2019))
8 金融政策 10年金利(変化幅) FRED
9 イールドカーブ10Y-2Y(変化幅) FRED
10 イールドカーブ10Y-2Y(平均) FRED
11 M2(変化率) FRED

2-2 使用した機械学習モデルについて

本稿では、機械学習モデルの選定にあたり、図表4に概要を示したランダムフォレストとLightGBMの2つの決定木ベースのアンサンブル学習モデルを採用した。これらのモデルは、特徴量の標準化が必ずしも必要ではなく、直線的に表現できない非線形な関係性を考慮できる利点がある。

図表4 使用した機械学習モデルの概要*6

左右スクロールで表全体を閲覧できます

モデル 概要
ランダムフォレスト ブートストラップ法によりランダムに選択した特徴量の決定木モデルを複数作成し、それらの結果を元に多数決や平均を取るモデル。
LightGBM 決定木の構築時に既存のモデルの予測と目的変数の誤差に基づいて逐次的に学習を行う、勾配ブースティング手法の一種。同手法の代表的なモデルであるXGBoostをベースとした上で特徴量をヒストグラム化し、bin(階級)ごとの件数に基づいて分割することで学習の高速化を実現。

またアンサンブル学習は、複数の単純な学習器を組み合わせて、より強力な学習器を構築する手法だが、その内部の仕組みは複雑であり、説明が難しいとされている。そのため、今回の分析では説明可能なAI(eXplainable AI:XAI)の手法であるSHAP(SHapley Additive exPlanations)による分析を導入した。

2-3 SHAP分析について

SHAP分析とは協力ゲーム理論のShapley値*7の考え方を機械学習に応用したもので、予測値に対する各特徴量の寄与度をSHAP値として示す手法である。この手法には以下の特長がある*8


  • SHAP値の時系列解析:SHAP値は時点毎に算出されるため、特徴量とSHAP値の関係性を散布図など視覚的に捉えることが可能。同時に、どの特徴量が予測に大きく寄与しているかを時系列で把握できる。
  • 特徴量の重要度の評価:全時点におけるSHAP値の絶対値平均を特徴量の重要度として解釈できるため、各特徴量における重要度の比較評価ができる。
  • 加法性*9と柔軟性:SHAP値は加法性を持つため、複数の特徴量を組み合わせて集約表現することができる。

本稿ではこのSHAP値を活用して、特徴量の重要度、重要度の高い特徴量とSHAP値の関係、そして時系列推移については見やすさを優先するため主要因毎に集計したSHAP値で評価する*10

  • 本レポートは当部の取引先配布資料として作成しております。本稿におけるありうる誤りはすべて筆者個人に属します。
  • レポートに掲載されているあらゆる内容の無断転載・複製を禁じます。全ての内容は日本の著作権法及び国際条約により保護されています。

関連情報

過去のフィナンシャルエンジニアリングレポート


2022年3月
ポートフォリオの分散効果について
フィナンシャルエンジニアリングレポート Vol.38
2021年1月
米国社債のリターン特性と要因分解について
フィナンシャルエンジニアリングレポート Vol.37
2020年4月
スマートベータとリターン特性について
フィナンシャルエンジニアリングレポート Vol.36
ページの先頭へ