エクセルさえあれば簡単に自分のスコアを分析できる方法を教えます~重回帰分析、標準化偏回帰係数~

今回は、PCをお持ちの方であればほとんどの方が持っているであろう、エクセルを用いてスコア分析を行う方法を紹介します。

少し難しい統計の用語が出てきますが、計算方法自体は順を追って学んで行けば簡単なので、ぜひチャレンジしてみて下さい!

 

このブログの1記事目では、日本女子ツアーのデータを用いて70台を出すためにはアイアンショットとパッティングが重要であるとお話しました。

データ分析の記事はこちらから↓

70台を出すために練習するべきはアイアンショットとパッティングだ!

この記事では、平均スコアに対してドライビングディスタンス、フェアウェイキープ率、パーオン率、リカバリー率、平均パット数がそれぞれ何パーセント貢献しているのかを数値化しました。

この数値は、重回帰分析を行って算出された標準化偏回帰係数の割合を用いて算出しました。

そして、この数値の算出はエクセルの機能を駆使すればそれだけで完結してしまうので、みなさんにも自分で自分のスコアが分析できるように今回の記事でその方法を解説します。

 

スポンサーリンク

STEP1:まずは必要なデータを並べよう

それでは、まずはデータ分析に必要なデータをエクセルに入力してみましょう。

ここでは、スコアに対してそれを決定する要因としてパット数、パーオン率、リカバリー率を用います。

 

私は普段「GDOスコア」のアプリにスコアを入力していますが、各ホールのスコアとパット数しか入力していないので、上記の3つの変数で分析を行うことになります。

余裕のある方は、フェアウェイキープ率やOB・ウォーターハザードなどのペナルティの打数なんかも登録しておくとより正確な分析ができると思います。

※GDOアプリではリカバリー率を自動算出してくれませんが、パーオンしなかったホールの内、パー以上でホールアウトできた割合を計算すれば良いです。

ここでは仮に20ラウンド分のデータを入力すると上記のようになります。

ここで、スコアはパフォーマンスを表す変数で、目的変数(独立変数)と呼びます。これは表の左端に入力します。

そして、パット数・パーオン率・リカバリー率はスコアを決定する要因である変数で、説明変数(従属変数)と呼びます。これはスコアの右側に並べて入力します。

 

STEP2:データをZ得点化しよう

一応このデータのままでも重回帰分析はできるんですが、それぞれの説明変数がどれだけ目的変数に対して貢献しているのかというパーセンテージを算出するためにはデータのZ得点化が必要です。

そのままの「生のデータ」の状態では、パット数は打数ですし、パーオン率やリカバリー率はパーセンテージで数値として別物なので、同じように比較することができません。

そこで、データを同じ形に変換して比較できるようにするのがZ変換です。Z得点化の計算式は以下の通りです。

 

Z得点 = (素得点-平均値)/標準偏差

※計算式は統計WEB様より引用させていただきました。

 

例えば、B3のセルに入力されている85というスコアをZ得点化するにあたって、まずは20ラウンド分のスコアの平均値と標準偏差を算出します。

ここでは、データが並んでいる行の下に平均値と標準偏差の計算結果を出力することとします。

スコアの平均値は=AVERAGE(B3:B22)、標準偏差は=STDEV(B3:B22)で計算できますね。

ここで、素得点というのが85のことで、この数値からスコアの平均値を引いて、それをスコアの標準偏差で割った値がZ得点化した数値となります。

そのため、G3のセルにZ得点化したB3のセルの値を出力する時の計算式は=(B3-$B$23)/$B$24ですね。

G列に出力する他の数値も計算式は同様なので、ドラッグ&ドロップする際に平均値と標準偏差を参照するセルが変わってしまわないように行を表す数字と列を表すアルファベットの前に$を入力しておきましょう。

他の数値に関しても同様に計算ができたら、これで重回帰分析をして説明変数の貢献度を計算する準備が整いました。

 

STEP3:重回帰分析を行って標準化偏回帰係数を算出しよう

それでは、ここからはエクセルの分析ツールを使って実際に重回帰分析をしてみましょう。

エクセルのデータ→データ分析をクリックして、その中の回帰分析を選択します。

※デフォルトではエクセルにデータ分析はインストールされていないので、ファイル→オプション→アドイン→設定に進んで、分析ツールにチェックを入れれば使えるようになります。

入力Y範囲には目的変数が入るので、スコアのデータが入力されているG2:G22を選択します。

また、入力X範囲は説明変数が入るので、パット数・パーオン率・リカバリー率のデータが入力されているH2:J22を選択してOKをクリックします。

※データ名が入っているセルも含めて選択してラベルにチェックを入れると、結果が出力された時に分かりやすいのでそのようにします。

分析の結果は以下のように出力されます。

重要な数値だけ説明すると、まず「重決定 R2」というのが重決定係数と呼ばれるもので、これは今回使用した説明変数で目的変数を何パーセントくらい説明できるかを表しています。

このデータでは0.687なので、68.7%程度は上の3つの説明変数で目的変数を説明できているということになります。

つまり、30%以上はスコアに関係する他の要因があるということなので、もう少し適切な説明変数を増やしてあげた方が良いと言えますね(ドライビングディスタンス、フェアウェイキープ率など)。

 

次に、「P-値」というのが説明変数の有意性を表しています。

平たく言うと、この数値が0.05未満だとその説明変数は目的変数に関係があると考えて良いです。

 

最後に、今回の分析で肝となる「係数」ですが、これは偏回帰係数を表しています。

本来、重回帰分析では説明変数を用いて目的変数を予測する、以下のような予測式を作ることが目的です。

y = ax₁+bx₂+cx₃…

(y:目的変数、x₁, x₂, x₃…:説明変数、a, b, c…:偏回帰係数)

この予測式における係数が偏回帰係数です。

本来、偏回帰係数の絶対値の大きさでは単純に説明変数の貢献度を説明することはできませんが、今回はそれを可能にするためにあらかじめZ得点化を行い、標準化偏回帰係数を算出しています。

ちなみに、係数には±があると思いますが、係数が+なら説明変数が大きくなるとそれに比例して目的変数も大きくなる、係数が-なら説明変数が大きくなるとそれに比例して目的変数は小さくなるという関係性です。

つまり、パット数が増えるととスコアも増え、パーオン率・リカバリー率が上がるとスコアは減るという関係性であると分かります。

 

STEP4:標準化偏回帰係数を用いてそれぞれの説明変数の貢献度を算出しよう

それでは、最後に重回帰分析で求めた標準化偏回帰係数を用いて目的変数に対する説明変数の貢献度を算出しましょう。

説明変数の貢献度を計算するにあたって、標準化偏回帰係数の絶対値を用います。

そして、この絶対値の総和に対してそれぞれの係数の割合を算出することで、これを貢献度とみなします。それでは、実際に計算してみましょう。

パット数:0.629/(0.629+1.039+0.379)=0.307=30.7%

パーオン率:1.039/(0.629+1.039+0.379)=0.508=50.8%

リカバリー率:0.379/(0.629+1.039+0.379)=0.185=18.5%

この計算の結果、パット数が30.7%、パーオン率が50.8%、リカバリー率が18.5%スコアに貢献していることが分かりました。

以前、女子プロのデータを分析した時と同様に、このデータでもパーオン率が最も重要で、次にパット数が重要であるということが分かりました。

 

スポンサーリンク

まとめ

今回は、エクセルを使って簡単に自分のスコアを分析する方法を紹介しました。

説明の中では、色々な統計用語も使いましたが、実際にやっている計算は簡単なのでみなさんもぜひチャレンジしてみてください!

 

このスコア分析をするためには普段から最低限スコアの記録を取る必要があるので、ラウンド後にその記録を見て振り返る良い習慣がつくことにも繋がると思います。

そして、プレーヤーのレベルによっても分析結果は変わってくるかもしれないので、客観的にスコアを分析して練習の課題を見つけるのに役立てられたらと思います。

 

今回もお読みいただきありがとうございました。この記事が役に立ったらバナーを押して応援よろしくお願いします!

にほんブログ村 ゴルフブログへ
にほんブログ村