得点推定式
2019.10.11
総合政策学部准教授 河本 進
総合政策学部准教授 河本 進
今年のプロ野球は、9月30日に公式戦の全日程を終了した。本学がある仙台市を本拠地とする東北楽天ゴールデンイーグルスは、リーグ戦を3位で終えて、クライマックスシリーズに進出したが、ファーストステージで福岡ソフトバンクホークスに破れてシーズンを終了した。我が中日ドラゴンズは、リーグ戦を5位で終えて、クライマックスシリーズに進出することなく、シーズンを終了した。
日本野球機構ではオフィシャルサイト(※1)に勝敗の記録は当然であるが、チーム打撃成績として、打率および得点?打数?安打?二塁打?三塁打?本塁打?盗塁?盗塁刺?犠打?犠飛?四球?故意四?死球?三振?併殺打の数などを集計したデータを公式記録として公表している。このチーム打撃成績のデータによるとドラゴンズの打率はリーグで最高であった。また、ドラゴンズの年間失点もリーグ最小であった。このように高打率で失点も少ないドラゴンズであるが、シーズンを終えての順位が5位なのは何故なのであろうか。実は、年間得点は5位だったのである。
では、打率の高いドラゴンズの得点は何故少ないのであろうか。広い本拠地ナゴヤドームの影響なのか、ドラゴンズの本塁打数はリーグ最小である。あたりまえだが、本塁打が出れば1点以上の得点が確実に入るのである。また、安打がでれば、打点を挙げたり、出塁したりすることで得点に影響を与えることになる。それでは、1本の安打は得点にどれくらいの影響を与えるのであろうか。Jim Furtadoはメジャーリーグのチームの打撃成績を統計学の分析手法である重回帰分析を使って分析して、公式記録から打者がどれだけの得点を生み出したかを推定する得点推定式XR(eXtrapolated Runs)を提案した(※2)。
XR=0.5×単打+0.72×二塁打+1.04×三塁打+1.44×本塁打
+0.34×(四球+死球-故意四)+0.25×故意四+0.18×盗塁-0.32×盗塁死
-0.09×(打数-安打-三振)-0.098×三振-0.37×併殺打+0.37×犠飛+0.04×犠打
得点推定式XRは、シーズン全体の得点のうち、単打1本が得点を0.5点生み出し、本塁打1本が確実に入る1点に加えて得点を0.44点生み出していることを示している。逆に、アウトになれば、生み出される得点を減らしていることを示している。盗塁に関しては、64%を超える確率で盗塁を成功させれば、プラスの得点が生み出されたと解釈することもできる。そして、各チームの公式記録のデータを得点推定式XRに入力すれば、各チームの生み出した得点を推定できるのである。表1は2019年度の各チームの得点と得点推定式XRで計算した得点の一覧表である。もちろん、公式記録で分かっているチームの得点を推定しても意味はないかも知れないが、チームを構成する各打者の公式記録のデータを得点推定式XRに入力すると、各打者の生み出した得点も推定することができる。つまり、チームの総得点を各打者が生み出した得点に分解できるのである。
ここでは、Jim Furtadoがメジャーリーグのデータより開発した得点推定式XRを紹介したが、日本のプロ野球のデータに適合した日本版XRが『勝てる野球の統計学 セイバーメトリクス』(※3)で提案されている。また、蛭川皓平は「得点推定式を読み解く」(※4)で、XRだけでなく様々な得点推定式の解説をしている。前述した通り、XRは重回帰分析を使って得た得点推定式である。重回帰分析はEXCELにデータを入力すれば,分析ツールで容易に計算結果を出すことができる。EXCELにデータを入力して、様々な得点推定式を作ってみてはいかがでしょうか。
表1:2019年度の各チームの得点と得点推定式XRで計算した得点
(※1)「日本野球機構オフィシャルサイト」 http://npb.jp/
(※2)Jim Furtado「Introducing XR」
http://www.baseballthinkfactory.org/btf/scholars/furtado/articles/IntroducingXR.htm
(※3)鳥越規央,データスタジアム野球事業部『勝てる野球の統計学 セイバーメトリクス』岩波書店、2014
(※4)蛭川皓平「得点推定式を読み解く」、『セイバーメトリクス?リポート4』水曜社、2015
日本野球機構ではオフィシャルサイト(※1)に勝敗の記録は当然であるが、チーム打撃成績として、打率および得点?打数?安打?二塁打?三塁打?本塁打?盗塁?盗塁刺?犠打?犠飛?四球?故意四?死球?三振?併殺打の数などを集計したデータを公式記録として公表している。このチーム打撃成績のデータによるとドラゴンズの打率はリーグで最高であった。また、ドラゴンズの年間失点もリーグ最小であった。このように高打率で失点も少ないドラゴンズであるが、シーズンを終えての順位が5位なのは何故なのであろうか。実は、年間得点は5位だったのである。
では、打率の高いドラゴンズの得点は何故少ないのであろうか。広い本拠地ナゴヤドームの影響なのか、ドラゴンズの本塁打数はリーグ最小である。あたりまえだが、本塁打が出れば1点以上の得点が確実に入るのである。また、安打がでれば、打点を挙げたり、出塁したりすることで得点に影響を与えることになる。それでは、1本の安打は得点にどれくらいの影響を与えるのであろうか。Jim Furtadoはメジャーリーグのチームの打撃成績を統計学の分析手法である重回帰分析を使って分析して、公式記録から打者がどれだけの得点を生み出したかを推定する得点推定式XR(eXtrapolated Runs)を提案した(※2)。
XR=0.5×単打+0.72×二塁打+1.04×三塁打+1.44×本塁打
+0.34×(四球+死球-故意四)+0.25×故意四+0.18×盗塁-0.32×盗塁死
-0.09×(打数-安打-三振)-0.098×三振-0.37×併殺打+0.37×犠飛+0.04×犠打
得点推定式XRは、シーズン全体の得点のうち、単打1本が得点を0.5点生み出し、本塁打1本が確実に入る1点に加えて得点を0.44点生み出していることを示している。逆に、アウトになれば、生み出される得点を減らしていることを示している。盗塁に関しては、64%を超える確率で盗塁を成功させれば、プラスの得点が生み出されたと解釈することもできる。そして、各チームの公式記録のデータを得点推定式XRに入力すれば、各チームの生み出した得点を推定できるのである。表1は2019年度の各チームの得点と得点推定式XRで計算した得点の一覧表である。もちろん、公式記録で分かっているチームの得点を推定しても意味はないかも知れないが、チームを構成する各打者の公式記録のデータを得点推定式XRに入力すると、各打者の生み出した得点も推定することができる。つまり、チームの総得点を各打者が生み出した得点に分解できるのである。
ここでは、Jim Furtadoがメジャーリーグのデータより開発した得点推定式XRを紹介したが、日本のプロ野球のデータに適合した日本版XRが『勝てる野球の統計学 セイバーメトリクス』(※3)で提案されている。また、蛭川皓平は「得点推定式を読み解く」(※4)で、XRだけでなく様々な得点推定式の解説をしている。前述した通り、XRは重回帰分析を使って得た得点推定式である。重回帰分析はEXCELにデータを入力すれば,分析ツールで容易に計算結果を出すことができる。EXCELにデータを入力して、様々な得点推定式を作ってみてはいかがでしょうか。
表1:2019年度の各チームの得点と得点推定式XRで計算した得点
(※1)「日本野球機構オフィシャルサイト」 http://npb.jp/
(※2)Jim Furtado「Introducing XR」
http://www.baseballthinkfactory.org/btf/scholars/furtado/articles/IntroducingXR.htm
(※3)鳥越規央,データスタジアム野球事業部『勝てる野球の統計学 セイバーメトリクス』岩波書店、2014
(※4)蛭川皓平「得点推定式を読み解く」、『セイバーメトリクス?リポート4』水曜社、2015