第65巻第2号185−200(2017)  特集「スポーツ統計科学の新たな挑戦」  [原著論文]

ストレートに着目した空振りに影響を与える要因の定量的分析

慶應義塾大学大学院 永田 大貴
慶應義塾大学 南 美穂子

要旨

PITCHf/xは投球の軌道を追尾することによってボールの座標や変化量などのデータを計測できるシステムである.本稿では,PITCHf/xデータを用いてノビについて分析を行った.ノビとは空振りしやすいストレートに対して用いられる言葉であり,ノビのあるストレートは初速と終速の差が小さいという定説がある.しかし実際のPITCHf/xデータを眺めると定説とは逆の関係が見て取れる.そこで打者のボールへのコンタクトを定義した上で,コンタクトを球速差で説明するロジスティック回帰モデルを適用した.それにより,球速差はコンタクトに対して負の関係性を有するという結果が得られた.また本稿では,ボールの変化量に着目し,変化量とコンタクトとの関係を評価するために多変量スプライン平滑法を用いた一般化加法モデルによる分析を行い,縦変化量の大きさが重要である事が分かった.さらに,ボールの質以外の各投手ごとの打ちにくさを変量効果として追加したモデルについても解析を行い,その予測値を比較する事により上原はMLB(メジャーリーグベースボール)2014シーズンにおいて最も打ちづらい特徴を有した投手であるという結果を得た.

キーワード:PITCHf/xデータ,ストレート,ノビ,ボールの変化量,一般化加法モデル,変量効果.


第65巻第2号201−215(2017)  特集「スポーツ統計科学の新たな挑戦」  [原著論文]

野球のトラッキングデータに基づいた肘内側側副靭帯損傷の要因解析

中央大学 酒折 文武
中央大学大学院 圓城寺 啓人
中央大学大学院 竹森 悠渡
中央大学大学院 西塚 真太郎
滋賀大学 保科 架風

要旨

野球の投手における肘内側側副靭帯の損傷は近年増加しており,大きな問題となっている.予防の重要性にもかかわらず,そのリスク要因に関する科学的なコンセンサスが得られているとは言い難い.そこで本論文では,アマチュア野球の投手経験者とスポーツドクターの意見を参考にして,肘内側側副靭帯損傷のリスク要因の候補を再検討した.そして,先発投手とリリーフ投手とに層別してそれぞれロジスティック回帰モデルを立て,AICを用いた変数選択により選択されたリスク要因について,調整オッズ比を算出した.その結果,先発投手については,球種数が少ないこと,リリース位置が体から横に離れていること,1試合当たりの投球数が多いことがリスク要因であることがわかった.またリリーフ投手に関しては,球種数が少ないこと,リリース位置が体から横に離れていること,ファストボールの球速が速いこと,登板間隔が短いことがリスク要因であることがわかった.これらの結果は,他の研究成果の一部を肯定しているとともに,先発投手やリリーフ投手における1試合の投球数や登板間隔に関する重要な示唆を与えているといえる.

キーワード:オッズ比,ロジスティック回帰,スパースロジスティック回帰,Lasso.


第65巻第2号217−234(2017)  特集「スポーツ統計科学の新たな挑戦」  [原著論文]

Covariate Balancing Propensity Scoreを用いた,スクイズ作戦の有効性の解析

慶應義塾大学大学院 中村 知繁
慶應義塾大学 南 美穂子

要旨

近年,スポーツではデータの取得が盛んに行われており,特にアメリカの大リーグの試合データは全打席一球ごとの記録が公開されている.本論文では,このデータを用いて野球におけるスクイズ作戦が得点する確率にあたえる影響についてCovariate Balancing Propensity Score(CBPS,Imai and Ratkovic,2014)を用いて解析を行った結果を報告する.特に,本解析においては,どうしても1点が欲しい状況である得点差が0点または1点の場合のスクイズ作戦の有効性に焦点を当てる(ただし満塁の場合は除く).スクイズ作戦が得点する確率にあたえる影響を推定するためには,スクイズ作戦をとった場面と,とらなかった場面を比較するというのが簡単な方法である.しかし,スクイズ作戦をとるかとらないかはランダムではなく,打者や投手の情報といった共変量に依存して決定されるのが一般的であるため,単純な2群の比較を行ってしまうと,推定されたスクイズ作戦の影響に共変量の影響が含まれてしまい,適切に推定を行うことができない.そこで,本論文では傾向スコアを用いて共変量調整を行った上で,スクイズ作戦が得点する確率に与える影響を推定した.さらに傾向スコアの推定をロジスティック回帰モデルを用いてスクイズ作戦の影響を推定した場合と,Covariate Balancing Propensity Scoreを用いてスクイズ作戦の影響を推定した場合の結果を比較した.その結果,CBPSを用いて影響を推定する方が,ロジスティック回帰モデルを用いて傾向スコアを推定した場合に比べて,比較する2つの群の共変量の分布の平均がよく釣り合い,スクイズ作戦が得点する確率に与える影響を安定して推定できることがわかった.また,CBPSを用いた解析からスクイズ作戦は平均の意味で18.2%得点する確率を上昇させることがわかった.

キーワード:野球,スクイズ作戦,因果推論,共変量調整,Covariate Balancing Propensity Score.


第65巻第2号235−249(2017)  特集「スポーツ統計科学の新たな挑戦」  [原著論文]

項目反応理論を用いた野球選手の能力評価指標の提案

中央大学大学院 阿部 興
中央大学 作村 建紀
中央大学 鎌倉 稔成

要旨

本研究は野球選手の,特に打撃の能力に関する新しい評価指標の提案を行う.打者の能力を評価する指標として,最も広く使用されるのは打率である.しかし,打率を一つの統計モデルと捉える場合,これは現実的でない仮定のもとに成立するものだと言える.打率はヒットを打つ確率がピッチャーの能力に関わらず常に一定であると見て計算されている.提案モデルはピッチャーによってヒットを打つ難しさが異なり,対戦するピッチャーが選手ごとに異なるという状況の下で,打撃の能力の選手間での比較を可能にする.我々が提案するモデルは,項目反応理論で用いられる1パラメータロジスティックモデル(ラッシュモデル)の拡張である.ラッシュモデルでは,潜在的な能力パラメータは各人一つとされているが,本論文では打者の能力に対応するマルコフパラメータを導入した.すなわち,我々は打席結果にマルコフ性を仮定して調子の波を表現する.これにより調子の波が前の打席の結果を受けて生じると解釈できる.モデルのパラメータの推定にはハミルトニアン・モンテカルロ法を用いる.パラメータ推定の安定性はシミュレーションによって評価する.提案手法の有益性は日本プロ野球の実際のデータを分析することで示す.

キーワード:階層ベイズモデル,MCMC,セイバーメトリクス,ロジスティックモデル.


第65巻第2号251−269(2017)  特集「スポーツ統計科学の新たな挑戦」  [原著論文]

バレーボール各国代表チームのレーティング手法の提案および結果予測・大会形式評価への応用

名城大学 小中 英嗣

要旨

バレーボールの各国代表チームのランキングであるFIVBランキングは,ランキングポイントの設計に統計的な根拠が無く,さらに,主要な国際大会を独占的に主催する特定の国が優遇されていることなどが原因となり,その値を実力の定量的評価には活用できない.そこで本研究では,過去の試合結果(各セットでの得点)から各チームの実力(レーティング)を算出する手法を提案する.具体的には,レーティング差がロジスティック回帰モデルを通し各セットでの得点率を説明するモデルを仮定する.また,試合結果からレーティングを算出するアルゴリズムをあわせて提案する.
リオデジャネイロオリンピックを含む複数の国際大会での実際の得点率と,提案手法により算出したレーティング差から予測される得点率との間に中程度から強い相関(相関係数がおよそ0.65から0.80)があり,その相関はおおむねFIVBランキング(ポイント)差に基づくもの(相関係数がおよそ0.45から0.70)より強いことが分かった.さらに,提案手法に基づくレーティングにより各大陸間の実力差を定量的に明らかにし,FIVBランキングが実力を正しく反映していないことの根拠を明示する.この事実に基づき,具体的な事例としてリオデジャネイロオリンピックの予選および本選の大会形式の不備を指摘する.具体的には,敗退行為を誘引しかねない最終予選出場国の決定方法,および実力を反映していないFIVBランキングにより引き起こされたオリンピック本選での不均衡な組み分けについて指摘する.

キーワード:スポーツ,バレーボール,レーティング,ロジスティックモデル.


第65巻第2号271−286(2017)  特集「スポーツ統計科学の新たな挑戦」  [原著論文]

重力モデルを用いたサッカー選手の動きの定量化

同志社大学大学院 土田 潤
同志社大学 宿久 洋

要旨

サッカー選手の動きに関して,ボールを保持している選手に着目した研究は多数存在する.また,ボールを持っていない選手を含めた研究は戦術などの,選手全体の動きに関する評価が多く,個人への評価は少ないのが現状である.本稿では,全体の動きを考慮しつつ,選手個人の動きを評価する指標として,選手質量を用いる.選手質量の定義には重力モデルを用いる.重力モデルにおいて選手質量はパラメータとなるが,重力モデルの式が対数線形モデルと同様のモデル式として定義されることから,選手質量の推定が可能となり,選手質量について,対数線形モデルにおける主効果と同様の意味付けができることを報告する.また,本稿ではトラッキングデータを用いて,選手間密度,および選手間距離を算出し,選手質量を推定した結果を報告する.加えて,推定された選手質量に対して,階層ベイズモデルを用いてどのようなプレーが選手質量に影響を与えているかをモデリングした結果を報告する.

キーワード:階層ベイズモデル,スポーツデータ解析,対数線形モデル.


第65巻第2号287−298(2017)  特集「スポーツ統計科学の新たな挑戦」  [研究ノート]

トラッキングデータを用いたサッカーの試合における戦況変化の抽出

東京大学大学院 神谷 啓太
東京工業大学 中西 航
東京大学大学院 泉 裕一朗

要旨

サッカーの試合において「戦況」とは両チームの攻守のやり取りの中で徐々に変化していくものである.戦況変化を自動的に抽出できれば試合を有利に進めるための戦略が立てられるだけでなく,観戦者に対する情報提供などの面で有用である.本研究では,戦況変化を選手やボール位置の時系列的な振る舞いの変化と考え,統計的変化検知手法であるChangeFinderを使用することでサッカーの試合における戦況変化の抽出を試みる.ChangeFinderとは2段階のVARモデルのオンライン学習を行うことで非定常かつ多ノイズな時系列データへの変化検知が可能な手法である.トラッキングデータ等からボール位置,前線位置,コンパクトネス,守備脆弱度,攻撃率の5種類の指標の入力変数を作成した.実験の結果,検出された変化点に対応するように,その直前でVARモデルパラメータの時系列的振る舞いに大きな変動が存在することが確認された.そのパラメータ変動から想定される戦況変化の内容は実際のプレー内容と概ね合致していたとともに,想定される戦況変化が検出できたことが確認された.

キーワード:サッカー,戦況,変化点検知,時系列分析,ChangeFinder.


第65巻第2号299−307(2017)  特集「スポーツ統計科学の新たな挑戦」  [研究ノート]

ドロネー分割と階層的クラスタリングを用いた集団スポーツにおけるフォーメーション解析手法の提案

中央大学 成塚 拓真
早稲田大学 山崎 義弘

要旨

集団スポーツにおいて,選手同士の相対的な位置関係(フォーメーション)が戦術上重要な意味を持つ.しかし,現在のところ,フォーメーションを定量的に解析する確立された手法は存在しない.そこで,本稿では,ドロネー分割を用いた新たなフォーメーションの解析手法を提案する.本手法では各選手を母点とするドロネー分割をネットワークと見なし,その隣接行列をフォーメーションのパターンと定義する.これにより,フォーメーションの時間変化の解析や異なる時刻間での定量的な比較が可能となる.本稿では,サッカートラッキングデータを用い,本手法と階層的クラスタリングを用いたフォーメーションの分類を試みる.

キーワード:フォーメーション,ドロネー分割,階層的クラスタリング.


第65巻第2号309−321(2017)  特集「スポーツ統計科学の新たな挑戦」  [研究ノート]

サッカーの攻撃におけるプレーの最適化アルゴリズムの開発

筑波大学附属駒場中・高等学校/筑波大学大学院 徐 広孝
日本スポーツ振興センター 大澤 啓亮
筑波大学大学院 見汐 翔太
新渡戸文化学園 安藤 梢
順天堂大学 鈴木 宏哉
筑波大学 西嶋 尚彦

要旨

近年,スポーツパフォーマンスデータの分析が盛んに行われているが,ビッグデータを用いた研究は少ない.本研究の目的は,サッカーのビッグデータを用いて,攻撃においてシュートまでたどり着くためのプレーを最適化するアルゴリズムを考案することであった.データスタジアム株式会社から提供された2013年のJ1全306試合の攻撃データを,先行研究の測定項目に従って達成データセットに変換した.測定項目間のオッズ比から連動確率行列を作成し,次の手順による最適化アルゴリズムを作成した.(1)攻撃プレーから達成項目を保存する.(2)シュートに対する連動確率に基づいて達成項目を降順でソートする.(3)未達成項目を達成項目間に挿入した場合の確率を計算する.(4)その確率が達成項目間の確率よりも高い場合は未達成項目を挿入する.(5)二重ループで挿入を行う.このアルゴリズムで最適化を適用し,ハーフタイムなどの短期的な場面や,数カ月単位の長期的な場面で活用する方法が提案された.

キーワード:サッカー,Jリーグ,攻撃プレー,最適化アルゴリズム,ビッグデータ.


第65巻第2号323−339(2017)  [研究詳解]

整数値自己回帰モデルの最近の発展

中央大学大学院 中嶋 雅彦
中央大学 酒折 文武
統計数理研究所/総合研究大学院大学 川崎 能典

要旨

整数値自己回帰モデル(Integer-valued Autoregressive Models,INARモデル)は,自分自身の過去(整数値)に直接依存させて現時点での値(整数値)を説明するものであり,潜在過程に基づく動的一般化線形モデルや一般化状態空間モデルとは,データへの接近法は大きく異なる.特に,自己回帰モデルの左辺と右辺において確率分布が整合的であるためには,周辺分布,自己回帰項,イノベーションのそれぞれの定式化が重要である.1980年代後半から90年代初期にいくつかの研究が行われたあとやや停滞していたこの分野は,2000年代後半から活性化してきている.本稿は,最近の整数値自己回帰モデルの発展を,ポアソン分布に基づくINARモデルから出発して,定式化を変えた各種モデルを順に取り上げることで概観する.その過程で,必ずしも既存の文献で詳述ないし証明の与えられていない結果に関しては,著者らなりに補った結果を付録に収めた.ポアソン分布の差から生成される分布に基づくINARモデルについては,若干新しい提案と結果を加えることができた.その枠組みを利用した実データ解析例を,最後に紹介する.

キーワード:整数値時系列データ,間引き演算子,確率変数の分解,INAR(1)モデル,INAR(p)モデル,モーメント法.