2015年03月09日

スポーツデータ解析のお話

マネーボールで有名なスポーツデータ解析ですが、最近ではベースボール以外の分野でも積極的に取り入れられているそうです。

MIT Newsでこんな記事が挙がっていました。

Six keys to sports analytics
(スポーツデータ解析の6つのキー)

6つのキーと書いてありますが、内容はとりとめもない感じでMIT Sloan Sports Analytics Conferenceで挙がった話をまとめています。

どんな内容が書いてあるか、少しだけ覗いてみましょう。

スポーツデータ解析は時に大きなインパクトをもたらす

スポーツデータ解析の大きな成功例としてマイアミ・ヒートを挙げて、時に大きなインパクトをもらたすものだとしています。

レブロン・ジェームズ、クリス・ボッシュ、レイ・アレンらのスター選手を並べたヒートがなぜ? と思われるかもしれませんが、ディフェンス面での貢献など、より正確に選手の成績を数値化した結果として、レイ・アレンやマイク・ミラーを獲得したのだとか。

でも、ヒートのこのメンバーを分析の成功例として挙げられても、どっちかというとこのメンバーを連れてきた資金力とGM凄いなという話になってしまうような。

まだすべてのチームが分析に手を出してるわけではない

マネーボールではアスレチックスというMLBの低予算チームが統計的な分析手法を取り入れることで、プレーオフの常連になるという成果を挙げました。

しかし成功を続けるうちに他のチームも同様の手段を取り入れるようになり、徐々に「予算=強さ」の状態に戻っていくことになります。

バスケットボールでは、現在はまだ最新の評価手法を使っていないチームが残っているそうです。

But many NBA teams still give huge contracts to players like Carmelo Anthony, a so-called “ball-stopper” because he does not pass enough.

多くのNBAチームはまだCarmelo Anthonyのような「ボールストッパー」(パスをあまり出さない選手)と契約したがっている。

まだ統計的な分析が進んでないバスケットボールのような分野では、アスレチックスのような大きな成果を挙げられるチャンスがある分野と言えます。

分析者は結果を説明する必要がある

this has to be explained in everyday language.

日常語でそれを説明しなければならない

例えば今流行りのdeep learningで最高の5人の組み合わせを作るという命題に回答させた場合、なぜその組み合わせになったのか説明するのはかなり手間だと思われます。

「なんだか知らないけど、こういう結果になった」では導入への壁は高いですし、マネージャーやコーチ、選手への説明も出来ません。意味がわからなければ選手もコーチも改善に役立てることができません。

といった形で、スポーツデータ解析に関わる話が述べられています。

上記はプロの視点での話になりますが、スポーツデータ解析は統計を学び始めるのにも役立つ内容だと個人的に思っています。

例えばMLBのデータは手軽にダウンロード可能なので、ちょっとデータを落としてみて「この数字はどのくらい勝率と関連があるのだろう」といった疑問に数値的な答えを出す分には、それほど手数をかけずに算出することができます。

下記は過去のMLBのデータをダウンロードできるサイトです。

Download Lahman’s Baseball Database

NBAもデータを公開しているサイトがありますね。

Download NBA Box Score Stats in Excel

アメリカではこの手のデータは積極的に公開されています。対する日本はデータが有料だったり権利関係が不明瞭な状態でスクレイピングして利用していたりと、データの公開に積極的ではないケースが多いです。たいへん残念な話ですね。

こうした数字の公開は、子どもたちの興味を育み、教育においても役立つと思うのですが。

posted by newsit at 07:00| linux