3月末の『The Athletic』に掲載されていた記事「フットボールアナリティクス 10のべからず集」。
The 10 Commandments of football analytics
※要サブスク
フットボールで選手やチームの成績を表すのにメディア等でよく取り上げられがちなスタッツデータが、いかに不適切に取り扱われているかを、10個の例で示すというなかなか興味深い記事。
データ(数字)やスタティスティクスについては、このブログでもよく取り上げているし、なんならそれをもとにして選手やチームの出来の良し悪しを測ったり批判や称賛の論拠にしようともしているが、局面のコンテキストについて考慮するなど注意深く扱わなければ、不正確な結論を導きかねないという。
今回はこの記事をもとに書いてみたい。
フットボールスタッツの基本知識
本題に入る前に基礎知識を。
総本山はもちろんOpta。各スタットが定義されているので、確認したくなったときにはここ。
それと今回も「xG(Expected Goals)」の話題が頻出するので、それについてより詳しい説明。
Football Statistics and History | FBref.com
釈迦に説法だったら失礼。
ミスリーディングなスタッツの例10
The Athleticは課金メディアなので、記事のすべてを紹介することは控える。要点のみ。
ツッコミどころはいくつかあるが、あとでまとめる。
1 ゴールキーパーのショットストップ能力評価で「セイヴ率」は使うべきではない
このスタットを使ってはならない理由:単純なセイヴ率(=シュートセイヴ÷トータルシュート)では、シュートのタイプやクオリティ(xG)が考慮されないから。
代替で使用するスタット:オンターゲットのシュートのクオリティを評価する「xG on Target(枠内xG)」あるいは「Post-Shot xG(シュート後xG)」を失点数と比較すべし。
※訳注:Post-Shot xGは、通常のxG(=Pre-Shot xG)がシュートするときの状況でカウントされるのと違い、シュートを打ったあとのシュートそのもののクオリティも合わせてカウントされる。
また、どの程度のクオリティのシュートをどれだけ防いだか平均と比較する「Goals Prevented(ゴール阻止)」も有効。※ベルント・レノは1.5でPLで6位。
2 がんばり(effort)の指標として「走行距離・スプリント」は使うべきではない
このスタットを使ってはならない理由:走行距離と試合の勝敗に相関関係はないから。選手が求められているもの・プレイしているシステム・相手・試合の状態を合わせて考慮しないと意味がない。むしろ走らないほうがプレイに恩恵があるといういくつかの証拠もある。
代替で使用するスタット:これについて代替するスタットはとくになし。
3 チームクオリティの指標として「ポゼッション」は使うべきではない
このスタットを使ってはならない理由:勝敗と関係ない。レスターは平均42.6%のポゼッションでPLを取ったし、CLでリヴァプールに1-0で勝ったアトレチコのポゼッションは27%。
代替で使用するスタット:それでもポゼッションはどちらがボールを持ったかについては便利な情報だが、どちらのチームが相手より優れたクオリティがあるかの議論をしたいのならxGのほうがよほどまし。
4 DFの守備能力評価で「タックル、インターセプションの数」は使うべきではない
このスタットを使ってはならない理由:具体的な数字に現れることだけが守備のすべてではないから。計測されるアウトプットはしばしばチームスタイルにバイアスされがち。論理的にポゼッションの低いチームは守備機会が多い。たとえばVVDはp90で0.76のタックルしかないが、誰も彼がプアだとは考えない。
代替で使用するスタット:単純に90分でカウントするのではなく、フィールドプレイで相手の1000タッチごとの守備アクションを比較するとか。ジョーダン・ヘンダーソンのタックルは90分ごとではリーグ15位だが、1000タッチでは5位にジャンプアップする。
5 選手のタックル能力評価で(既存の)「タックル勝率(tackle win-rate)」は使うべきではない
このスタットを使ってはならない理由:「タックル」というスタットは「タックル勝」と「タックル負」のみに分類され、タックル後のこぼれ球やファウルをカウントしないから。
代替で使用するスタット:タックル勝率の計算を(タックル勝÷(タックル勝+タックル負))ではなく、(全タックル÷(全タックル+チャレンジ失敗+タックルからのファウル数)のほうが妥当。
6 フィニッシュ能力評価で少ないサンプル数で「ゴール-xG」は使うべきではない
このスタットを使ってはならない理由:ゴール得点能力を理解するためには、ふたつの要素をそれぞれ独自に検討せねばならない。ひとつは自分自身でシュート(シュートチャンス)を生み出せること。いつも適切なポジションにいる。それはxGで測れる。もうひとつはフィニッシュ。こちらは「1シーズン」のような小さなサンプルではゴール数とxGが一致しないことがある。
代替で使用するスタット:xG(選手が持つチャンス)とxG on Target(そのチャンスをどう生かしたか)の比較はフィニッシュ能力を測るもっとも基本的なやり方。より大きなサンプル、少なくとも数百のシュート数がほしい。
7 チームパフォーマンスの評価で「誰がいる/誰がいない」は使うべきではない
このスタットを使ってはならない理由:WOWY(With or without you)はスポーツアナリティクスの世界でよく知られるスタットで、バスケのような少ない人数/頻繁な交替/高得点のスポーツならまだしも、フットボールではひとりの選手が関わらない状況が多すぎて正確な分析には足らないから。
代替で使用するスタット:選手(の影響力)を評価するなら、ポジションや彼らがどうコントロールできるかにフォーカスすべき。たとえばエジルなら、ほかのクリエイティヴMFのチャンス・クリエイション、ゴールなどと比較したり。WOWYスタットは巨人たちのインドアスポーツで使おう。
8 選手のパス能力評価で「パス・アキュラシー」は使うべきではない
このスタットを使ってはならない理由:選手のパスが正確だったかそうでなかったかは、多くをその選手が何を求められているかに依っているから。シティとバーンリーではパスの難易度がまったく違う。また上手なパスカットなど、相手選手のパフォーマンスにも影響を受ける。
代替で使用するスタット:この件で適切に使えるメトリクスは多くない。Expected Pass completion ratesは、Pass completion ratesよりは適切かもしれないが、そのデータはあまり公開されていない。
9 多くの失敗(fail)をもって選手を評価してはいけない
このスタットを使ってはならない理由:ゴールデンブーツの選手だって毎年、どんなほかの選手よりシュートを失敗するのだから。
代替で使用するスタット:多くのケイスで失敗の数よりパーセンテージで見たほうがいい。彼らが多く失敗をしているだけなのか、あるいはほかの選手よりもはるかに多くチャレンジをしようとしているのか?
10 異なるプレイタイムの選手を比較評価してはいけない
このスタットを使ってはならない理由:長くプレイする選手のほうがよりチャンスがあるから。
代替で使用するスタット:p90(90分ごと)を使えばフェア。
以上。
ほぼ要約(意訳)。ちょっとぼく自身もうまく理解していないところもあってすまない。
記事原文には、スタッツが紹介されるときの例「エジルのこの試合の走行距離は11.2Kmでトップだった」みたいものがひとつひとつ紹介されているのだけど、それを端折ったからなおわかりにくい(笑い)。課金メディアだから気を使ってしまった。
わたしの雑感
さて、全体的に興味深いと思いつつ、ツッコミたいポインツがいくつか。
まず、2(がんばり(effort)の指標として「走行距離・スプリント」は使うべきではない)は、たしかに走った距離と勝敗は関係ないのかもしれないが、effort(努力・がんばり)を知りたい場面だってあるので、そういうときは有効ではなかろうか。
※フットボールにおける走行距離(走行スピード)と勝敗の相関関係について定説はあるのかと少し調べてしまった。2014年のワールドカップの例だと多少勝利チームの走行距離が長いようだが、云うほどの差はなかったようである。
たとえば、エメリ時代を思い出せばアーセナルはチームがモラル崩壊を起こしていて、チーム/選手の態度やメンタリティ、モチヴィエイションといったものに注目が集まっていた。そのあたりのメンタリティは走りにも当然現れるものだろう。やる気のない選手が普段より走るなんてことは想像できない。
われらアーセナルのファンにしてみれば、エメリからアルテタに変わってチームのメンタリティの変化はひとつの大きな関心ごとだった。
チームスピリットみたいなもののバロメータとしては、十分知るに値するスタットだとは思うがどうだろう。
それと、6(フィニッシュ能力評価で少ないサンプル数で「ゴール-xG」は使うべきではない)は、原文ではロベルト・フィルミーノを例にしていて、彼のここ3シーズンの数字をもって、サンプル数の少なさが正確性に欠く根拠としているように読めるのだけど、今シーズンの彼にゴールが少ないのは、単純に彼のパフォーマンスが悪いだけという見方はできないんだろうか。それも正確なサンプルのうちに入るのでは?という。例外として捉える意味がよくわからない。今年のリヴァプールが史上最強だったから?
もちろん、どんなスタッツもサンプル数は多ければ多いほど、分析は正確に近づくので、ここも例外ではないというだけなんだろうが、ちょっとモヤモヤした。
ぼくが誤読しているだけかもだし、よくわかんないや。
9(多くの失敗(fail)をもって選手を評価してはいけない)は、おそらくはドリブラーのようなタイプの選手を想定しているのだろうと思われる。彼らはかなりたくさんドリブルに失敗するが、チャレンジするエリアによっては成功すればビッグチャンスにつながったりするので、やはり対峙するDFには驚異になる。
またオバメヤンがまさにこの典型で、彼は得点王を取るようなストライカーだがビッグチャンスをかなり外す選手でもある。失敗はチャレンジの裏返しというのは、オバメヤンにぴったりだ。
でも、たとえば以前のジャカやムスタフィみたいな選手のうっかりミスはどう評価すればいんだろう。
記事中ではマイケル・コックスの記事が詳しく説明しているとしてThe Athleticの別の記事がリンクされていた。あとで読んでみよう。
おわる
エメリ時代末期の走行距離は実際に少なかったんですか?ちょっと初耳だったので。