篝火#6のシーディングは波乱を招いたといえるのか

2022/01/18 追記

アユハ氏が統計学的見地から篝火#6で波乱が起きたのかを追加検証してくださいました。

ayuha167.github.io

アユハ氏の分析によると篝火#6で波乱が起きたとは言い切れませんが、「シードの正確性を増すために多くの大会結果データを参照すべき」という本記事の主張は間違ってもいないと考えられるため、本記事はこのまま残します。

2022/01/17 追記

SPRとUFの定義がPG Statsの定義と異なるものとなっていたので、修正しました

はじめに

篝火#6では直前に発表されたシードが順当ではないのではないかという意見がTwitter上で散見されました。その後、前日になってコロナの感染拡大によりキャンセルする人が続出し、シードの議論は下火になりました。しかし、今後も大会は開催されるため、今一度シードの妥当性について検討する必要があると考え、本記事を執筆しました。

断り書き

本記事はあくまでシードの妥当性を検討するものであって、特定のプレイヤーを貶めたりするような意図は一切ございません。実際のデータを使っている関係上、個人プレイヤー名が登場しますが、それらはシードの妥当性を示すためだけの意図しかないことをご承知おきください。

シードの計算方法について

本記事は篝火#6のシードが妥当であったかを検証する記事ですので、どのようにシーディングが行われていたのかという知識が前提となります。

上記記事を先に読んでいただくようにお願いいたします。

波乱は歓迎されないのか

みなさんは大会で波乱が起こるほうが良いとお考えでしょうか?一般に「判官びいき」という言葉があるほど、番狂わせ(波乱)を好む人々はいます。

ただ考えてみると、波乱には歓迎されるものと歓迎されないものがあります。実力が低いと見なされていたプレイヤーが良いプレイをして番狂わせを起こすことはまったくもって歓迎されます。逆にプレイヤーがコントロールできる外側、例えばシード順が不適切な場合は歓迎できません。アユハ氏もこの点を鋭く指摘しています。

篝火#6で、このシード順の不正確さによるアップセット(番狂わせ)が起きてたかを検討するのが本記事の趣旨となります*1

どうやって波乱かどうかを示すか

まずプレイヤーが波乱(意外)な結果に終わったかを検討し、それを大会全体で検討することによって、大会自体が波乱だったかを検討します。そして波乱だった場合、シード順が影響していたのかを考察します。

単純計算の問題

プレイヤーが意外な結果に終わったかどうかは、そのシードと結果の順位を比較することで分かります。しかし、単純に引き算をするわけにはいきません。なぜなら、シード1のプレイヤーがベスト32(25th)に終わると-24となり、シード65のプレイヤーがベスト128(97th)に終わると-32となりますが、前者の方が波乱であると見なすべきだからです。

Seed Performance Rating (SPR)

そこで、PG Statsが公開しているSeed Performance Ratingという概念を導入します。

www.pgstats.com

これを計算するには、Losers Rounds from Victory (LRV) という概念が必要になります。LRVを端的に説明すると、勝利から何ラウンドの位置の順位かを計算するものです。例えば、2位の選手はあと1つ勝利すれば優勝だったので1、5位の選手はLQF/LSF/LF/GFの4つを勝てば優勝だったので4となります。順位に対して計算したLRVをplacement LRV (pLRV) と本記事では呼称します。

同様に、シードに対しても計算することができ、こちらは seed LRV (sLRV)と呼びます。pLRVとsLRVの差(pLRV - SLRV)がSPRとなり、プレイヤーの躍進・不振度を測定できます。

Upset Factor (UF)

後に登場するので先に説明しておきます。UFは試合の勝者と敗者それぞれのsLRVの差です。敗者のsLRVが勝者のsLRVより大きいほど、大きなアップセットが起きたと考えられます。

大会全体での波乱度

人間は大きな出来事ほど記憶に残りやすい印象がありますので、僅かな波乱を比較することはあまり意味がありません。そこで今回は、大きな躍進(SPR>>0)と大きな不振(SPR<<0)に該当する上位数プレイヤーを抽出し、検討します。特にシード下位の比較的に知名度の低いプレイヤーが勝ったことよりも、シード上位の知名度が高いプレイヤーが負けたことのほうが、人々の印象に残りやすいと考えられます。そのため、大きな不振を中心に検討します。

プレイヤーのグルーピング

ここで、これから先の検討をしやすくするために、プレイヤーを以下のように分けておきます。

  • 最上位プレイヤー(最上位勢) 32あるプールにおいてどのようにシードを考えても間違いなく第一シードと考えられるシードTOP16に割り当てられているプレイヤー
  • 上位プレイヤー(上位勢) 32あるプールにおいて第四シードまでに割り当てられているTOP17〜128のプレイヤー
  • 一般プレイヤー(一般勢) それ以外の参加プレイヤー*2

最上位プレイヤーは大きな躍進は起きづらく、一般プレイヤーは大きな不振は起きづらいです。そのため、上位プレイヤーが一番シードの影響を受けると考えられます。

篝火#6は過去大会に比べて波乱だったのか?

まず、SPRが-4以下の、大きな不振を篝火#6について確認してみましょう。

f:id:jak_amano:20220117231219p:plain

篝火#6における大きな不振プレイヤー一覧

このデータだけだと分かりづらいので、過去の篝火#4,#5と比較してみます*3

f:id:jak_amano:20220118000253p:plain

篝火#4における大きな不振プレイヤー一覧

f:id:jak_amano:20220117231433p:plain

篝火#5における大きな不振プレイヤー一覧

これらのデータから、篝火#6では黄色の行で表されている最上位勢の不振が多く*4、それを詳しく分析することで大会全体が波乱傾向にあったことを示せそうです。

逆に、上位勢の不振は少なく、上位勢のシードに割り当てられたプレイヤーたちは一般勢よりも強かったと言えそうです。「おばすまOFT#1」や「HSTSP extend 2021」などの遠征勢が少なかった大会の結果がシードに色濃く反映されていることについて様々な意見が飛び交いましたが、そこで上位の結果を残した人が上位勢に相当するシードに割り当てられていたことはある程度の妥当性があると考えられます*5*6

最上位勢の不振を大会ごとに比較してみましょう。シード1〜16のプレイヤー(DQは除く)の平均SPRを計算しました。

f:id:jak_amano:20220117234800p:plain

篝火#4〜#6の最上位勢の平均SPR

 

確認すると、3大会の中では篝火#6が一番波乱だったことがわかります*7

波乱をもたらしたのはなにか?

波乱(不振)の要因を細かく分析するために、篝火#6で大きな不振となった最上位勢すべてのマッチアップを確認します。

f:id:jak_amano:20220117235333p:plain

篝火#6の最上位勢のアップセット一覧

上から、より大きくシードをひっくり返した順番になっています。

ここで「※後述」がポイントとなります。これは、勝者側のプレイヤーが、篝火#6から過去半年間に出場した、smash.ggで開催された大会の数です。色分けしているように、これがシーディングのルールとなる3大会よりも少ないプレイヤーがより大きなアップセットを起こしています*8

つまり、機械的なシーディングにおいて、その元となるデータが少ないことが波乱を演出したと考えられます。

よりよいシーディングをするために

最後に、篝火#6で大きな躍進をしたプレイヤーたちを見ながら、今後のシーディングの改善案を考えていきましょう。

f:id:jak_amano:20220117235447p:plain

篝火#6における大きな躍進プレイヤー一覧

ここで注目していただきたいのは、オムアツ選手とシッショー選手です。結果論だけで言えば、この表のすべてのプレイヤーはもっとシードが高くあるべきだったのですが、この2選手については事前にもう少し考慮することができました*9

それは彼らがsmash.ggによるコミュニティ大会が開催されていない、中国地方と九州地方の在住だという点です。同様に大きなアップセットを起こした選手のうち、Munekin選手とあしも選手が同じ条件を満たす中国地方と四国地方に在住しています*10

これらの地域に住む篝火出場を検討している選手は、各地域の大会運営にsmash.ggを利用してもらうことをお願いしたほうがよさそうです。また、もしその実現が難しい場合は、篝火スタッフはこれらの地域の大会結果を手入力でも反映したほうが望ましいと考えられます*11

結論

結論としては、

  • 今回のシードによって波乱は起こった
  • シードが高すぎる選手がいたことによる波乱はほとんど起きなかった
  • シードが低すぎる選手がいたことによる波乱が起きた
  • 上記を踏まえると、どれだけ多くの大会結果データを得られるかが肝要
    • 中国地方・四国地方・九州地方などのコミュニティ大会がsmash.ggによって運営されれば、かなり精度が上がりそう

となります。長文を最後までお読みいただき、ありがとうございました。

*1:ただし、もし篝火が強さ順よりも優先したい別のコンセプトによってシードを決めたいならば、今回の記事は的はずれな部分があります。例えば、マエスマTOPではオンラインとオフラインの架け橋というコンセプトがあるため、オフ大会の結果のみで単純にシードを決めていないと思われます

*2:そもそも篝火に参加しようと考えている時点である程度の実力があると思われますが、強豪プレイヤーと呼ぶと分かりづらいので今回は一般プレイヤーとします

*3:篝火#3以前は参加人数が少なすぎたため割愛します

*4:人数だけだと僅かな差ですが、SPRの値自体もより小さいものとなっています

*5:この傾向は海外でも同様であり、最上位勢がほとんど参加しなかった「Hold The Line」という大会で優勝したZombaはご存知のとおり、その後SWTで大活躍しました

*6:ただし、DQが多く予選抜けしやすかったことが影響しているかもしれませんので、次の大会でも注視する必要があります

*7:3大会とも負の値になっていますが、そもそもシードが高い選手のみを抜き出しているので躍進が起きづらいことは断っておきます

*8:さらにLea選手の3大会には参加人数に対してレベルが非常に高いSWT東アジア予選とSWTチャンピオンシップが含まれます

*9:それ以外の選手については、初出場だったり長らく大会で成績が振るわなかったりした選手ですので、どうあっても高いシードにすることは難しく、歓迎すべき躍進であったと考えられます

*10:ただし、あしも選手は遠征を積極的に行っていたため、目立って参加大会数は少なくありませんでした

*11:しかし、私もJJPRという自動計算のランキングを作っている立場上、手入力での集計、特に同一人物確認が非常に面倒なことは理解しています

スマブラSPのキャラランクは何日分の天気予報の価値があるのか

定義

キャラランク
  • キャラランクはファイター窓基準の83キャラに対して行うものとする
  • 多くのキャラランクで一般的な5段階*1のランク付けを行うものとする
  • 他の人のキャラランクからある程度類推できることは考慮しない
天気予報
  • 1日分の天気予報は雨が降る/降らないの2パターンしかないものとする
  • 天気予報がない場合、降るか降らないかは完全に50%の確率としか考えられないものとする

 

情報量とは

ja.wikipedia.org

ざっくり言うと、情報の持つ価値の尺度*2

 

天気予報の情報量

5日分の天気予報で考える。

\displaystyle{ 0.03125=0.5^5 }

50%の確率が5日分なので、その天気予報通りに起きる確率は0.03125

\displaystyle{ 5=-log_2 0.5^5 }

情報量の定義に当てはめると5

\displaystyle{ n=-log_2 0.5^n }

つまりn日分の天気予報の情報量はn

 

キャラランクの情報量

83ファイターを完全ランダムに5ランクに割り振ったときに、元のキャラランクと一致する確率で考える。

5ランクのどこに割り当てるかの確率は0.2。

それを83ファイター分。

\displaystyle{ 0.2^{83} }

情報量に変換。

\displaystyle{ 192.72\simeq-log_2 0.2^{83} }

計算結果はおよそ192.72

なので、およそ193日分の天気予報の価値がある。

 

ビデオゲームの情報量

実はビデオゲームを始めとする全てのプログラムは情報でできている。

その単位をbitと言い、いわゆるbyteという単位は1byte=8bit。

テトリスのようなシンプルなゲームだと情報量は非常に小さい。

gigazine.net

140byteだと1120bitなので、だいたい1120日分の天気予報の情報量と同じ。

\displaystyle{ 0.172\simeq192.72/140*8 }

つまり、キャラランクはだいたい0.172テトリス

まとめ

キャラランクの価値は実は結構高いので、無断転載はやめましょう*3

*1:S/A/B/C/Dが多い

*2:本記事では対数の底を2とする

*3:本記事はこれを言いたかったがためだけに書きました

JJPRが重視するオープントーナメントとは

はじめに

なぜオープントーナメントに関する話を今回するのかというと、JJPRで篝火#5の結果は反映しているのに篝火#4は算入されていない理由を説明しておく必要がありそうだと感じたからです。

端的に説明すると対象大会がオープントーナメントであることを重視しているためなのですが、実はこのオープントーナメントというのが結構ややこしいのです。

オープントーナメントの定義

では、そもそもオープントーナメントとはなんでしょうか?

kotobank.jp

コトバンクによると「参加資格を制限しないで自由に開放」*1とあります。

なるほど、この定義によると、招待制大会(EPI2など)やVIP未満などの条件に限定されている大会(初スマなど)は対象外になりそうです。

初スマはVIP前後部門もありますが、参加資格が制限されていることに変わりはありません

では篝火#5はどうでしょうか。

実は、篝火#5にも参加資格があります*2

下記に該当する方は、当イベントに参加できません。

当日に発熱(体温が37.5℃以上、または平熱比+1℃)のある方や、体調がすぐれない方(味覚・嗅覚異常を含む)

新型コロナウイルス感染症陽性者との濃厚接触がある方

過去14日以内に海外への渡航、並びに当該在住者との濃厚接触がある方

※昨今の情勢を鑑み、現時点では参加可能地域の制限を設けません。

篝火#5 / Kagaribi#5 | Details より

にも関わらず、JJPRでは篝火#5をオープントーナメントと見なして対象にしています。

それはなぜでしょうか?

競技テニスにおける事例

このコロナ禍においては、競技テニスにおいてもオープントーナメントの定義を問われるような事例が出ています。

news.yahoo.co.jp

四大大会と呼ばれる最高権威の大会である来年度の全豪オープンにおいて出場資格に2度のワクチン接種を義務付けられているため、世界ナンバーワンであるジョコビッチ選手の出場が危ぶまれている事態が起きているのです。

全豪オープンをオープントーナメントではないと指摘する人はほとんどいませんが、定義によるとオープンであるとは言い切れなさそうですね。

ここで、オープン性が重要な理由に立ち返って考えてみましょう。

オープンの意義

オープンであることの重要性の一つは「強さを正確に反映するため」です*3

スマブラの実力が非常に高い人が参加資格を満たしていないために大会に参加できずランキングにも載らないと、強さを正確に反映したランキングとは言えません。

強さの前では公平であることが重要なのです。

参加資格はないべきなのか

では参加資格を完全になくして、本当に万人に開かれていることが望ましいかというと、そうではありません。

例えば、過去の大会でルール違反の改造コンを使ったプレイヤーは参加資格を失っても仕方ありません。

さらに、極端な場合として強豪プレイヤーに大会会場に着くまでの足止めをするなど物理的な嫌がらせをしたら資格を失うでしょう。

大会自体に直接関係のないケースとしても、窃盗事件の保護観察処分中の少年に参加資格を与えないことも自然でしょう*4

一般に、公序良俗に反する場合は参加資格を制限されてもオープントーナメントであると考えられるのです*5

JJPRが考えるオープントーナメント

ところで公序良俗とはなんでしょうか。

kotobank.jp

ややこしいですが、いわゆる道徳だと考えておけばよいでしょう。

しかし、道徳観は人によって異なります。

私の道徳観に従うと、まん延防止等重点措置が実施されている最中にオフ大会に参加することは公序良俗に反します。

www.bousai.metro.tokyo.lg.jp

篝火#4が開催された6/26-27の東京都はまん延防止等重点措置の真っ只中にありました

私と似た道徳観を持ち、まん延防止等重点措置中のオフ大会である篝火#4の参加を自粛した方もいるかもしれません。

そのため、その期間の大会がJJPRに入るとフェアではないと考えられる*6ので、JJPRでは対象大会の期間を2021/10/1以降に設定しました*7

参加資格と公平性

ただ公序良俗のためという名目であっても、参加資格による制限を増やすと当然、強さに対する公平性は失われていきます。

smash.gg

WINNER!#5はワクチン接種済み証明が義務付けられているので、持病などの関係でワクチン接種ができない人は参加資格がそもそもありません

とはいえ真に公平性を確保するのは難しく、この問題については改めて別の記事で取り上げられればと思います。

*1:トーナメントについては説明不要でしょう

*2:篝火#4もsmash.ggに記載されている参加資格は同様です

*3:コミュニティの健全性などの話もありますが、今回は触れません

*4:大会の機材や持参Switchの盗難の恐れを避けるため

*5:全豪オープンはワクチン未接種は公序良俗に反すると考えているようです

*6:これはあくまで私の道徳観による見解なので、各大会の運営主体がオープントーナメントと見なしている可能性があることはご承知おきください

*7:以前の記事で、ランキングの多様性について軽く触れましたが、この道徳観を考慮した対象大会の設定も多様性の一側面です

JJPR(Jak式JapanPowerRanking)の紹介と制作意図

自己紹介

じゃくと申します。

スマブラSPはオンライン対戦をやりながら、主に観戦勢として楽しんでいます。

スマブラは全シリーズプレイしてきたのですが、オフラインで友人とワイワイ遊ぶ程度でした。

EVO2019の結果から競技シーンに興味を持ち、EVOJapan2020から本格的に観戦勢になりました。

EVO2019のTOP8に入ったダックハント使いの日本人プレイヤーがいることを知り、本格的に競技シーンに興味を持ち始めました

現在は国内・海外の大規模大会はもちろん、国内の中規模大会や平日大会も配信があればほとんど見ています。

 

JJPR(Jak式JapanPowerRanking)の紹介

JJPRという国内のスマブラ競技シーンで活躍するプレイヤーたちのランキングを制作しました。

JJPRへのリンク

f:id:jak_amano:20211207030145p:plain

(参考)2021/12/07時点でのJJPR

smash.ggから自動で大会結果を取得するため、毎日機械的に更新されます。

smash.gg

smash.ggは競技プレイヤーにとっては馴染み深いツールのはず

このランキングをひと目でも見ていただければ本記事の目的は達成されるのですが、せっかくなのでなぜランキングを作ろうと思ったのかを書いておきたいと思います。

 

ESPRについて

JPRに変わるランキングについては、EMageさんが作成したESPRというランキングがあります。

twitter.com

ちなみに、EMageさんの所属する大信州スマブラ同好会は長野県松本市で松スマという大会を開催しているらしいです

Haruki氏がJPRを制作していない今、非常に価値のある仕事だと思います。

しかし、

  • EMageさんの主観が計算に影響する(特定大会のポイント2倍・特定順位での計算打ち切り)
  • コロナ禍期間の大会も計算に含めている(期間中に大会が多く行われていた関西偏重になりがち)

というところには賛同しかねます。

そのため「お前がやれ」の精神でJJPRを制作しました。

 

複数ランキングが存在することについて

複数のランキングが存在すると、どのランキングを見ればよいのか分からなくなり使いづらいという意見もあるかと思います。

私は長らく競技テニスの観戦勢でもあります。

男子テニスのランキングであるATPポイントランキングとHaruki氏の制作したJPRは非常に似通っているのですが、大きな違いがあります。

ATPはそもそもツアーという大会群を主催しており、それぞれの大会はATPツアーの1つとして開催されています。

つまり、ATPランキングは大会群の主催によるランキングであり、ATP自体に権威があります。

 

f:id:jak_amano:20211202013153p:plain

Nitto ATP FINALS 2021の出場選手 © ATP Tour

field-is-set-nitto-atp-finals-2021-nitto | News Article | Nitto ATP Finals | Tennis より

ATPは年末にその年に好成績を収めた上位8選手を集めたATP FINALSという大会を開催しており、SWTはこの方式を参考にしている*1と考えられます

対してスマブラコミュニティは大会ごとに主催が異なります*2

Haruki式JPRでは7つの大会に擬似的に権威があると見なし、それらの結果に絞ったランキングとなっています*3

大会主催とランキング制作者が異なる以上、統一的で権威のあるランキングを作成することは原理的に不可能です。

この点を考慮すると、どの大会に権威があると見なしているかによって*4多様なランキングが作られるべきです。

私もJJPRが最終的な答えだとは考えていませんが、個人的にはESPRよりは好ましいと考えています。

多くの利用者によってランキングに関する議論が活性化し、デファクトスタンダードとなるランキングが選択されていくことが妥当だと考えられます。

 

JJPRの特徴

JJPRは客観性を重視したランキングを目指しています。

公平なランキングを目指し、逆にこのランキングで上位になるためにはどうすればいいか(どの大会で結果を残せばいいか)が明確になっていることを大事にしています*5

毎日ランキングが機械的に更新されるのは、もちろん利便性のためでもあるのですが、属人性を排除するためでもあります。

ほとんどの計算をHaruki式JPRと同じにしていますが、以下の点が異なります。

  • 対象大会の変更(指定7大会から61人以上の大会に変更)
  • 大会ごとのポイント合算ルールの変更(参加した大会の平均ポイントを6大会に換算から4大会のポイント合算に変更)

コロナ禍の影響で開催状況の足並みが揃っていないため、指定の大会を対象にすることをやめ、人数規模でのみ対象大会を決めています。

61人以上の大会を対象にしているのは、サブファイターを試したりすることが多い平日大会の結果を反映させないためです*6

換算方式を取りやめたのは、私自身がより多くの強豪プレイヤーがより多くの大会に参加してもらうことを望んでいるからです。

その上で、大規模大会に年間6回も参加することが困難な地方プレイヤーに配慮し、4大会に減らしました。

 

今後の課題

まずJJPRの認知度が全く足りません。SNSなどで拡散していただけると大変喜びます。

smash.ggで管理されていない大会が多いことも課題の1つです。

運営・参加者の手間もあるとは思いますが、大規模・中規模大会は可能な限りsmash.ggで管理していただけると私が喜びます。

www.pgstats.com

smash.ggで行われたトーナメントはPGstatsにも反映され、選手同士の対戦成績などの統計が見れるのでメリットは大きいです

最後にお断りさせていただきたいのは、計算が誤っている場合があるということです。

特に、自動的に大会を取得しているのですが、サブイベントやチーム大会が計算に含まれてしまう可能性があります。

これを防ぐための対応は随時行っていく予定ですが、見逃したり対応が困難な場合がありえます。

 

最後に

本記事は「スマブラ Advent Calendar 2021」の1記事です。

adventar.org

明日は浅島さんによるスマサーリーグの紹介らしいです。こちらもお楽しみに!

twitter.com

浅島さんはデデデ窓主でもある強豪デデデ・格ミー使いです

 

文字ばかりで読みづらい記事となってしまいましたが、最後までお読みいただきありがとうございました。

*1:コロナ禍の影響でオンライン予選に変更される前の方式の話です

*2:SWTが今後ツアーを主催する主体になる可能性はありそうです

*3:ESPRも同様にメースマやグランドスラムの結果は排除されています

*4:対象大会だけでなく、順位ごとのポイント数など他の要素もランキングの独自性になります

*5:ランキングの客観性と主観性についての詳細は

優れたプレイヤーだけを選抜したいときの「誤検出(偽陽性)」と「検出漏れ(偽陰性)」の話 - @harukisbのScrapboxをご確認ください

*6:64人規模を想定していますが、直前キャンセルなどの影響を考慮して61人以上としています