箱根駅伝順位予想方法
箱根駅伝まであと8日となりました。
ここ数年行なっている順位予想。これまで結果だけを掲載していましたが、今回はその算出方法について説明させていただきます。
■解析方法としては以下の流れになります。
Step1:各校、各選手のデータ入力
Step2:各校のデータによる補正
Step3:往路タイム、復路タイム、総合タイムよる順位予想
□Step1:各校、各選手のデータ入力の方法
①エントリー選手の「氏名」「学年」「出身校」「10,000m記録」「ハーフ記録」を入力します。
②」「10,000m記録」「ハーフ記録」が見つからない選手については、5,000mや20kmの記録から「10,000m記録」「ハーフ記録」に一定の係数(※1)に従い換算します。(参考:L選手とM選手)
③ハーフ記録で並び替えを行い、独自の方法で(※2)区間割を行います。
④ハーフ記録と区間割から、係数(※3)に従って、各区間タイムを算出します。
⑤ただし、特定の選手については④の係数ではどうにも合わないので補正を行います。(例:E選手=柏原君)
⑥1区から10区までの区間予想タイムから、各校の往路タイム、復路タイム、総合タイムが得られます。(ただし、ここではまだ基準タイムになります)
※その他:
・Step2のため、学年平均、平均記録、トップ1記録、トップ3記録、トップ10記録、標準偏差を算出しておきます。
・今後のため今回はエントリーに入らなかった選手も、データには記録しておきます。(Q選手、R選手)
①~⑥の結果により、各校で以下のデータが得られます。
□Step2:各校のデータによる補正
Step1で各校のデータが揃いましたので、Step2では様々な要素により、各校のレベルを想定し、タイム補正を行います。
要素は以下の項目です。
・シード校/予選会記録/初出場・学連選抜(シード校を有利と判定します)
・ハーフ平均記録
・ハーフトップ記録
・ハーフトップ3記録
・ハーフトップ10記録
・全日本大学駅伝結果
・出雲駅伝結果
・ハーフ平均標準偏差(標準偏差が小さい方を有利と判定します)
・エントリー選手学年平均(学年平均が高い方を有利と判定します)
各要素について出場20校の順位付けを行って、要素順位×各要素の補正値の和により各校の総合ポイントを求めます。そしてそのポイントにより、補正タイムを算出しします。
(この補正はデータ的に全く根拠がないので、補正方法は非公表とします)
□Step3:往路タイム、復路タイム、総合タイムよる順位予想
Step1の記録にStep2の補正タイムを換算して、順位予想記録としています。
その結果が「第88回箱根駅伝(2012)順位予想12/10版」となっています。
■まとめ
というわけで、こんな方法で順位予想を行なっています。
できるだけデータに基き、客観的に進めようと思ってはいるのですが、どうしても補正値には主観を入れてしまっていますね^^;
ということで、これらのデータは一つの参考として、本番当日の箱根駅伝の選手の頑張りに期待して下さい。
———————–
(※1)
5000m.1万m 2.1
5000m・ハーフ 4.5
1万m・ハーフ 2.198
2万m・ハーフ 1.06
(※2)
これについては根拠があまりないので内緒です^^;
(※3)
距離と勾配から補正しています。
区 距離 対ハーフ距離 勾配係数 総合補正
1 21.4 1.014 0.99 1.004
2 23.2 1.100 1.01 1.111
3 21.5 1.019 0.98 0.999
4 18.5 0.877 0.98 0.859
5 23.4 1.109 1.15 1.276
6 20.8 0.986 0.95 0.937
7 21.3 1.010 1.00 1.010
8 21.5 1.019 1.04 1.060
9 23.2 1.100 1.01 1.111
10 23.1 1.095 1.00 1.095
———————–