メーカーでデータアナリストをしている筆者(専修大学ファン)が、箱根駅伝のデータを統計学の視点で分析してみました。
専修大学がシード権を獲得するには各区間を10位前後で走る必要があるだろう…ということで、区間10位相当のタイムを出すにはどれくらいの持ちタイム(1万m)が必要かを調べてみました。
今回の分析内容
第99回から第97回出走者の持ちタイム(1万m)と実際の区間タイムから、区間10位相当のタイムを出すにはどれくらいの持ちタイムをが必要か?を分析してみました。
①区間別に1万mの持ちタイムと区間タイムとの相関係数を確認
②Excelの予測関数FORECAST.LINEARを使って区間10位相当のタイムを出すために必要な1万mの持ちタイムを予測
※ 相関係数は、0.0~0.2ほぼ相関関係がない 0.2~0.4やや相関関係がある 0.4~0.7かなり相関関係がある 0.7~1.0強い相関関係がある と理解します
※ 持ちタイムは各年12月に発表されるチームエントリー表に記載の公認最高記録を使用しています
※ 分析対象は関東学生連合を含む各区間63人です(1万mの持ちタイムがない選手は除外)
※ ハーフマラソンの持ちタイムは区間タイムとの相関があまり高くなかったので使用しません(1万mほど記録機会が多くないため実力を反映しきれていないと思われます)
※ 専修大学が目指しているのはシード権獲得なので『区間10位を目指すには』という視点で書き進めます
※ 各データは箱根駅伝公式ホームページに掲載されている情報をもとに作成しています
1区 大手町~鶴見(21.3km)
第99回 区間賞1:02:44 区間10位1:03:09
第98回 区間賞1:00:40 区間10位1:02:03
第97回 区間賞1:03:00 区間10位1:03:31

第98回が異常なハイペースだったこともあり意外に感じますが区間賞は概ね1時間2分台、区間10位は1時間3分台前半のようです。(98回で木村選手は1万m持ちタイム29分台ながら区間1:01:24で走っていますがこれは異常値に近いとご理解ください)
1万mの持ちタイムと区間タイムはやや相関しておりFORECAST.LINEAR関数を使った予測によると、区間10位相当を狙うには1万m28分40秒程度の持ちタイムが必要なようです。
2区 鶴見~戸塚(23.1km)
第99回 区間賞1:06:22 区間10位1:08:05
第98回 区間賞1:06:13 区間10位1:07:21
第97回 区間賞1:05:49 区間10位1:08:05

区間賞を狙うには1時間6分台前半、区間10位は1時間8分前後が必要なようです。
1万mの持ちタイムと区間タイムはかなり相関しておりFORECAST.LINEAR関数を使った予測によると、区間10位相当を狙うには1万m28分20秒程の持ちタイムが必要なようです。
よって、ダンカン選手は持ちタイム的には区間10位程度のタイムを出せる力が十分にあると言えそうです。今年は直前の体調不良の影響か1時間9分5秒(区間16位)と苦戦しましたが来年は期待したいです。
3区 戸塚~平塚(21.4km)
第99回 区間賞1:01:51 区間10位1:02:36
第98回 区間賞1:00:55 区間10位1:03:10
第97回 区間賞1:02:05 区間10位1:04:25

区間賞は1時間2分前後、区間10位は1時間3分前後のタイムが必要なようです。
1万mの持ちタイムと区間タイムはやや相関しておりFORECAST.LINEAR関数を使った予測によると、区間10位相当を狙うには1万m28分45秒程の持ちタイムが必要なようです。別途記事でも触れた通り3区は重要区間なので木村選手のようなエース級を起用するべきです。
4区 平塚~小田原(20.9㎞)
第99回 区間賞1:00:00 区間10位1:02:46
第98回 区間賞1:01:08 区間10位1:03:08
第97回 区間賞1:02:15 区間10位1:04:07

今年区間記録が更新されましたが区間賞は概ね1時間1分切り、区間10位は1時間3分前後のようです。4区は1万mの持ちタイムと区間タイムが全10区間のなかで最も相関していました。FORECAST.LINEAR関数の予測結果によると区間10位相当を狙うには1万m28分45秒あたりの持ちタイムが必要なようですので往路のレベルの高さを感じます。
5区 小田原~芦ノ湖(20.8㎞)
第99回 区間賞1:10:04 区間10位1:12:49
第98回 区間賞1:10:33 区間10位1:13:17
第97回 区間賞1:11:52 区間10位1:13:56

専修大学が毎年苦戦している5区ですが区間賞は概ね1時間10分台前半、区間10位は1時間13分台前半あたりでしょうか。
1万mの持ちタイムと区間タイムはやや相関してはいますが全10区間の中で2番目に相関係数が低いです。FORECAST.LINEAR関数を使った予測によると区間10位相当に必要な1万mの持ちタイムは29分20秒程度のようですが、5区は持ちタイムだけでは測れない山の適性も必要でしょうからあくまでも適性があったうえでの必要タイムとご理解ください。