YAMASHITACHOU CRONOMETRO

SAUCE DEVELOPMENT 所属 TTスペシャリスト見習いのBlog

Strava区間エクスプローラーの活用とデータ拡張

Stravaの区間エクスプローラーを使い倒す

今回も「Data × Training」の切り口で一つ。
例によってマニアックです。

Stravaにはセグメント機能(区間エクスプローラー機能)があるのはご存じの通り。
過去の全挑戦者のリーダーボードや、フォローユーザーに絞る機能等があります。
その中に「My結果」フィルタがあるんだけれども、これが実はとても有用。
特定のセグメント(区間)を定期的に攻め続けた上でこの機能を使うと、自身の成長や衰えがとてもよくわかります。

実際の画面からわかること

以下は距離300m、平均斜度9%、獲得32mの短い坂を2014年5月から登り続けた結果の画像。
練習ルート一発目の坂がこの坂なので、基本条件は毎度一緒(ただし2017に入ってからはルート変更に伴って登るのが練習の最後になったのでタイムが芳しくない)

f:id:shinichiarimasu:20170419150925j:plain

パッと見てわかるのは2015年の夏頃が最もタイムが良かったんやなーだったり、タイムと出力の相関に若干バラつきがあるなーって事。
これだけでもかなり色々な事が見て取れはするけれどももうちょっと時期毎の傾向や変化等を見てみましょう。

BoxPlot(箱ひげ図)で見る年毎のパフォーマンス傾向

測定条件が違う2017年のデータを除いた上で、区間のゴールタイムを年毎にBoxPlotしています。
試行回数は14年が9回、15年が17回、16年が8回。
15年は44秒と一番早く登れた年でもあるし、中央値も45.5秒、第一・第三四分位間も最も狭く、全体を通してパフォーマンスが良かった年だったという事がはっきりとわかりますね。

出力も同様に見てみると、ほぼ同じ傾向で推移しているものの、15年のレンジはタイムのそれ程には狭く無い事がわかります。
これはゴールタイムと出力の相関が完全では無い事に起因しています。
つまり、出力以外の説明変数に、体重や路面コンディション、空気密度等が存在し、それらの寄与度でタイムが変化するからですね。
ちなみにゴールタイムと出力の2変数でコリレーション分析すると係数は-0.748という事なので、(他の要素に比べ)強い相関でした。

Strava以外のデータも使って拡張分析をしてみる

気象庁から練習地点付近の過去気象データを引っ張ってきて、気温と気圧をJoinしてみるとこんな感じ。
割と相関ありそうに見えなくもない。

では相関は実際のところどうなのかというと。

気温はゴールタイムとはほぼ無相関、出力とは非常に弱い相関といった具合。
寄与度が高いと想定していた気圧はゴールタイム、出力共にほぼ無相関という結果に…
※今回の区間の距離や斜度条件だから無相関になってるだけであって、もっと長い区間や登坂条件だとここは結果変わります。

最後に

日々トレーニングデータを意識して貯め込んでいると後から振り返って色んな事がわかって面白いのでとてもお勧めです。
今回は気象データをJoinしてみましたが、体重、TSB、CTLが上昇トレンドなのか下降トレンドなのか、等の変数をJoinした上で分析が可能になり、ファクトベースで自身の特性やパフォーマンス調整方法を検討する事が可能となりますよ。
(このマニアックな記事を最後までちゃんと読んでくれる奇特な人ははたしてどの位いるのだろうか…)