0人が本棚に入れています
本棚に追加
基準タイムの検証
基準タイムを作ったわけですが、これが正しいモノサシとして使えるのかを検証する必要があります。
回帰分析によって、各競馬場のコース・距離・馬場状態の基準タイムを作りました。
このモノサシで過去10年のデータを測ってみましょう。
回帰分析に使用したデータ(走破タイム)と基準タイムの差を求め、全てのデータ(35933個)の数でヒストグラムを作ってみました。御覧のとおり、ほぼ左右対称の釣り鐘型になりました。
全体のタイム差の平均は「0.0」になりました。(当然の結果です)
高さにムラがありますが、これは、基準タイムの作成に使用した4つの要素(競馬場・コース・距離・馬場状態)以外の競走馬の要素によるものです。
基準タイムを使って走破タイムとのタイム差を出しただけでは、扱い辛い数値になっています。
そこで、扱いやすい数値に変換してみましょう。
アンドリュー・ベイヤーは、0から100までのベイヤー指数に変換しました。
ベイヤーが行った方法は分かりませんが、100点満点の数値でタイム差を表現するためには次の方法があります。
ヒストグラムから正規分布であると言えることから、Z値に変換し、更にZ値を正規化することで、0~1の間の確率に変換します。
確率を100倍すると、100点満点の数値で表すことができます。
ただし、Z値を求めるにあたって、平均値だけでは求めることができず、標準偏差が必要になります。
上図のヒストグラムの標準偏差は「1.5」になりました。
これで、基準タイムを使用して競走馬の要素の評価が100点満点の数値で表すことが出来るようになりました。
ハーバード大学卒業生であるベイヤーも同じ方法を使った可能性が高いと思います。
最初のコメントを投稿しよう!