皆さん、こんにちは。
今回は、皆さんも人生に一度はお世話になり、悩まされ、振り回されたであろう数値「偏差値」について紹介します。
1. 偏差値
具体例を使って説明しようと思います。
橘君と速水君は、それぞれ100点満点のテストA,Bを受けました。
結果、以下のような点数だったとします。
一見すると、点数の高い速水君の方が優秀に思えます。が、受けてる試験が違うので単純比較はできません。
もしテストAが平均点の低い難しいテストで、テストBが平均点が高めな簡単なテストだった場合、実は速水君の85点は大したことなく橘君の75点はすごく高得点なのかもしれません。
というわけで、テストA,Bの平均点の情報を追加しましょう。
両者は同じ平均点のテストでした。
今度こそ、速水君の方が優秀!・・と言いたいところですが、これでもまだ単純比較ができません。
テストA,Bの得点分布を調べると次のようになっていました。
Aの方は平均点付近に人が集中しており高得点の人と低得点の人が極端に少ない分布になっていて、Bの方は高得点の人も低得点の人もそれなりにいる分布になっています。
平均点が一緒でも、得点のバラツキ方が違っていたのです。
それを踏まえて橘君と速水君の成績を見てみます。
テストAを受けた橘君の場合、極端に人数が少ない得点帯にいます。
テストBを受けた速水君の場合、まだそれなりに人数がいる得点帯にいます。
この分布を見ると、どうも橘君の方が優秀なように見えてきませんか?
そうです。成績を比較するには、平均点だけではなく、得点分布のバラツキ(標準偏差)を見なければいけないのです。
本当は分布の形状そのものも見る必要があるのですが、受験者の人数が十分多ければ中心極限定理どうして正規分布は統計学の最重要確率分布なのか? ~中心極限定理~ - ちょぴん先生の数学部屋 (hatenablog.com)から得点分布は正規分布になるため、その心配は通常要りません。
というわけで、標準偏差の情報も追加した以上の情報から、橘君と速水君のどっちが優秀かを評価したいと思います。
以上の考察から、優秀さを測る尺度は、以下の2つになります。
・平均から得点が離れていればより優秀
・平均からの差が同じな場合、標準偏差が小さいテストほど優秀
これを踏まえて、「偏差値」を次の式で定義します。
この式の本質的な部分は
であり、これは確率変数xを標準化したもので、平均0分散1の確率分布に従います。
(確率変数の標準化についてはこちら母集団の平均値を推定しよう ~スチューデントのt分布~ - ちょぴん先生の数学部屋 (hatenablog.com) )
係数の10や切片の50は、この標準化された数値を見やすくするための補正であり、特に50は、平均点を取った時に偏差値が50になるように設定してるものです。
橘君と速水君の偏差値をそれぞれ①を使って計算すると、
得点に反し、橘君が75、速水君が61.7で橘君の方が高いという結果になりました。
やっぱ一流ですね、橘さんは(それ言いたかっただけ笑)
2. 偏差値がいくらであれば上位何%?
偏差値の定義は以上の通りなのですが、では各偏差値帯がどの程度優秀なのか見ていきましょう。
偏差値が大文字Zのとき、次の標準化された確率変数zは標準正規分布に従います。
この性質から、偏差値の値が「上位何%」に相当するのかは、標準正規分布の面積で計算することができます。
この面積がα(Z)%だとすると、α(Z)は次の積分で計算できます。
となり、シンプソンの公式定積分をコンピュータに計算させる方法 ~数値積分~ - ちょぴん先生の数学部屋 (hatenablog.com)を利用して数値計算すると、
となります。
(↓Pythonでのプログラムです)
偏差値55だとあまり大したことないように見えますが実はこの時点で上位1/3には入っています。
偏差値60では上位1/5以内に、偏差値65では上位1/10以内に、偏差値70に至っては上位1/40以内に入ります。
3. 偏差値に振り回されないために意識すべきこと
偏差値を見る上では「テストを受ける母集団」を意識する必要があります。
3-1. 比較その1(中学vs高校)
「みんなの高校」というサイトで私の母校、茨高の偏差値を見ると、2024年9月時点で「68」となっていました。
(紹介記事を過去に上げています茨城高校野球部、感動をありがとう! - ちょぴん先生の数学部屋 (hatenablog.com) )
茨城高校(茨城県)の情報(偏差値・口コミなど) | みんなの高校情報 (minkou.jp)
一方、付属する中学校、茨中の偏差値は「45~47」となっています。
茨城中学(水戸市)偏差値・学校教育情報|みんなの中学校情報 (minkou.jp)
明らかに中学校の方が偏差値が低く出ていますね。
中学から高校に上がるといきなり優秀になったのか?
そうではありません。
この手の偏差値は、その地域で受けられる模擬試験などを参考に算出されます。
茨中を受験するのは当然小学6年生です。
模擬試験を受けるのは当然ながら中学受験をしようとしてる小学生ばかりであり、都内こそ4人に1人が受験するほどに中学受験が盛んな地域ですが茨城県を始め多くの地域では中学受験は少数派なのです。
一方で、茨高を受験するのは中学3年生です。
中高一貫校に通う人を除けば、全国津々浦々ほとんどの人が高校受験をしますよね。
要するに、中学受験と高校受験とでは受験生の母数が圧倒的に違うのです。
受験生の絶対数が多くなればなるほど色々な学力の生徒が参戦するので、その分平均点が低くなりますよね。
そして、統計学の性質から、n人標本抽出した場合分散は母集団(ここでは地域の同年代の子供全体)に比べて1/nになりますのでどうして正規分布は統計学の最重要確率分布なのか? ~中心極限定理~ - ちょぴん先生の数学部屋 (hatenablog.com)、参戦する人数が増えるとその分バラツキが小さくなります。
標準偏差σが小さくなり平均点μが小さくなれば、その分偏差値が高く出ることが定義式①から分かります。
このことから、一般的に同等の学力の学校であっても「中学校の偏差値」<「高校の偏差値」の傾向になります。
3-2. 比較その2(高校vs大学)
高校受験までは母集団はせいぜい「県」くらいまでです。しかし、大学受験となると母集団が「全国」に一気に拡大します。
優秀な生徒が全国から参戦してくるわけですから、大学受験の母集団は高校受験のそれとは中身が全く別物です。
それを意識しておかないと、
「俺の高校は偏差値70だから、MARCH(偏差値55~65くらい)なんて余裕だぜ!!」
と高をくくって痛い目を見る羽目になります。
高校の偏差値は「『その県の中で』どの程度の位置にいるか」を表している一方、大学の偏差値は「『全国の大学受験に挑戦する人たちの中で』どの程度の位置にいるのか」を表してるので、そもそも単純比較できません。
そして、最後はその大学・学部を受ける人たちの中での戦いになるのですから、その中でどの程度の位置にいるのかを把握できないと意味がありません。
だから、大学受験で成功しようと思ったら、自分の高校の偏差値に甘えることなく、定期的に模試を受けて自分がどの位置にいるのかを定点観測する必要があります。
3-3. 比較その3(模試の中での比較)
模試を受ける場合にも、その模試を受ける母集団を意識しないといけません。
全国の高校生が受ける主な模試は、
・進研模試
・河合全国模試
・駿台全国模試
の3つではないかと思います(私が現役だった15年以上前の話なので、最近は別の模試が流行してるかもしれませんが)。
進研模試はおそらく一番受験者人口が多いと思われ、学力が低めの高校が参加してる可能性が最も高い模試だと思います。
そのため平均点が低めで偏差値が高めに算出される傾向にあります。正直、大学受験の戦略を考える上では一番参考にならない模試だと思います。
河合全国模試は進研模試に比べれば問題のレベルも高く、受験者は進学校の生徒がメインになります。世間で流布される「大学の偏差値」はおよそ河合全国模試の結果に基づいて算出されており、大学受験を占う上で最もメジャーな模試だと言えます。
駿台全国模試は、この3つの中では最も難易度が高い模試で、進学校の中でも上位層・そして開成や桜陰、灘、筑駒といった全国区の超進学校の生徒がメインで受験する模試です。
こういう性質もあり、旧帝大や早慶などの難関大学や医学部を受験する人にとっては信頼のおける偏差値が出てきます。
何よりも一番いいのは、その大学の出題形式に沿った「大学別模試」を受けることです。もしあればの話ですが。
例えば東大模試(河合の東大オープン模試、駿台の東大実戦模試、東進の東大本番レベル模試etc)では、受験者は本番で東大を受験する人とほぼ重なりますので、「受験者の中でどの位置にいるか」という一番大事な情報を測るにはうってつけです。
このように、自らが受けたい大学のレベルに合わせて適切な模試を選んで受けていかないと、自分にとってはあまり意味のない偏差値の値に振り回されることになってしまいます。
というわけで、徒に偏差値の数字に振り回されず、うまく付き合っていきましょう。