高等学校の教科書・教材|知が啓く。教科書の啓林館
数学

「高等学校統計実践報告②「仮説検定」

神戸大学附属中等教育学校 数学科教諭
神戸大学・数理・データサイエンスセンター客員研究員
林 兵馬

1.はじめに

HP上で計3回,本校で実践を進めてきた学校設定科目データサイエンスⅠ(DSⅠ),データサイエンスⅡ(DSⅡ)からの実践報告の第2回目である。第1回は,「散布図・相関係数」を取り上げた。第2回目は,「仮説検定」について実践報告する。本校では2020年より学校設定科目「データサイエンス1・Ⅱ(DSⅠ・Ⅱ)」を開講し,教科数学として統計を高校生に指導している。生徒が教科書内容を理解し,確率・統計を実際に使ってみようと思えることを目標に進めてきた。今回はその中で,いかに仮説検定を指導したか,また苦慮した点などを各学校の先生方と共有できれば幸いである。

2.数学Ⅰ「仮説検定の考え方」

まず,今回の指導要領改訂に伴い数学Ⅰに新しく学習項目に加わった「仮説検定の考え方」の学習内容について報告をする。
「仮説検定の考え方」の指導上の重要な点は,「滅多に起こらないかどうかを判定する」ことを生徒が理解する点にあるだろう。これまで高校1年生時点までで生徒が触れてきた数学では,求値および証明できるものがほとんどである。滅多に起こらないかどうか判定を行う仮説検定の考え方に慣れるには,やや時間がかかると思われる。

筆者が勤務校で実践を行ったのは令和2年度であったため,新カリキュラムの教科書が存在しなかった。また学校設定科目であるDSⅠではある程度自由にカリキュラムを設定できた。そのような背景もあり,令和2年に実践したDSⅠでは,新課程にあるような「仮説検定の考え方」の項目を挟まずに,初めから数学Bにあるような仮説検定に入った。後述するが,数学Bの「仮説検定」の内容は,帰無仮説や対立仮説を生徒が立てられるようになることが目標の一つになるだろうが,初めから帰無仮説や対立仮説の話に踏み込んでよいのかどうかは,生徒の実態による。現在では,まずは「ある場合が滅多に起こらないかどうかを判定する」ことを生徒に理解させることに注力すべきと考えている。この検証は引き続き行っていきたい。

さて,数学Ⅰ「仮説検定の考え方」の実際の指導について述べていく。上述の通り,数学Ⅰ「仮説検定の考え方」にあたる授業は実際には行わなかったのだが,新しい課程の教科書が各社でそろい,実践を踏まえて本年度授業を行うならば,この様な構成で行う,というものを示す。
例えば,

のような問題は,仮説検定の考え方を理解する上ではよいと考える。

ただし,起こりうる生徒の反応として「30人中24人がPを好むから,Pの方が好むに決まっている。確率も24/30=0.8だし。」が想定される。教科書では,問題文のあといきなり「PとQを好む人は半々であると仮定する。このとき,30人中24人Pを好むと答えることがどれくらい起こり得るかを調べてみる。」という記述が始まる。十分に生徒に発問や活動などを計画し,いままで学習してきた確率の計算と異なり,「ある場合が起こりにくいかどうかを判定する」ことは一体何をしているのかを生徒が十分理解することが寛容である。その後教科書では,この後硬貨を30枚投げて記録することを1000回行うので,仮説検定の考え方がわかっていなければ混乱する可能性は十分にある。
また,上記教科書では,「表裏が同じ割合で出る30枚の硬貨を同時に投げて表が出た枚数を記録することを1000回行った。」と書かれて「サイコロを100回投げて1の目が出た回数を記録することを1000回行った結果をまとめた」表が掲載されているが,指導の際はヒストグラム等を見せ,確率を可視化し,数学Bの確率分布につなげるとよいと思われる。
数学Aの「場合の数・確率」の指導が終えている場合,Approach以前に以下のような問題を取り扱うことが考えられる。

問題1-1
AチームとBチームが20試合あるゲームで対戦したところ,Aチームが16勝した。Aチームの方が勝ちやすいと判断してもよいか。ただし,全試合の各チームの条件は変わらないものとし,引き分けはないものとする。ただし,起こる確率が5%より小さいのであれば,ほとんど起こり得ないと判断する。

試行回数を減らして生徒の状況によっては生徒に手計算をさせることや,このようなExcelファイルを用いて確率を可視化するのもよいと思う。確率の計算も手早くできる。数学Bの「仮説検定」まで指導を考えた場合,確率分布も理解させたいので,Excelファイルを用いて授業を行なった。

その後,生徒に問題1-1のような身の回りにある現象を考察し,レポートにまとめる課題を課した。
特に注意すべき点は以下のように感じている。

特に②はp値の大小で起こりやすさが比較できるなどの誤解があると思われるがそんなことはない。あくまで事前に設定した 5%(有意水準)と比較するためのものに過ぎない。
上記の内容は,株式会社 社会情報サービスの「BellCurve」にわかりやすい解説があるので,参照されたい。
統計WEB>統計用語集>英字>P値(bellcurve.jp)
統計WEB>統計学の時間>Step1.基礎編>23.検定の前に>23-2.検定で使う用語(bellcurve.jp)
また,p値に関しては,一般社団法人 日本計量生物学会に掲載のASAの声明も参考になると思う。
ASA.pdf (biometrics.gr.jp)

3.数学B「仮説検定」

新学習指導要領によると,数学Bの「仮説検定」の学習項目には,正規分布を用いた仮説検定として,母平均に関する検定が挙げられている。また,数学Ⅰでは「仮説検定の考え方」にとどまっていたが,数学Bでは,以下のように「仮説検定」そのものを指導するように言及がある。

一般に,仮説検定は次のような手順で行われる。

  • 1)ある事象Eが起こった状況や原因を推測し,仮説を立てる。
  • 2)その仮説を数学的に記述することで,統計的に実証したい仮説H1(対立仮説)を立て,その否定命題としての帰無仮説H0を考える。
  • 3)帰無仮説H0 が真であると仮定した場合に事象Eが起こる確率 p を求める。
  • 4)実験などを行う前に決めておいた「滅多に起こらないと判断する基準(確率の値)」(有意水準)と p とを比較して,帰無仮説H0 が真であると考えることを否定できるかどうかを判断し,仮説の妥当性を判断する。

筆者が学校設定科目DSⅠで指導した際は,最初に仮説検定を指導するタイミングで帰無仮説・対立仮説まで言及した。しかし実践を踏まえ,現在ではこれは指導対象の生徒の様子をしっかりと見た上で判断すべきと判断している。まず,数学Ⅰ「仮説検定の考え方」の「滅多に起こらないか否か」を十分に理解させたあとに,取り扱った問題と同様な問題を取り扱い,帰無仮説・対立仮説の書き方などになれることが肝要である。例えば,問題1-1を書き換えると以下である。

問題1-2
AチームとBチームが20試合あるゲームで対戦したところ,Aチームが16勝した。Aチームの方が勝ちやすいと判断してもよいか。有意水準5%で検定せよ。
ただし,全試合の各チームの条件は変わらないものとし,引き分けはないものとする。

問題1-1との差異は,
・用語「有意水準」
・帰無仮説と対立仮説を立てる
であろう。

適切に帰無仮説・対立仮説を立てることは生徒にとってハードルがとても高いと思われる。第一に数学Ⅰで学習した「滅多に起こらないか否か」の理解は非常に大切だと考えている。その上で,独立性の検定など検定の手法によって直感と反するところがあることがわかっている前提で提案をするのだが,

と,流れを理解させたい。

その流れを説明したのち,生徒には,

の6つを答えさせたい。

また,片側検定か両側検定の判断は,基本的にはある一定の値よりも大きいか小さいか判定する場合は片側検定,ある一定の値かどうかの場合は両側検定をとるが,両側検定の方が右側(もしくは左側)の棄却域が片側検定に比べてせまいため条件が厳しいことは含みおいてほしい。

問題2-1
兵庫県内のラーメン店の中から無作為に120軒抽出し,「並ラーメン」1杯の値段の価格を調べたところ,配布したセルの「並ラーメン価格データ」の通りだった。
(1) 並ラーメンのヒストグラムをかけ。
(2) 兵庫県内の並ラーメンの一杯の価格μは590円より高いかどうか,有意水準5%で検定せよ。

(1)の意図は,ヒストグラムをかくことで単峰性を確認させ,正規分布を利用していることを意識させることである。

また,練習用のデータセットを用いることにより,現実の問題としてとらえてほしいためである。また,ExcelではZ.TESTが用意されており,標準化の作業をせずに直感的に計算することができる。

また,正規分布を仮定した平均値との差の検定は,

ことは指導上の留意である。

また,実際の教科書の問題では,手計算で標準化を図らないといけないはずと思うが,同じ題材を用いて以下のような指導が考えられる。

問題2-2
兵庫県内のラーメン店の中から無作為に120軒抽出し,「並ラーメン」1杯の値段の価格を調べたところ,平均は606.5円,標準偏差は77.0円であった。
兵庫県内の並ラーメンの一杯の価格μは590円より高いかどうか,有意水準5%で検定せよ。

仮説検定に入る前には,すでに標準化は学習済みであるはずだから,生徒にこの状況であればどのように処理をすればよいか発問をし,グループ活動等で考えさせてもよい。実際のデータセットからExcelの関数を用いて確率を求めることと,問題2-2の情報から結論をどのように得るのかを両方体験できると理解が深まるであろう。

仮説検定の考え方が理解できれば,状況に応じて2つの母平均の差の検定,t検定,独立性のx2検定,母比率なども指導可能であろう。状況によって検定の方法が違うが,例えば,繰り返しになるが,実践を通じて,

ことが生徒にとっても指導者にとっても鬼門であり,その点を乗り越えるべく十分な準備のもとに授業に臨むことが寛容であると考えている。この実践が少しでもお役に立てるのであれば,と考えている。

本実践を行う上で,『44の例題で学ぶ統計的検定と推定の解き方(上田拓治著)』を大変参考にさせていただいた。この場を借りて感謝する。

【参考文献】