4年生(高校1年生)の「情報Ⅰ」では、1年間の学びの集大成として「データサイエンス入門」の実習を行いました。
今の時代、データはどこにでも溢れていますが、それをどう読み解き、どう疑い、どう活用するか。「データサイエンス入門」では3コマの授業でその入口を学習します。
1. 「意外な関係」をデータから見つけ出す(1・2コマ)
まずは、都道府県別の統計データサイト「とどラン」を活用。設計されたスプレッドシート上で、相関関係がありそうな項目を組み合わせて分析します。
基礎的な統計量の復習・操作練習(1コマ目前半)後、仮説の立案からデータ収集、分析、結論までの一連の流れを体験し、2コマ目の後半は教室全体で「ギャラリーウォーク」を実施します。クラスメイトが立てた仮説を眺めて回ります。「えっ、これとこれが関係あるの?」という驚きや、ユニークな視点が光る仮説が次々と飛び出しました。
※シートの作成では、「「とどラン」でデータサイエンスの授業(アサンプション国際高等学校 岡本先生)」を参考にさせていただきました。
2. 自分の分析を深堀りする(3コマ)
一通りの分析を終えた後、自分たちの分析を振り返ります。
今年は
・相関係数の確かさ(外れ値の影響・直線以外の影響)
・相関関係と因果関係の検証(第3変数は考えられるか、時間的順序関係の逆転はないか)
をメインに検証しました。実際にはもっと多くの検証を重ねる必要があります。授業では統計を意味付けの1つとして人間は信じたいものを信じてしまう「確証バイアス」にも触れました。統計的に明らかにすることは、思い込みの打破にも役立ちます。
その後には、数学Ⅰの範囲では扱わない「回帰分析」にも挑戦。単に現状を知るだけでなく、「予測」にどう繋げるかという実用的な視点も学びました。
授業の後半では、e-Stat(政府統計の総合窓口)などのオープンデータに直接触れる時間も取りました。世の中には非常に多くのオープンデータが存在します。
- Let’s Start!!! ~e-Stat活用ナビ~ https://www.stat.go.jp/info/guide/public/kouhou/index.html
- RESAS https://resas.go.jp/
- e-Stat https://www.e-stat.go.jp/
- SSDSE(教育用標準データセット) https://www.nstac.go.jp/use/literacy/ssdse/
時間数に余裕のあったクラスでは、クラス全員で「日出学園オープンデータ集」を作成し、公的なデータを自分たちの手でそのまま分析する楽しさを味わいました。こちらもギャラリーウォークを実施し、お互いの知らないデータの発見に繋げます。
生徒たちの声(振り返りより抜粋)
- 統計はまとめただけのもので分析をするのではなくその背景も考えつつ結論を出すことが大切なのだなと思った。
- e-statで総労働時間の見たとき、4月や6月、10月~11月に増えていた。5月や8月、12月に休暇を取るためにその分働いてるということなんだろうか?
- e-Statの統計グラフより、サービス産業の売り上げがどんな年でも3月が一年で一番高いことが分かった。みんな卒業祝いや次の年度のための物を買ったりしているのだろうか?
- 今まで数学で使ってきた相関の定義を考えさせられた。数学では問題を解くために決まった型を使っているため疑問に思うことはないが、情報の授業では見方のために疑問を持つようになる、という違いを感じられた。
- 今回の授業を通して将来もし起業する時があったらデータ分析をしてその場所にあった商品提供だったりサービス提供をしていきたいなと思った。
- 思い込みの力ってすごいんだなと思った。訓練したらもっと多角的な視点を持てるような気がするので、少し意識していきたいと思った。
- 順序尺度のみでデータの分析を進めるのは良くないというのは、定期試験の振り返りに役立つ考え方だと思った。
- ほんとに難しかった。正直仮説を立てて調べていくことが一番たいへんだった。今のこの情報社会において、表面上だけのデータで判断しないよう気をつけていく必要があるように感じた。
- 統計結構面白い分野だった。ぱっと見は関係がありそうなことでも冷静に立ち止まって考えたらおかしいなってなるようなことって案外身の回りにありそうだなと思った。
生成AI時代には「問題解決」以上に、自ら問いを立てる「問題発見」が重要だと言われています。 しかし、何もないところから問題を見つけるのは至難の業です。色々なデータに触れ、データ分析のイメージを掴む中で、そこから生徒の中にも自然に様々な問題・疑問が出てくるのではないかと思っています。







