【データリテラシー】データセット

データセット1

コンピュータの乱数で生成した架空のデータセットで、ある架空の母集団から500人の標本抽出を仮定している(標本サイズ $n=500$)

変数 範囲 母集団
性別 男,女 一様分布($p=0.5$)
年齢[歳] [17, 35] 指数分布
身長[cm] [144.2, 185.2] 男:正規分布 $N(171,5.5^{2})$
女:正規分布 $N(157,5.0^{2})$
体重[kg] [33.7, 88.1] 男:対数正規分布 $\Lambda(4.10,0.14)$に近い
女:対数正規分布 $\Lambda(3.95,0.13)$に近い

データセット2

コンピュータの乱数で生成した架空のデータセットで、ある架空の母集団から500人の学生の標本抽出を仮定している(標本サイズ $n=500$)。

変数 範囲 母集団
学年 [2,4] 一様分布
コース 経営, 政策, 福祉, 国際, 観まち, 情報 割合 16:34:13:12:15:10
授業外学習時間[h] [14.4, 216.8] 正規分布 $N(98,30^{2})$
科目 経営学基礎 [0,100]
地域政策論 [0,100]
地域福祉演習 [0,100]
実用英語 [0,100]
観光論 [0,100]
情報学 [0,100]