data_literacy:dataset
【データリテラシー】データセット
データセット1
- ダウンロード:dataset1.csv
- 文字コード:Shift_JIS
コンピュータの乱数で生成した架空のデータセットで、ある架空の母集団から500人の標本抽出を仮定している(標本サイズ $n=500$)
変数 | 範囲 | 母集団 |
---|---|---|
性別 | 男,女 | 一様分布($p=0.5$) |
年齢[歳] | [17, 35] | 指数分布 |
身長[cm] | [144.2, 185.2] | 男:正規分布 $N(171,5.5^{2})$ 女:正規分布 $N(157,5.0^{2})$ |
体重[kg] | [33.7, 88.1] | 男:対数正規分布 $\Lambda(4.10,0.14)$に近い 女:対数正規分布 $\Lambda(3.95,0.13)$に近い |
- 身長と体重は性別で差がある。
- 身長と体重は相関を持たせている。
データセット2
- ダウンロード:dataset2.csv
- 文字コード:Shift_JIS
コンピュータの乱数で生成した架空のデータセットで、ある架空の母集団から500人の学生の標本抽出を仮定している(標本サイズ $n=500$)。
変数 | 範囲 | 母集団 | |
---|---|---|---|
学年 | [2,4] | 一様分布 | |
コース | 経営, 政策, 福祉, 国際, 観まち, 情報 | 割合 16:34:13:12:15:10 | |
授業外学習時間[h] | [14.4, 216.8] | 正規分布 $N(98,30^{2})$ | |
科目 | 経営学基礎 | [0,100] | |
地域政策論 | [0,100] | ||
地域福祉演習 | [0,100] | ||
実用英語 | [0,100] | ||
観光論 | [0,100] | ||
情報学 | [0,100] |
- ここにある科目は架空の科目で、値は各科目の成績評価の点数(100点満点)である。
- 各科目の成績評価は授業外学習時間と相関がある。
- 各科目の成績評価は公益大22の力を組み合わせて生成している。
data_literacy/dataset.txt · 最終更新: 2024/09/09 05:31 by you