ユーザ用ツール

サイト用ツール


data_literacy:dataset

【データリテラシー】データセット

データセット1

  • ダウンロード:dataset1.csv
  • 文字コード:Shift_JIS

コンピュータの乱数で生成した架空のデータセットで、ある架空の母集団から500人の標本抽出を仮定している(標本サイズ $n=500$)

変数 範囲 母集団
性別 男,女 一様分布($p=0.5$)
年齢[歳] [17, 35] 指数分布
身長[cm] [144.2, 185.2] 男:正規分布 $N(171,5.5^{2})$
女:正規分布 $N(157,5.0^{2})$
体重[kg] [33.7, 88.1] 男:対数正規分布 $\Lambda(4.10,0.14)$に近い
女:対数正規分布 $\Lambda(3.95,0.13)$に近い
  • 身長と体重は性別で差がある。
  • 身長と体重は相関を持たせている。

データセット2

  • ダウンロード:dataset2.csv
  • 文字コード:Shift_JIS

コンピュータの乱数で生成した架空のデータセットで、ある架空の母集団から500人の学生の標本抽出を仮定している(標本サイズ $n=500$)。

変数 範囲 母集団
学年 [2,4] 一様分布
コース 経営, 政策, 福祉, 国際, 観まち, 情報 割合 16:34:13:12:15:10
授業外学習時間[h] [14.4, 216.8] 正規分布 $N(98,30^{2})$
科目 経営学基礎 [0,100]
地域政策論 [0,100]
地域福祉演習 [0,100]
実用英語 [0,100]
観光論 [0,100]
情報学 [0,100]
  • ここにある科目は架空の科目で、値は各科目の成績評価の点数(100点満点)である。
  • 各科目の成績評価は授業外学習時間と相関がある。
  • 各科目の成績評価は公益大22の力を組み合わせて生成している。
data_literacy/dataset.txt · 最終更新: 2023/08/10 10:45 by you