内容へ移動
講義(山本裕樹)
ユーザ用ツール
ログイン
サイト用ツール
検索
ツール
文書の表示
バックリンク
最近の変更
メディアマネージャー
サイトマップ
ログイン
>
最近の変更
メディアマネージャー
サイトマップ
トレース:
data_literacy_past:2021:dataset
この文書は読取専用です。文書のソースを閲覧することは可能ですが、変更はできません。もし変更したい場合は管理者に連絡してください。
====== 【データリテラシー】データセット ====== ===== データセット1 ===== * ダウンロード:[[https://www.kitp.org/dataliteracy/dataset1.csv|dataset1.csv]] * 文字コード:Shift_JIS コンピュータの乱数で生成した架空のデータセットで、ある架空の母集団から500人の標本抽出を仮定している(標本サイズ $n=500$) ^ 変数 ^ 範囲 ^ 母集団 ^ | 性別 | 男,女 | 一様分布($p=0.5$) | | 年齢[歳] | [17, 35] | 指数分布 | | 身長[cm] | [144.2, 185.2] | 男:正規分布 $N(171,5.5^{2})$\\ 女:正規分布 $N(157,5.0^{2})$ | | 体重[kg] | [33.7, 88.1] | 男:対数正規分布 $\Lambda(4.10,0.14)$に近い\\ 女:対数正規分布 $\Lambda(3.95,0.13)$に近い | * 身長と体重は性別で差がある。 * 身長と体重は相関を持たせている。 ===== データセット2 ===== * ダウンロード:[[https://www.kitp.org/dataliteracy/dataset2.csv|dataset2.csv]] * 文字コード:Shift_JIS コンピュータの乱数で生成した架空のデータセットで、ある架空の母集団から500人の学生の標本抽出を仮定している(標本サイズ $n=500$)。 ^ 変数 |^ 範囲 ^ 母集団 ^ | 学年 || [2,4] | 一様分布 | | コース || 経営, 政策, 福祉, 国際, 観まち, 情報 | 割合 16:34:13:12:15:10 | | 授業外学習時間[h] || [14.4, 216.8] | 正規分布 $N(98,30^{2})$ | | 科目 | 経営学基礎 | [0,100] | | | ::: | 地域政策論 | [0,100] | | | ::: | 地域福祉演習 | [0,100] | | | ::: | 実用英語 | [0,100] | | | ::: | 観光論 | [0,100] | | | ::: | 情報学 | [0,100] | | * ここにある科目は架空の科目で、値は各科目の成績評価の点数(100点満点)である。 * 各科目の成績評価は授業外学習時間と相関がある。 * 各科目の成績評価は公益大22の力を組み合わせて生成している。
data_literacy_past/2021/dataset.txt
· 最終更新: 2023/08/10 01:38 by
you
ページ用ツール
文書の表示
バックリンク
文書の先頭へ