library(readr) # データの読み込み df <- read_csv("yamagata.csv", locale = locale(encoding = "SHIFT-JIS")) df$`/項目` <- NULL df$調査年 <- as.numeric(sapply(df$調査年, gsub, pattern="年度", replacement = "")) df <- df[order(df$調査年),] # 市 df1 <- df[grep("市$", df$地域),] # 町村 df2 <- df[grep("町|村$", df$地域),] # 2015年度の人口増減率を母集団とする pdata1 <- df1[df1$調査年 == 2015,][["#A05101_人口増減率【%】"]] pdata2 <- df2[df2$調査年 == 2015,][["#A05101_人口増減率【%】"]] # 標本抽出 set.seed(1) sdata1 <- sample(pdata1, 8) sdata2 <- sample(pdata2, 10) # 標本平均と不偏分散 print(sprintf("市 : m = %d, xbar = %g, s1^2 = %g", length(sdata1), mean(sdata1), var(sdata1)), quote = FALSE) print(sprintf("町村 : n = %d, ybar = %g, s2^2 = %g", length(sdata2), mean(sdata2), var(sdata2)), quote = FALSE) # 分散の比の検定(F検定) result.var <- var.test(sdata1, sdata2) print(result.var) # 平均の差の検定(t検定) result.t <- t.test(sdata1, sdata2, var.equal = TRUE) print(result.t) # 平均の差の検定(ウェルチの検定) result.welch <- t.test(sdata1, sdata2) print(result.welch)