第1章 統計学の基礎的事項 1 |
1.1 多次元データ解析法の分類 1 |
1.2 データの形式 1 |
1.3 尺度 3 |
1.4 データの要約 3 |
1.4.1 統計量 3 |
1.4.2 散布図,相関係数 4 |
1.4.3 クロス集計表 5 |
1.5 期待値と分散 6 |
1.6 正規分布 7 |
1.7 統計的仮説検定 8 |
1.8 最尤法 10 |
参考文献 12 |
第2章 Rの基礎的コマンド 13 |
2.1 Rの超基礎的事項 13 |
2.1.1 データの入力 13 |
2.1.2 データの修正 16 |
2.1.3 データの出力・保存 16 |
2.1.4 オブジェクトへの代入とコンソールへの表示 17 |
2.1.5 データの生成 18 |
2.2 Rによる基本統計量の計算 20 |
2.2.1 基本演算・四則演算・行列の演算 20 |
2.2.2 平均・分散・共分散・相関係数・クロス集計 22 |
2.2.3 ヒストグラム,散布図 23 |
2.3 オブジェクトというものの考え方 24 |
2.4 さらに学ぶために 24 |
参考文献 25 |
第3章 線形回帰モデル 26 |
3.1 はじめに:回帰モデルとは 26 |
3.2 単回帰モデルのパラメータ推定の考え方 26 |
3.3 残差の検討 29 |
3.3.1 残差の仮定 29 |
3.3.2 残差分析 30 |
3.3.3 はずれ値 31 |
3.3.4 系列相関 32 |
3.4 変数変換 32 |
3.5 重回帰モデル 33 |
3.5.1 重回帰モデルとそのパラメータ推定 33 |
3.5.2 多項式回帰モデル 34 |
3.5.3 重回帰モデルの行列表記によるパラメータ推定 35 |
3.6 モデルのあてはまりの良さ 37 |
3.6.1 重相関係数 37 |
3.6.2 決定係数 37 |
3.6.3 自由度修正済み決定係数 38 |
3.6.4 回帰モデルの評価の視点 40 |
3.7 モデルの選択(説明変数の選択) 40 |
3.8 Rによる演習 41 |
3.8.1 電子部品データ:単回帰モデル 42 |
3.8.2 自動車データ:単回帰モデル 44 |
3.8.3 体格データ:重回帰モデル(モデルのあてはめと変数選択) 45 |
3.8.4 キバハリアリデータ:重回帰モデル1(ステップワイズな変数選択) 47 |
3.8.5 キバハリアリデータ:重回帰モデル2(総当たり法による変数選択) 50 |
3.9 さらに学ぶために 51 |
参考文献誌 51 |
第4章 判別分析法 53 |
4.1 はじめに:判別の問題とは 53 |
4.2 判別の考え方:1変数2群を例に 53 |
4.2.1 判別方式 53 |
4.2.2 平均と分散の推定を基礎とする判別方式 54 |
4.2.3 誤判別率 55 |
4.3 線形判別:2変数2群 56 |
4.3.1 2変数2群での考え方 56 |
4.3.2 群間分散 58 |
4.3.3 群内分散 58 |
4.3.4 分散比 59 |
4.3.5 判別関数の導出 59 |
4.4 p変数2群の判別 63 |
4.5 ベクトルと行列による表示 64 |
4.6 尤度に基づく判別 65 |
4.6.1 1変数2群の判別 65 |
4.6.2 誤判別率 67 |
4.6.3 p変数2群の線形判別 68 |
4.6.4 構成比率が異なるとき 69 |
4.7 2次判別関数 70 |
4.8 Rによる演習 72 |
4.8.1 入社試験データ:線形判別 73 |
4.8.2 スイス銀行紙幣真贋データ:線形判別と2次判別 75 |
4.9 さらに学ぶために 78 |
参考文献 78 |
第5章 ロジスティック回帰モデル 79 |
5.1 はじめに 79 |
5.2 ロジスティックモデル:モデルの考え方 80 |
5.2.1 反応が2値 80 |
5.2.2 反応が確率のとき 82 |
5.3 多重ロジスティック回帰モデル 82 |
5.4 ロジスティック回帰モデルのパラメータ推定 84 |
5.5 Rによる演習 85 |
5.5.1 殺虫剤データ 85 |
5.5.2 スペースシャトル・O-Ringデータ 86 |
5.6 さらに学ぶために 89 |
参考文献 89 |
第5章 主成分分析法 91 |
6.1 はじめに:主成分分析法とは 91 |
6.2 主成分の導出 93 |
6.2.1 主成分の導出の考え方 93 |
6.2.2 第1主成分の導出 94 |
6.2.3 第2主成分の導出 96 |
6.2.4 主成分導出方法のまとめ 97 |
6.2.5 p変数の主成分の導出 98 |
6.3 標本相関係数行列からの主成分の導出 99 |
6.4 主成分の寄与率と累積寄与率 100 |
6.5 主成分得点 101 |
6.6 主成分負荷量 102 |
6.7 主成分分析の進め方 104 |
6.8 主成分の選択 105 |
6.9 Rによる演習 105 |
6.9.1 体格データ 105 |
6.9.2 キバハリアリのデータ 111 |
6.9.3 定期試験データ 114 |
参考文献 118 |
第7章 対応分析法 119 |
7.1 はじめに 119 |
7.2 対応分析法の考え方 119 |
7.2.1 質的データのクロス集計表 120 |
7.2.2 クロス集計表の行方向の基準化 121 |
7.3 基準化されたクロス集計表に対する主成分分析 125 |
7.4 Rによる演習 130 |
7.4.1 教員評価データ130 |
7.4.2 生のデータからの分析 132 |
7.5 より深い理解のために 133 |
7.5.1 同値な固有方程式 133 |
7.5.2 双対性による数量化得点の算出 136 |
7.5.3 数量化得点の平均,分散,共分散 138 |
7.6 Rによる演習:行列とベクトルの直接入力による計算 140 |
7.7 さらに学ぶために 142 |
参考文献 142 |
第8章 因子分析法 143 |
8.1 はじめに 143 |
8.2 因子分析の考え方 143 |
8.3 因子分析モデル 147 |
8.3.1 基本モデル 147 |
8.3.2 制約条件 148 |
8.3.3 相関係数行列の分解と共通性 149 |
8.3.4 本来の変数と共通因子との相関 150 |
8.3.5 因子数の決定 150 |
8.3.6 因子負荷量の推定:主因子法 151 |
8.3.7 因子の回転 153 |
8.4 因子得点の推定 154 |
8.4.1 バートレットの重み付き最小自乗法 155 |
8.4.2 トムソンの回帰推定法 155 |
8.5 Rによる演習 155 |
8.5.1 定期試験のデータ 156 |
8.6 さらに学ぶために 158 |
参考文献 158 |
第9章 正準相関分析法 159 |
9.1 はじめに 159 |
9.2 正準相関分析法の考え方 159 |
9.3 正準変数の定義と導出 160 |
9.4 正準相関分析法の解釈と評価 165 |
9.4.1 正準負荷量 166 |
9.4.2 正準寄与率 167 |
9.4.3 冗長性係数 167 |
9.5 Rによる演習 169 |
9.5.1 長男次男の頭のサイズのデータ 169 |
9.5.2 定期試験のデータ 174 |
9.6 さらに学ぶために 175 |
参考文献 176 |
第10章 多次元尺度法 177 |
10.1 はじめに 177 |
10.2 古典的・計量多次元尺度法 177 |
10.2.1 計量的多次元尺度法の考え方 177 |
10.2.2 推定方式 170 |
10.2.3 類似度のとき 183 |
10.3 Rによる演習:計量多次元尺度法 184 |
10.3.1 人工データ 184 |
10.3.2 北海道都市間データ:計量多次元尺度法 185 |
10.4 非計量的多次元尺度法 186 |
10.5 Rによる演習:非計量多次元尺度法 187 |
10.5.1 自動車メーカー印象データ 187 |
10.5.2 北海道都市間データ:非計量多次元尺度法 188 |
10.6 さらに学ぶために 190 |
参考文献 190 |
第11章 クラスタ 分析法 192 |
11.1 はじめに:クラスター分析法とは 192 |
11.1.1 統計的分類とは 192 |
11.1.2 分類手法の分類 194 |
11.2 近さを表す測度 194 |
11.2.1 量的データの距離:種々の距離,非類似度 194 |
11.2.2 質的データの距離 195 |
11.3 階層的手法 196 |
11.3.1 考え方 196 |
11.3.2 種々なクラスタ一間距離 198 |
11.3.3 ランスとウィリアムスの組み合わせ的手法 201 |
11.3.4 凝集型階層的分類法の更新距離の特徴 202 |
11.3.5 階層的手法の注意事項 203 |
11.4 Rによる演習:階層的手法 206 |
11.4.1 各手法の比較 208 |
11.4.2 出力の検討 208 |
11.4.3 アイリスデータ 210 |
11.4.4 スイス銀行紙幣真贋データ 212 |
11.5 非階層的手法 213 |
11.5.1 分割最適化型分類手法の考え方 213 |
11.5.2 κ平均法 215 |
11.5.3 クラスター数の評価基準 219 |
11.5.4 分割最適化型分類法の注意点 220 |
11.6 Rによる演習:非階層的手法 221 |
11.6.1 アイリスデータ 221 |
11.6.2 スイス銀行紙幣真贋データ 223 |
11.7 混合正規分布モデル:統計モデルを基礎とする分類法 225 |
11.7.1 分類手法としての混合分布モデル 225 |
11.7.2 モデル 225 |
11.7.3 パラメータ推定 226 |
11.7.4 多次元のモデルのパラメータ推定 229 |
11.7.5 成分数の推定 231 |
11.7.6 モデル推定に関する注意 231 |
11.8 Rによる演習:混合分布による分類 232 |
11.8.1 アイリスデータ 232 |
11.8.2 スイス銀行紙幣真贋データ 237 |
11.9 さらに学ぶために 237 |
参考文献 237 |
付録A 行列の基本演算 239 |
A.1 ベクトル行列の基本演算,微分 239 |
A.1.1 諸定義 239 |
A 1.2 演算 240 |
A.1.3 微分 241 |
索引 242 |