1. データと度数分布 1 |
1.1 変数と観測値 1 |
1.2 度数分布 2 |
1.3 連続データ 5 |
1.4 位置の尺度 8 |
1.5 散らばりの尺度 10 |
1.6 偏差値 : 入試のデータ分析 13 |
2. 2変数のデータ 16 |
2.1 官民格差 16 |
2.2 相関係数 19 |
2.3 2変数データの関係 21 |
2.3.1 2変数データの差 : 給与格差 21 |
2.3.2 2変数データの和 : 偏差値と相関係数 23 |
2.4 相関係数に関する注意 24 |
2.4.1 相関は線形性を測る 24 |
2.4.2 見せかけの相関 25 |
2.5 太陽系のデータ分析 : 対数変換 26 |
3. 確率 30 |
3.1 確率のクイズ 30 |
3.2 事象と確率 31 |
3.3 事象の組み合わせ 32 |
3.3.1 和事象と積事象 32 |
3.3.2 条件付き事象 33 |
3.4 ベイズの定理 : 事前確率と事後確率 34 |
3.5 ベンチャービジネス 36 |
3.6 メレ,シミュレーション,パスカル 37 |
3.6.1 メレの逆説 37 |
3.6.2 シミュレーション 37 |
3.6.3 パスカル登場 39 |
3.6.4 独立性 40 |
3.7 例 : あなたが裁判員になる確率 40 |
3.8 例 : 大学野球対抗試合で月曜日が休講になる確率 41 |
4. 確率変数と確率分布 44 |
4.1 確率分布とは何か 44 |
4.2 期待値 45 |
4.3 例 : 宝くじ 45 |
4.4 ぺテルスブルクの逆説 47 |
4.4.1 期待賞金額が無限大の賭け 47 |
4.4.2 効用 48 |
4.4.3 「ぺテルスブルクの逆説」は本当に逆説か 48 |
4.5 同時分布 49 |
4.5.1 2つのベンチャー投資 49 |
4.5.2 同時分布と周辺分布 49 |
4.5.3 共同出資 50 |
4.5.4 相関 51 |
4.5.5 共同出資とリスク管理 52 |
4.5.6 独立性 52 |
5. 離散確率分布のモデル : 2項分布とポアソン分布 55 |
5.1 ベルヌーイ試行 55 |
5.2 2項分布 56 |
5.3 2項分布と地震 58 |
5.4 ポアソン分布 61 |
5.5 ポアソン分布と台風上陸件数 63 |
6. 連続確率分布のモデル : 正規分布 66 |
6.1 連続型確率変数と分布関数 66 |
6.2 正規分布 68 |
6.2.1 標準正規分布 68 |
6.2.2 正規分布 70 |
6.2.3 正規確率の計算 71 |
6.3 株式と正規分布 72 |
6.3.1 株式収益率 72 |
6.3.2 ヒストグラム 72 |
6.3.3 歪度と尖度 72 |
7. ランダムサンプリング : 標本調査 76 |
7.1 世論調査 : 失敗例 76 |
7.2 視聴率調査 : ランダムサンプリング 77 |
7.3 信頼区問 78 |
7.4 紅白歌合戦の視聴率 79 |
7.5 消費税の世論調査 80 |
7.6 標本調査の注意点 83 |
7.6.1 味噌汁の味見 : 被爆60年アンケート 83 |
7.6.2 回収率 84 |
7.6.3 インターネットと社会調査 85 |
8. ランダムサンプリング : 標本理論 86 |
8.1 IID 86 |
8.2 標本平均 86 |
8.3 大数の法則 87 |
8.3.1 保険と大数の法則 87 |
8.3.2 大数の法則と標本分散 89 |
8.4 中心極限定理 89 |
8.4.1 中心極限定理と保険 90 |
8.5 標本分散に対する中心極限定理 91 |
8.6 信頼区間 92 |
9. 仮説検定 98 |
9.1 消費税の世論調査 98 |
9.1.1 p値 100 |
9.2 z検定 : 気温上昇の検定 102 |
9.3 t検定 103 |
9.4 仮説検定 : レイキ(霊気)療法はペインマネジメントに有効か 106 |
9.4.1 ノンパラメトリック検定 107 |
10. 回帰分析入門 109 |
10.1 100m走の年間世界記録データ 109 |
10.2 回帰モデル 110 |
10.2.1 モデル 110 |
10.2.2 誤差項の仮定 111 |
10.2.3 最小2乗法 111 |
10.3 回帰計算 114 |
10.3.1 回帰係数 114 |
10.3.2 残差と回帰予測値 115 |
10.3.3 R2乗 115 |
10.3.4 残差標準誤差 116 |
10.4 回帰モデルの理論 117 |
10.4.1 回帰係数の統計的性質 117 |
10.4.2 t値とp値 118 |
10.5 回帰モデルによる予測 118 |
10.6 誤差項の仮定 120 |
11. 重回帰分析 124 |
11.1 ワンルームマンションの価格データ 124 |
11.2 データの整理 125 |
11.3 回帰分析 127 |
11.3.1 単回帰分析 127 |
11.3.2 重回帰モデル 127 |
11.3.3 推定 128 |
11.3.4 偏回帰係数 130 |
11.4 重回帰分析の推測 131 |
11.4.1 回帰予測値と残差 131 |
11.4.2 2乗和とR2乗 132 |
11.4.3 自由度調整済みR2乗 132 |
11.4.4 R2乗とF統計量 133 |
11.5 外れ値 134 |
11.5.1 重回帰分析の仮定 134 |
11.5.2 外れ値 134 |
11.5.3 ダミー変数 135 |
11.6 変数選択 136 |
11.7 対数線形モデル 138 |
12. ロジットモデル 141 |
12.1 住宅ローンのデフォルトデータ 141 |
12.1.1 データ 141 |
12.2 ロジットモデル 143 |
12.3 ロジットモデルの推定 145 |
12.3.1 最尤法 145 |
12.3.2 デビアンス 147 |
12.4 モデル選択 148 |
12.4.1 AIC規準 148 |
12.4.2 対数変換 148 |
12.5 タイタニック : 何が生死を分けたか 150 |
12.6 タイタニック : ロジットモデルの推定 153 |
12.6.1 年齢を追加したモデルの推定 154 |
A. 付録 : R事始め 156 |
A.1 ベースシステムとパッケージ 156 |
A.2 インストール 156 |
A.3 Rの起動 157 |
A.4 Rの入力 158 |
A.5 R関数 159 |
A.6 作業ディレクトリー 160 |
A.7 データファイルの保存と読み込み 160 |
A.8 パッケージのインストール 161 |
索引 163 |