定性的データ分析

書籍情報
シリーズ名シリーズ Useful R 全10巻 【5】巻
ISBN978-4-320-12368-7
判型B5 
ページ数406ページ
発行年月2016年09月
本体価格3,800円
定性的データ分析 書影
定性的データ分析

 「定量的データ」は体重,身長,車の速度,売り上げなどを数値で記録したことを指す。これに対し,性別,血液型,政党に対する支持・不支持のような名義尺度(nominal scale)データ,成績の5段階評価(A, B, C, D, F),商品の使いやすさ(非常に使いやすい,使いやすい,どちらともいえない,使いにくい,非常に使いにくい)のような順序尺度(ordinal scale)データを本書では「定性的データ」と呼ぶ。つまり本書の定性的データは質的データ,あるいはカテゴリカルデータを指す。
 「定性的データ分析」に関しては,林の数量化理論がよく知られている。海外において「定性的データ分析」に対応付けられるのは「カテゴリカルデータ分析」である。本書ではカテゴリカルデータ解析の主な内容に,数量化理論の基本的な考え方を必要となる項目に織り交ぜながら,カテゴリカルデータ分析の基本的手法と機械学習法を紹介する。本書は大きく3つの部から構成されている。

第Ⅰ部:第1章から第6章まではカテゴリカルデータの操作と推測統計の基礎について比率検定,分割表の独立性分析などを扱っている。
第Ⅱ部:第7章から第14章まではカテゴリカルデータのモデリング方法について対数線形モデル,重回帰分析と数量化Ⅰ類,一般化線形モデル,ツリーモデルとアンサンブル学習によるモデリング法を扱っている。
第Ⅲ部:第15章から第19章まではカテゴリカルデータの記述的分析方法として対応分析,カテゴリカルデータの類似度あるいは非類似度を用いた分析方法としての主成分分析,因子分析,クラスター分析などの方法と人文社会科学に多く用いられるようになったネットワーク分析,アソシエーション分析方法を扱っている。

 本書は,人文社会系でも理解できるように配慮している。数式が理解しにくい部分については,Rでデータを分析することでその意味を理解できるように工夫している。本書で用いたコードは出版社Webからダウンロードできる。誤りを避けるように努力しているが少なからず残っていることは否めない。それらに関しては見つかり次第,追ってWebで知らせる。

目次

第1章 定性的データの操作と視覚化
1.1 定性的データとは
1.2 定性的データの形式
1.3 カテゴリカルデータの集計
1.4 分割表の視覚化

第2章 比率の推測
2.1 母集団と標本
2.2 推測とは
2.3 確率分布
2.4 比率の区間推定
2.5 尤度と最尤推定

第3章 仮説検定と比率の検定
3.1 仮説検定
3.2 比率の検定
3.3 比率の検定と 2 × 2分割表のカイ2乗検定
3.4 オッズ比の検定
3.5 フィッシャーの正確確率検定

第4章 I×J二元分割表
4.1 適合度検定
4.2 独立性の検定(順序なしの場合)
4.3 連関係数
4.4 フィッシャーの正確確率検定
4.5 順序尺度の独立性検定

第5章 効果量と検出力
5.1 効果量とは
5.2 平均差の検定の効果量
5.3 比率差の検定の効果量
5.4 独立検定の効果量
5.5 効果量を求める関数
5.6 検出力とは

第6章 三元分割表
6.1 三元分割表
6.2 三元表の表記と操作
6.3 層別分析とシンプソンのパラドックス
6.4 三元分割表の独立性検定

第7章 分割表の対数線形モデル
7.1 分割表のモデリング
7.2 関数 loglm による対数線形モデルの計算
7.3 モデルの選択
7.4 三元分割表の対数線形モデル
7.5 モデルのグラフ表現
7.6 多元分割表の対数線形モデル

第8章 回帰分析と数量化Ⅰ類
8.1 回帰分析とは
8.2 回帰分析
8.3 カテゴリカルデータの回帰分析
8.4 数量化Ⅰ類

第9章 ロジットモデル
9.1 モデリングと確率分布
9.2 関数glmによるモデルの推測
9.3 素データのモデリング
9.4 多項ロジットモデル
9.5 交差確認
9.6 ロジットモデルとその他

第10章 ポアソン回帰
10.1 ポアソン分布
10.2 ポアソン分布によるモデリング
10.3 ポアソン回帰モデル
10.4 過分散の問題と負の二項回帰モデル
10.5 ゼロ過剰の回帰モデル

第11章 一般化線形モデル
11.1 指数分布族
11.2 一般化線形モデルとリンク関数
11.3 最大対数尤度推定と加重最小 2 乗解
11.4 一般化線形モデルの残差

第12章 一般化線形混合効果モデル
12.1 線形混合効果モデル
12.2 一般化線形混合効果モデル

第13章 ツリーモデル
13.1 ツリーモデルとは
13.2 分割基準
13.3 R上でのツリーモデルの操作
13.4 回帰木
13.5 その他

第14章 アンサンブル学習モデル
14.1 アンサンブル学習とは
14.2 バギング
14.3 ランダムフォレスト
14.4 ブースティング
14.5 その他

第15章 対応分析
15.1 対応分析とは
15.2 対応分析のアルゴリズム
15.3 対応分析関数とデータ解析
15.4 多重対応分析
15.5 多元分割表の対応分析
15.6 その他

第16章 類似度によるデータ分析
16.1 多変量データ解析と類似度
16.2 定性的データの関連係数
16.3 主成分分析
16.4 因子分析

第17章 距離データの解析
17.1 距離とは
17.2 階層的クラスター分析
17.3 非階層的クラスター分析
17.4 その他

第18章 ネットワーク分析
18.1 ネットワーク分析とは
18.2 ネットワークの作成
18.3 ネットワークの統計量
18.4 コミュニティ分析
18.5 テキスト分析におけるネットワーク分析
18.6 その他

第19章 アソシエーション分析
19.1 アソシエーション分析
19.2 相関ルール
19.3 頻出アイテムの抽出
19.4 抽出結果の補助分析

索引