アクセスランキング

01位
Rプログラミング本格入門―達人データサイエンティストへの道― 
02位
統計的自然言語処理の基礎
03位
カメムシの母が子に伝える共生細菌―必須相利共生の多様性と進化― 
04位
速習 強化学習―基礎理論とアルゴリズム― 
05位
グラフ理論とフレームワークの幾何
  • ニュースメール
  • アフターサービス
  • 教科書献本のご案内
  • facebook
  • 構造計画研究所

データ分析プロセス

書籍情報
シリーズ名シリーズ Useful R 全10巻 【2】巻
ISBN978-4-320-12365-6
判型B5 
ページ数232ページ
発行年月2015年06月
本体価格3,600円
データ分析プロセス 書影
データ分析プロセス

通常,データ分析というと,多変量解析,機械学習,時系列解析などの手法が取り上げられることが多い。しかし,実際のデータ分析では,適切なビジネス目標に基づいて分析計画を立案したうえでデータを収集・蓄積し,データ加工やデータ変換などの前処理を実行した後に分析手法を適切に適用し,得られた知見の活用方法について検討する必要がある。本書では、このようなデータ分析プロセスを実現できるようになることを目指して,収集・蓄積したデータに前処理を行い,データから相関やパターンなどの知見を抽出するための基本的な考え方や処理について,Rの実装方法を交えて説明する。

目次

第1章 データ分析のプロセス
1.1 データ分析で直面する課題の例
1.2 データ分析のプロセス
1.3 CRISP-DM
1.4 KDDプロセス
1.5 本書の目的と構成

第2章 基本的なデータ操作
2.1 データの入出力
2.2 データフレームのハンドリング
2.3 データテーブルのハンドリング

第3章 前処理・変換
3.1 データの記述・要約
3.2 欠損値への対応
3.3 外れ値の検出と対応
3.4 連続データの離散化
3.5 属性選択
3.6 次元削減

第4章 パターンの発見
4.1 予測モデルの構築
4.2 頻出パターンの発見

第5章 データ分析の例
5.1 分析計画の立案
5.2 データの理解
5.3 データの加工
5.4 予測モデルの構築

付録A 主な予測アルゴリズムの概要
A.1 決定木
A.2 ランダムフォレスト
A.3 サポートベクタマシン

付録B caretパッケージで利用できるアルゴリズム

付録C ELKIの使用方法

参考文献

索  引