高安 美佐子編著,田村 光太郎,三浦 航著: 学生?技術者のための ビッグデータ解析入門, 日本評論社, 2014.
まえがき…i
[教員: 7ページ]
第1章 ビッグデータとは…1 (34ページ)
1.1 サイエンスにおけるビッグデータ…1
1.2 経済物理学とその対象…2
1.3 開発環境…3
1.3.1 Windowsの場合…4
1.3.2 Macの場合…5 (当研究室はMacPortsの代わりにHomebrewを使うので,そのまま実行してはいけないことに注意すること)
1.3.3 その他のソフトウェア…6
[岡崎: 21ページ]
1.4 ファイルの操作方法…8
1.4.1 Unixコマンド…8
1.4.2 シェルスクリプト…16
1.4.3 C言語…19 (簡単な口頭説明だけでよい)
1.4.4 統計解析ソフトR…27
[桐本: 6ページ]
1.5 グラフの描画方法…29
1.5.1 gnuplotの起動と終了の方法…29
1.5.2 描画の方法…29
1.5.3 グラフの保存…31
1.5.4 シェルスクリプトでの処理…31
1.5.5 その他のコマンド…33
[積田: 18ページ]
第2章 ビッグデータの整理…35 (18ページ)
2.1 ビッグデータの内容を確認するには…35
2.2 ビッグデータを整理するには…38
2.2.1 データの置換 (sed)…38
2.2.2 必要な項目の抽出 (awk)…40
2.2.3 データの検索 (grep)…45
2.2.4 データの並び替え (sort)…48
2.2.5 同じデータをまとめる (uniq)…50
[谷: 19ページ]
第3章 統計処理…53 (72ページ)
3.1 計算誤差…53
3.2 統計の基礎…59
3.2.1 定常とは…59
3.2.2 母集団と標本…60
3.3 確率密度関数?累積分布関数…61
3.3.1 確率密度関数…62
3.3.2 累積分布関数…66
3.3.3 データと累積分布関数…67
[岡崎: 11ページ]
3.4 乱数…72
3.4.1 乱数の生成…73
3.4.2 一様乱数…73
3.4.3 さまざまな分布に従う乱数…77
3.4.4 乱数の応用…83
[桐本: 18ページ]
3.5 分布と統計量…89
3.5.1 分布とモーメント…90
3.5.2 べき分布とモーメント…91
3.5.3 要約統計量…94
3.5.4 統計の推定…101
3.5.5 最尤推定…102
3.5.6 最小二乗推定…104
[積田: 18ページ]
3.6 仮説検定…107
3.6.1 なぜ仮説検定が必要なのか…107
3.6.2 仮説検定で必要なこと…108
3.6.3 仮説検定の手順…109
3.6.4 独立性の検定…111
3.6.5 連による検定…115
3.6.6 適合度の検定…117
[谷: 15ページ]
第4章 相関分析と回帰…125 (32ページ)
4.1 相関分析…125
4.1.1 相関を調べる…126
4.1.2 相関係数…130
4.2 単回帰分析…134
[岡崎: 17ページ]
4.3 多変量の相関…140
4.3.1 相関行列…140
4.3.2 變相関関係…142
4.4 重回帰分析…146
4.4.1 重回帰分析の評価…149
4.5 パス解析…153
[桐本: 21ページ]
第5章 複雑ネットワーク解析…157 (86ページ)
5.1 ネットワークの表現…158
5.1.1 ネットワークの隣接行列…160
5.1.2 ネットワークの隣接リスト…161
5.2 ネットワークの可視化…164
5.2.1 Cytescape…165
5.2.2 Rのigraphライブラリ…166
5.2.3 相関構造の可視化…168
5.3 ネットワークの持つ基本特徴量…169
[積田: 17ページ]
5.4 ネットワークの生成と操作…178
5.4.1 ネットワークの生成モデル…179
5.4.2 ネットワークの操作…191
[谷: 14ページ]
5.5 ノードの指標と順位付け…195
5.5.1 ネットワークの中心性…195
5.6 コミュニティ抽出…202
5.6.1 モジュラリティ…203
[岡崎: 19ページ]
5.7 ネットワークの探索…209
5.7.1 データ構造…210
5.7.2 探索…210
5.7.3 強連結成分の抽出…219
5.7.4 関節点と橋…223
[桐本: 15ページ]
5.8 ネットワーク上の輸送現象…228
5.8.1 複雑ネットワークにおける現象…229
5.8.2 複雑ネットワーク上での輸送現象…230
さらに進んだ内容を学ぶために…243
参考文献…248
索引…253