目次
- 1 【2021年】R言語が学べる本10選【入門】
- 1.1 1. R言語ではじめるプログラミングとデータ分析
- 1.2 2. RStudioではじめるRプログラミング入門
- 1.3 3. RとPythonで学ぶ[実践的]データサイエンス&機械学習
- 1.4 4. R言語徹底解説
- 1.5 5. RユーザのためのRStudio[実践]入門 −tidyverseによるモダンな分析フローの世界
- 1.6 6. Rプログラミング本格入門: 達人データサイエンティストへの道
- 1.7 7. 統計ソフト「R」超入門 実例で学ぶ初めてのデータ解析
- 1.8 8. はじめてのR: ごく初歩の操作から統計解析の導入まで
- 1.9 9. Rによるやさしい統計学
- 1.10 10. Rによる 統計的学習入門
- 2 R言語を本以外でも学ぼう【おすすめサイト3選】
【2021年】R言語が学べる本10選【入門】

1. R言語ではじめるプログラミングとデータ分析

この本は、初心者向けのR言語の入門書です。
R言語はデータ分析に秀でたプログラミング言語です。もちろん無料で使えます。
この本では、R言語の初歩と、データ分析の基本を解説しています。
Tidyverseと呼ばれる「データ分析の生産性を上げてくれる便利なパッケージ群」の解説もしています。
【特徴】
・基礎から順にステップアップするので、初心者でも読みやすい
・「3行で終わる短いプログラミング事例」を豊富に紹介
・難易度マークがついているので、難しい箇所は飛ばしながら読める
・巻末にRリファレンスがついているので、読み返しやすい
【内容】
第1部【導入編】Rを始める
第2部【初級編】Rによるデータ分析の基本
第3部【中級編】長いコードを書く技術
第4部【応用編】Tidyverseの活用
参考文献
索引
Rリファレンス
2. RStudioではじめるRプログラミング入門

統計学についての難しい知識がなくても、また、プログラミングの経験があまりなくても、
プログラミングを学んでみようという意欲さえあれば読むことのできる、画期的な書籍です。
サイコロを作る、トランプゲームを作る、スロットマシンを作る、という3つの簡単なプロジェクトに取り組む過程で、
Rのプログラミング統合環境、RStudioを活用し、楽しみながら効率的にRのプログラミングスキルを身に付けていきます。
統計だけに使うのはもったいない、Rのプログラミング言語としての隠れた魅力と可能性、さらにはデータサイエンスの基礎としてのデータ分析を紹介します。
3. RとPythonで学ぶ[実践的]データサイエンス&機械学習

(こんな方におすすめ)
・データ分析・統計解析や機械学習について知りたい方
・データサイエンティストになりたい方
(目次)
■第1章:データサイエンス入門
1.1:データサイエンスの基本
1.1.1:データサイエンスの重要性
1.1.2:データサイエンスの定義とその歴史
1.1.3:データサイエンスにおけるモデリング
1.1.4:データサイエンスとその関連領域
1.2:データサイエンスの実践
1.2.1:データサイエンスのプロセスとタスク
1.2.2:データサイエンスの実践に必要なツール
1.2.3:データサイエンスの実践に必要なスキル
1.2.4:データサイエンスの限界と課題
コラム:ビジネス活用における留意点
■第2章:RとPython
2.1:RとPython
2.1.1:RとPythonの比較
2.2:R入門
2.2.1:Rの概要
2.2.2:Rの文法
2.2.3:データ構造と制御構造
2.3:Python入門
2.3.1:Pythonの概要
2.3.2:Pythonの文法
2.3.3:Pythonでのプログラミング
2.3.4:NumPyとpandas
2.4:RとPythonの実行例の比較
2.4.1:簡単な分析の実行例
■第3章:データ分析と基本的なモデリング
3.1:データの特徴を捉える
3.1.1:分布の形を捉える ─ ビジュアルでの確認
3.1.2:要約統計量を算出する ─ 代表値とばらつき
3.1.3:関連性を把握する ─ 相関係数の使い方と意味
3.1.4:Rを使った相関分析 ─ 自治体のデータを使った例
3.1.5:さまざまな統計分析 ─ 理論と実際の考え方
3.2:データからモデルを作る
3.2.1:目的変数と説明変数 ─ 説明と予測の「向き」
3.2.2:簡単な線形回帰モデル ─ Rによる実行と結果
3.2.3:ダミー変数を使ったモデル ─ グループ間の差異を分析
3.2.4:複雑な線形回帰モデル ─ 交互作用、モデル間の比較
3.2.5:線形回帰の仕組みと最小二乗法
3.3:モデルを評価する
3.3.1:モデルを評価するための観点
3.3.2:この結果は偶然ではないのか? ─ 有意確率と有意差検定
3.3.3:モデルはデータに当てはまっているか? ─ フィッティングと決定係数
3.3.4:モデルは複雑すぎないか? ─ オーバーフィッティングと予測精度
3.3.5:残差の分布 ─ 線形回帰モデルと診断プロット
3.3.6:説明変数同士の相関 ─ 多重共線性
3.3.7:標準偏回帰係数
■第4章:実践的なモデリング
4.1:モデリングの準備
4.1.1:データの準備と加工
4.1.2:分析とモデリングの手法
4.2:データの加工
4.2.1:データのクレンジング
4.2.2:カテゴリ変数の加工
4.2.3:数値変数の加工とスケーリング
4.2.4:分布の形を変える ─ 対数変換とロジット変換
4.2.5:欠損値の処理
4.2.6:外れ値の処理
4.3:モデリングの手法
4.3.1:グループに分ける ─ クラスタリング
4.3.2:指標を集約する ─ 因子分析と主成分分析
4.3.3:一般化線形モデル
4.3.4:2値データを目的変数とする分析 ─ ロジスティック回帰
4.3.5:セグメントの抽出とその特徴の分析 ─ 決定木
4.4:因果推論
4.4.1:データから因果関係を明らかにする ─ 統計的因果推論
4.4.2:因果関係に基づく変数選択
■第5章:機械学習とディープラーニング
5.1:機械学習の目的と手順
5.1.1:機械学習の基本
5.1.2:機械学習の手順
5.1.3:データの準備に関わる問題
5.1.4:特徴抽出と特徴ベクトル
コラム:機械学習と強化学習
5.2:機械学習の実行
5.2.1:機械学習ライブラリの活用 ─ scikit-learn
5.2.2:機械学習アルゴリズムの例 ─ ランダムフォレスト
5.2.3:機械学習アルゴリズムの例 ─ サポートベクターマシン
5.2.4:機械学習の実行例
5.3:ディープラーニング
5.3.1:ニューラルネットワーク
5.3.2:ディープラーニングを支える技術
5.3.3:ディープラーニング・フレームワーク
5.3.4:ディープラーニングの実行
5.3.5:生成モデル
4. R言語徹底解説

5. RユーザのためのRStudio[実践]入門 −tidyverseによるモダンな分析フローの世界

RStudioはR言語のIDE(開発環境)です。エディタ,コンソール,グラフなどを1つの画面内で確認できるほか,データ分析プロジェクトをスムーズに進めるための機能が豊富に用意されているので,RユーザにとってRStudioを利用したデータ分析はスタンダードになっています。
本書はRStudioの基本的な機能を解説したあとに,データ分析ワークフローを一通り解説していきます。データの収集(2章),データの整形(3章),可視化(4章),レポーティング(5章)など,データ分析に欠かせないこれらの要素の基礎を押さえることができます。また,本書はtidyverseパッケージを用いてこれらのデータ分析ワークフローを解説している側面を持ちます。tidyverseの考えに触れ,モダンなデータ分析をはじめましょう。
(こんな方におすすめ)
Rユーザ,データサイエンティスト,RStudioを使ってみたい方
(目次)
第1章 RStudioの基礎
1-1 RStudioのダウンロードとインストール
1-2 RStudioの基本操作
1-3 RStudioを自分好みにカスタマイズ
1-4 ファイルの読み込み
1-5 Rで困ったときは
1-6 まとめ
第2章 スクレイピングによるデータ収集
2-1 なぜスクレイピングが必要か
2-2 スクレイピングに必要なWeb知識
2-3 Rによるスクレイピング入門
2-4 スクレイピング実践
2-5 ブラウザの自動操作
2-6 API
2-7 まとめ
第3章 dplyr/tidyrによるデータ前処理
3-1 tidy dataとは
3-2 tidyrによるtidy dataへの変形
3-3 dplyrによる基本的なデータ操作
3-4 dplyrによる応用的なデータ操作
3-5 dplyrによる2つのデータセットの結合と絞り込み
3-6 まとめ
第4章 ggplot2によるデータ可視化
4-1 可視化の重要性
4-2 ggplot2パッケージを用いた可視化
4-3 他者と共有可能な状態に仕上げる
4-4 便利なパッケージ
4-5 まとめ
第5章 R Markdownによるレポート生成
5-1 分析結果のレポーティング
5-2 R Markdown入門
5-3 出力形式
5-4 まとめ
6. Rプログラミング本格入門: 達人データサイエンティストへの道

7. 統計ソフト「R」超入門 実例で学ぶ初めてのデータ解析

8. はじめてのR: ごく初歩の操作から統計解析の導入まで

9. Rによるやさしい統計学

本書は、統計学の理論を簡潔に解説しながら、Rの手順・アウトプットの解釈を丁寧に行う。具体的には、統計に関する理論をコンパクトに解説→Rでの操作手順、アウトプットの解釈という流れで本を構成していく。章末に確認用の練習問題を用意した。
★このような方におすすめ
文科系の学部学生 Rで統計を勉強したい人 Rに興味はあるが、「使ってみたいけど、プログラムはやったことないし難しそうだから」といって敬遠して実際には手を出していない人
10. Rによる 統計的学習入門

・数学的な厳密さよりも,わかりやすさ,使えることを重視。
・文系を含む学部学生でも読みこなせる。
・南カリフォルニア大学ビジネススクールの人気講義のテキスト。
・原著は米Amazonでは売上順位トップクラスの人気書籍(Mathematical & Statistical分野.2018年6月現在)
・原著者は当該分野の有力者。
・対象:統計・情報・計算機科学・データサイエンス・経済・経営・金融(FinTech)などを専攻する学部学生,ビジネススクールの学生,若手研究者,実務者,ビックデータの解析を期待される担当者
ビッグデータに活用できる統計的学習を,専門外にもわかりやすくRで実践。〔内容〕導入/統計的学習/線形回帰/分類/リサンプリング法/線形モデル選択と正則化/線形を超えて/木に基づく方法/サポートベクターマシン/教師なし学習
R言語を本以外でも学ぼう【おすすめサイト3選】
R言語が学べるおすすめサイトも3つ紹介します。
1. Udemy

Udemyは有料の動画学習サイトでクオリティが非常に高いことで有名です。
1コース1600円〜5000円くらいからでお手頃です。

R言語とかで検索してみてください。
2. Youtube
Youtubeもたまに良い動画があるのでおすすめです。
R programmingとかで検索してみてください。
3. R言語公式サイト

公式のドキュメントもおすすめです。