【2020年】R言語が学べる本10冊+おすすめサイト3つ【入門】

R言語が学べる本10冊+おすすめチュートリアルサイト3つ紹介します。

【2020年】R言語が学べる本10選【入門】

1. R言語ではじめるプログラミングとデータ分析

内容
R言語によるデータ分析をはじめてみよう!

この本は、初心者向けのR言語の入門書です。
R言語はデータ分析に秀でたプログラミング言語です。もちろん無料で使えます。
この本では、R言語の初歩と、データ分析の基本を解説しています。
Tidyverseと呼ばれる「データ分析の生産性を上げてくれる便利なパッケージ群」の解説もしています。

【特徴】
・基礎から順にステップアップするので、初心者でも読みやすい
・「3行で終わる短いプログラミング事例」を豊富に紹介
・難易度マークがついているので、難しい箇所は飛ばしながら読める
・巻末にRリファレンスがついているので、読み返しやすい

【内容】
第1部【導入編】Rを始める
第2部【初級編】Rによるデータ分析の基本
第3部【中級編】長いコードを書く技術
第4部【応用編】Tidyverseの活用
参考文献
索引
Rリファレンス

2. RStudioではじめるRプログラミング入門

内容
「統計を使わずに、Rを純粋にプログラミング言語として学ぼう」というコンセプトに基づいて書かれた本書は、
統計学についての難しい知識がなくても、また、プログラミングの経験があまりなくても、
プログラミングを学んでみようという意欲さえあれば読むことのできる、画期的な書籍です。
サイコロを作る、トランプゲームを作る、スロットマシンを作る、という3つの簡単なプロジェクトに取り組む過程で、
Rのプログラミング統合環境、RStudioを活用し、楽しみながら効率的にRのプログラミングスキルを身に付けていきます。
統計だけに使うのはもったいない、Rのプログラミング言語としての隠れた魅力と可能性、さらにはデータサイエンスの基礎としてのデータ分析を紹介します。

3. RとPythonで学ぶ[実践的]データサイエンス&機械学習

内容
本書は野村総合研究所のシステムコンサルティング事業本部で実施している「アナリティクス研修」をベースにした書籍で、「統計的なモデリングとは何か?」「モデルに基づく要因の分析と予測の違いとは?」「具体的なモデルの作り方」「結果を解釈する際の落とし穴の見分け方」など、ビジネスの現場感を重視した構成です。実務で遭遇するデータ品質や加工のポイント、さらにRとPythonを利用し、データからモデルを作成して結果を得るという基本的な手順を体験できます。これからデータ分析や統計解析、機械学習を学び、現場でそれらを活用したい方に最短学習コースでお届けします。

(こんな方におすすめ)
・データ分析・統計解析や機械学習について知りたい方
・データサイエンティストになりたい方

(目次)
■第1章:データサイエンス入門
 1.1:データサイエンスの基本
  1.1.1:データサイエンスの重要性
  1.1.2:データサイエンスの定義とその歴史
  1.1.3:データサイエンスにおけるモデリング
  1.1.4:データサイエンスとその関連領域
 1.2:データサイエンスの実践
  1.2.1:データサイエンスのプロセスとタスク
  1.2.2:データサイエンスの実践に必要なツール
  1.2.3:データサイエンスの実践に必要なスキル
  1.2.4:データサイエンスの限界と課題
 コラム:ビジネス活用における留意点

■第2章:RとPython
 2.1:RとPython
  2.1.1:RとPythonの比較
 2.2:R入門
  2.2.1:Rの概要
  2.2.2:Rの文法
  2.2.3:データ構造と制御構造
 2.3:Python入門
  2.3.1:Pythonの概要
  2.3.2:Pythonの文法
  2.3.3:Pythonでのプログラミング
  2.3.4:NumPyとpandas
 2.4:RとPythonの実行例の比較
  2.4.1:簡単な分析の実行例

■第3章:データ分析と基本的なモデリング
 3.1:データの特徴を捉える
  3.1.1:分布の形を捉える ─ ビジュアルでの確認
  3.1.2:要約統計量を算出する ─ 代表値とばらつき
  3.1.3:関連性を把握する ─ 相関係数の使い方と意味
  3.1.4:Rを使った相関分析 ─ 自治体のデータを使った例
  3.1.5:さまざまな統計分析 ─ 理論と実際の考え方
 3.2:データからモデルを作る
  3.2.1:目的変数と説明変数 ─ 説明と予測の「向き」
  3.2.2:簡単な線形回帰モデル ─ Rによる実行と結果
  3.2.3:ダミー変数を使ったモデル ─ グループ間の差異を分析
  3.2.4:複雑な線形回帰モデル ─ 交互作用、モデル間の比較
  3.2.5:線形回帰の仕組みと最小二乗法
 3.3:モデルを評価する
  3.3.1:モデルを評価するための観点
  3.3.2:この結果は偶然ではないのか? ─ 有意確率と有意差検定
  3.3.3:モデルはデータに当てはまっているか? ─ フィッティングと決定係数
  3.3.4:モデルは複雑すぎないか? ─ オーバーフィッティングと予測精度
  3.3.5:残差の分布 ─ 線形回帰モデルと診断プロット
  3.3.6:説明変数同士の相関 ─ 多重共線性
  3.3.7:標準偏回帰係数

■第4章:実践的なモデリング
 4.1:モデリングの準備
  4.1.1:データの準備と加工
  4.1.2:分析とモデリングの手法
 4.2:データの加工
  4.2.1:データのクレンジング
  4.2.2:カテゴリ変数の加工
  4.2.3:数値変数の加工とスケーリング
  4.2.4:分布の形を変える ─ 対数変換とロジット変換
  4.2.5:欠損値の処理
  4.2.6:外れ値の処理
 4.3:モデリングの手法
  4.3.1:グループに分ける ─ クラスタリング
  4.3.2:指標を集約する ─ 因子分析と主成分分析
  4.3.3:一般化線形モデル
  4.3.4:2値データを目的変数とする分析 ─ ロジスティック回帰
  4.3.5:セグメントの抽出とその特徴の分析 ─ 決定木
 4.4:因果推論
  4.4.1:データから因果関係を明らかにする ─ 統計的因果推論
  4.4.2:因果関係に基づく変数選択

■第5章:機械学習とディープラーニング
 5.1:機械学習の目的と手順
  5.1.1:機械学習の基本
  5.1.2:機械学習の手順
  5.1.3:データの準備に関わる問題
  5.1.4:特徴抽出と特徴ベクトル
 コラム:機械学習と強化学習
 5.2:機械学習の実行
  5.2.1:機械学習ライブラリの活用 ─ scikit-learn
  5.2.2:機械学習アルゴリズムの例 ─ ランダムフォレスト
  5.2.3:機械学習アルゴリズムの例 ─ サポートベクターマシン
  5.2.4:機械学習の実行例
 5.3:ディープラーニング
  5.3.1:ニューラルネットワーク
  5.3.2:ディープラーニングを支える技術
  5.3.3:ディープラーニング・フレームワーク
  5.3.4:ディープラーニングの実行
  5.3.5:生成モデル

4. R言語徹底解説

内容
Rはデータ解析とグラフィックス作成機能に優れたプログラミング言語であるが,構文などに癖があることでも知られる。本書はRのパッケージ作者として著名なHadley WickhamによるR言語の解説書である。ここでは著者自身の10年を越えるプログラミング経験にもとづき,関数や環境,遅延評価など,ユーザが躓きやすいポイントについて丁寧に説明されている。また簡潔で汎用的な処理を実現するメタプログラミング,パフォーマンスの改善,デバッグ,RとC++との連携などについても,指針となるテクニックが多数紹介されている。本書を通じて,読者はコードをコピペする受動的なユーザから能動的なプログラマへと変貌を遂げることができる。またPythonやC++などのプログラマであれば,本書一冊でRの基本構造をマスターできるだけでなく,自身のスキルを高めるヒントを得られるだろう。

5. RユーザのためのRStudio[実践]入門 −tidyverseによるモダンな分析フローの世界

内容
(概要)
RStudioはR言語のIDE(開発環境)です。エディタ,コンソール,グラフなどを1つの画面内で確認できるほか,データ分析プロジェクトをスムーズに進めるための機能が豊富に用意されているので,RユーザにとってRStudioを利用したデータ分析はスタンダードになっています。
本書はRStudioの基本的な機能を解説したあとに,データ分析ワークフローを一通り解説していきます。データの収集(2章),データの整形(3章),可視化(4章),レポーティング(5章)など,データ分析に欠かせないこれらの要素の基礎を押さえることができます。また,本書はtidyverseパッケージを用いてこれらのデータ分析ワークフローを解説している側面を持ちます。tidyverseの考えに触れ,モダンなデータ分析をはじめましょう。

(こんな方におすすめ)
Rユーザ,データサイエンティスト,RStudioを使ってみたい方

(目次)

第1章 RStudioの基礎
1-1 RStudioのダウンロードとインストール
1-2 RStudioの基本操作
1-3 RStudioを自分好みにカスタマイズ
1-4 ファイルの読み込み
1-5 Rで困ったときは
1-6 まとめ
第2章 スクレイピングによるデータ収集
2-1 なぜスクレイピングが必要か
2-2 スクレイピングに必要なWeb知識
2-3 Rによるスクレイピング入門
2-4 スクレイピング実践
2-5 ブラウザの自動操作
2-6 API
2-7 まとめ
第3章 dplyr/tidyrによるデータ前処理
3-1 tidy dataとは
3-2 tidyrによるtidy dataへの変形
3-3 dplyrによる基本的なデータ操作
3-4 dplyrによる応用的なデータ操作
3-5 dplyrによる2つのデータセットの結合と絞り込み
3-6 まとめ
第4章 ggplot2によるデータ可視化
4-1 可視化の重要性
4-2 ggplot2パッケージを用いた可視化
4-3 他者と共有可能な状態に仕上げる
4-4 便利なパッケージ
4-5 まとめ
第5章 R Markdownによるレポート生成
5-1 分析結果のレポーティング
5-2 R Markdown入門
5-3 出力形式
5-4 まとめ

6. Rプログラミング本格入門: 達人データサイエンティストへの道

内容
Rパッケージの開発者として名高いKun Renが,R初心者およびRについてある程度は扱えるものの知識がアップデートされていない中級者へ向けて書いた入門書。モダンなアプローチでRの内容が平易に解説されている。前半はRの言語解説(オブジェクトやデータの扱い方等)についてページが割かれ,金融分野でRを扱ってきた著者の経験をふまえ,一部では難解ともいわれるRの言語仕様がわかりやすく書かれている。読者は文章に引き込まれながら読んでいくうちに自然とRに関する深い知識を身に付けることができるだろう。後半はRについての発展的な内容となっており,最近のdplyrやrlist,data.tableといったモダンなデータハンドリングパッケージ,他書では扱っていないメタプログラミング,RによりWebスクレイピングをいかにプログラミングしていくかなど,十分に読み応えのあるものとなっている。

7. 統計ソフト「R」超入門 実例で学ぶ初めてのデータ解析

内容
統計学者によって開発された「R」は、データ解析のスタンダードになりつつあります。本書では補助ソフト「Rコマンダー」を用いた、コマンド入力のいらない解析の方法を紹介します。データの特徴の把握から、2変数間の相関の解析、回帰分析による最適なモデルの選択まで、実際のデータ解析の流れを体験することで、操作方法と統計の考え方が理解できる、初めての人に最適な一冊です。

8. はじめてのR: ごく初歩の操作から統計解析の導入まで

内容
多機能でありながら無料で使える統計解析ソフト「R」。その利便性からもRによるデータ処理がますます広がっている。一方,統計学の入門的知識があっても,このソフトに敷居の高さを感じる人は少なくない。はじめてRに触れる初学者対象に,Rを使っての統計解析の最初の一歩を踏み出すための説明をコンパクトにまとめた。

9. Rによるやさしい統計学

内容
Rの操作手順と統計学の基礎が身に付く!
 本書は、統計学の理論を簡潔に解説しながら、Rの手順・アウトプットの解釈を丁寧に行う。具体的には、統計に関する理論をコンパクトに解説→Rでの操作手順、アウトプットの解釈という流れで本を構成していく。章末に確認用の練習問題を用意した。

★このような方におすすめ
文科系の学部学生 Rで統計を勉強したい人 Rに興味はあるが、「使ってみたいけど、プログラムはやったことないし難しそうだから」といって敬遠して実際には手を出していない人

10. Rによる 統計的学習入門

内容
・フリーの統計解析ソフト「R」を使って練習問題を解きながら統計解析・機械学習を学ぶ。
・数学的な厳密さよりも,わかりやすさ,使えることを重視。
・文系を含む学部学生でも読みこなせる。
・南カリフォルニア大学ビジネススクールの人気講義のテキスト。
・原著は米Amazonでは売上順位トップクラスの人気書籍(Mathematical & Statistical分野.2018年6月現在)
・原著者は当該分野の有力者。
・対象:統計・情報・計算機科学・データサイエンス・経済・経営・金融(FinTech)などを専攻する学部学生,ビジネススクールの学生,若手研究者,実務者,ビックデータの解析を期待される担当者

ビッグデータに活用できる統計的学習を,専門外にもわかりやすくRで実践。〔内容〕導入/統計的学習/線形回帰/分類/リサンプリング法/線形モデル選択と正則化/線形を超えて/木に基づく方法/サポートベクターマシン/教師なし学習

R言語を本以外でも学ぼう【おすすめサイト3選】

R言語が学べるおすすめサイトも3つ紹介します。

1. Udemy

Udemyは有料の動画学習サイトでクオリティが非常に高いことで有名です。

1コース1600円〜5000円くらいからでお手頃です。

R言語とかで検索してみてください。

<< Udemy

2. Youtube

Youtubeもたまに良い動画があるのでおすすめです。

R programmingとかで検索してみてください。

3. R言語公式サイト

公式のドキュメントもおすすめです。

<< The R Project for Statistical Computing