本記事と併せて読みたい記事: 【2020年】Swift・iOS開発が学べる本7選【ジャンル別・人気本】
【2021年】スクレイピングが学べる本7選【最新版】

1. Python2年生 スクレイピングのしくみ 体験してわかる!会話でまなべる!

本書ではPythonを使ってインターネットからのファイルのダウンロード方法、
HTML解析、データの読み書き、APIの使い方を最初に学んで
最後にスクレイピングでデータ収集の仕方を身につけます。
◆Python2年生 スクレイピングのしくみ 体験してわかる!会話でまなべる!
2. Pythonによるクローラー&スクレイピング入門 設計・開発から収集データの解析まで

本書ではデータ分析の現場でニーズの高まってきているPythonを利用して、
クローラー開発から始まり、クローリング、スクレイピングの基本から応用手法、
そして運用までそれぞれの開発が直面する場面に沿って丁寧に解説します。
最終章では目的別のクローラー開発手法を解説しています。
◆Pythonによるクローラー&スクレイピング入門 設計・開発から収集データの解析まで
3. PythonによるWebスクレイピング 第2版

インターネットからデータを機械的に集め、必要な情報を抽出するWebスクレイピングにより、インターネット上の膨大な情報の中から、検索エンジンだけでは入手できない本当に必要な情報を入手できるようになります。
Webスクレイパーの基礎をていねいに解説するだけでなく、データの抽出、データの格納、データ収集後のクリーニング、さらには、JavaScript実行、Seleniumによる自動化、OCRを含めた自然言語処理、並列処理などの高度なトピックに加えて法律面の解説など、Webスクレイピングを実際に行うために必要なプログラミングテクニックとテクノロジー全般だけでなく、問題に遭遇した際の対処法まで紹介します。
4. 増補改訂Pythonによるスクレイピング&機械学習 開発テクニック

最近では、深層学習の活用はさまざまな分野に広がっています。
2000万件もの医学論文を学習した人工知能のWatsonが、専門の医師でも診断が難しい特殊な白血病を10 分ほどで見抜き、治療法を変えるよう提案した結果、女性患者の命が救われたというニュースもありました。
このような機械学習の成功例に関するニュースを聞くと、ぜひ、自分の業務でも、活用してみたいと思うのは自然なことです。
実際のところ、データを活用する際に、難しい数式を意識する必要はそれほどありません。利用したいデータさえ手元にあれば、本書に掲載されているプログラムをちょっと改良するだけで、自分が求めている処理を実現することができることでしょう。
◆増補改訂Pythonによるスクレイピング&機械学習 開発テクニック
5. Pythonクローリング&スクレイピング[増補改訂版] -データ収集・解析のための実践開発ガイド

Pythonによるクローリング・スクレイピングの入門から実践までを解説した書籍です。
2017年の初版から内容をアップデート、新ライブラリの解説などを追加した増補改訂版です。基本的なクローリングやAPIを活用したデータ収集、HTMLやXMLの解析から、データ取得後の分析や機械学習などの処理まで解説。
データの収集・解析、活用がしっかりと基本から学べます。Webサービスの開発やデータサイエンスや機械学習分野で実用したい人はもちろん、基礎から解説しているのでPython初心者でもつまずかずに学習できます。多数のライブラリ、強力なフレームワークを活用して高効率に開発できます。
◆Pythonクローリング&スクレイピング[増補改訂版] -データ収集・解析のための実践開発ガイド-
6. Excel×Python最速仕事術

全オフィスパーソン必読!
Excelの面倒な操作はパソコンにやらせよう
ビジネスパーソンが必ず使うExcelは、面倒な手作業が多いのが残念なところ。いくら操作を効率化しても、マウスやキーボードでの作業がなくなりません。決まったセルの範囲を別のシートの決められたところにコピーしたり、毎月のデータをグラフにしたり……。1回だけの作業だけならまだしも、部署別や事業所別にほとんど同じ作業を何度も何度も繰り返すような作業もしばしば。オフィスでのパソコン操作には、こんな無駄がたくさんあってうんざりしている人は多いでしょう。抜本的に解決するは、操作方法を工夫するだけでは追いつきません。
そんな単純で面倒な作業は、Pythonで自動化しましょう! 一度、自分の作業に合わせて自動化すれば、どんなに大量のデータでもパソコンにすべてまかせてOK。自分は他の仕事を進められます。
今から始めるならVBAよりPythonがお薦め。
――Pythonを学びながらExcelを効率化するか。
――Excel業務を自動化しながらプログラミングも身に付けるか。
どちらにしても“一石二鳥”なのは間違いありません。
7. Pythonスクレイピングの基本と実践 データサイエンティストのためのWebデータ収集術

◇スクレイピング・テクニックの基礎と実践を学べる。
Webからデータを収集、適切なデータセットを作成しよう!―本書では、HTTP/HTML/CSSといった基本技術の仕組み、フォーム/ログイン/Cookie/JavaScriptへの対応、クローラーの開発、ベストプラクティスを解説。データサイエンス指向の15のサンプルも収録。
Pythonの各種ライブラリを活用![requests、Beautiful Soup、Selenium、records、matplotlib、pandas、scikit-learn … etc.]
◇Webページから情報を取得するスクレイピングは、データサイエンスに必須の技術です。本書では、Pythonを使ったスクレイピングの基本と実践を解説。有用なツール、ベストプラクティス、実用サンプルについても説明。本当に興味深いプロジェクトは、情報という宝の山を探索することから始まります。本書を携えて探索の旅を進めていきましょう。
◇本書は『Practical Web Scraping for Data Science: Best Practices and Examples with Python』の翻訳書です。◇Pythonプログラミングの基礎を理解していることを前提に解説しています。
◆Pythonスクレイピングの基本と実践 データサイエンティストのためのWebデータ収集術 impress top gearシリーズ
スクレイピングを本以外で学びたい方向け

1. Udemy
