版元ドットコム

探せる、使える、本の情報

文芸 新書 社会一般 資格・試験 ビジネス スポーツ・健康 趣味・実用 ゲーム 芸能・タレント テレビ・映画化 芸術 哲学・宗教 歴史・地理 社会科学 教育 自然科学 医学 工業・工学 コンピュータ 語学・辞事典 学参 児童図書 ヤングアダルト 全集 文庫 コミック文庫 コミックス(欠番扱) コミックス(雑誌扱) コミックス(書籍) コミックス(廉価版) ムック 雑誌 増刊 別冊 ラノベ
a:9:{s:12:"shoshi_title";s:31:"Rによる自動データ収集";s:11:"shoshi_isbn";s:17:"978-4-320-12416-5";s:16:"shoshi_publisher";N;s:11:"description";s:1481:" 本書は,単にR を使ってインターネットからデータを収集・保存する方法を紹介した入門書ではなく,むしろその後の分析やレポート作成までのすべてのプロセスを効率化あるいは自動化する技法を実践的に解説した専門書である。分析に関連しては,データの前処理に役立つ正規表現や,ドキュメントから統計的な手法によって知見を引き出す技術であるテキストマイニングも取り上げられている。 本書の構成は大きく3つに分かれ,第1部では基本技術に焦点があてられている。R を利用することでWebスクレイピングとデータ操作は簡単に実現できるが,その背景技術について知識を深めておくと,構造の複雑なWebサイトに遭遇した場合でもデータをピンポイントに抽出できるようになる。続く第2部は,ここまで習得した技術の実践編となっており,現実に遭遇するケースのそれぞれに対処する方法が詳しく紹介されている。そして第3部は,やや複雑な研究課題を想定し,データの収集から分析,そして効果的なグラフィクスの作成までを詳細に解説している。[原著:Simon Munzert, Chistian Rubba, Peter Meissner, Dominic Nyhuis: Automated Data Collection with R: A Practical Guide to Web Scraping and Text Mining, Wiley, 2015.]";s:6:"author";s:32:"Simon Munzert(著/文)…他5名";s:10:"publishers";s:12:"共立出版";s:9:"publisher";N;s:9:"productor";s:12:"共立出版";s:12:"release_date";i:1496847600;}

Rによる自動データ収集 Webスクレイピングとテキストマイニングの実践ガイド

コンピュータ ラノベ

Simon Munzert(著/文), 石田 基広(翻訳), 工藤 和奏(翻訳), 熊谷 雄介(翻訳), 高柳 慎一(翻訳), 牧山 幸史(翻訳)
発行:共立出版

B5判   592頁 
定価 6,000円+税

ISBN 978-4-320-12416-5   C3041

書店発売日 2017年6月8日
登録日 2017年5月9日

このエントリーをはてなブックマークに追加

紹介

 本書は,単にR を使ってインターネットからデータを収集・保存する方法を紹介した入門書ではなく,むしろその後の分析やレポート作成までのすべてのプロセスを効率化あるいは自動化する技法を実践的に解説した専門書である。分析に関連しては,データの前処理に役立つ正規表現や,ドキュメントから統計的な手法によって知見を引き出す技術であるテキストマイニングも取り上げられている。
 本書の構成は大きく3つに分かれ,第1部では基本技術に焦点があてられている。R を利用することでWebスクレイピングとデータ操作は簡単に実現できるが,その背景技術について知識を深めておくと,構造の複雑なWebサイトに遭遇した場合でもデータをピンポイントに抽出できるようになる。続く第2部は,ここまで習得した技術の実践編となっており,現実に遭遇するケースのそれぞれに対処する方法が詳しく紹介されている。そして第3部は,やや複雑な研究課題を想定し,データの収集から分析,そして効果的なグラフィクスの作成までを詳細に解説している。
[原著:Simon Munzert, Chistian Rubba, Peter Meissner, Dominic Nyhuis: Automated Data Collection with R: A Practical Guide to Web Scraping and Text Mining, Wiley, 2015.]

目次

第1部 Webとデータの技術入門

第1章 導入

第2章 HTML

第3章 XMLとJSON

第4章 XPATH

第5章 HTTP

第6章 AJAX

第7章 SQLとリレーショナルデータベース

第8章 正規表現と重要な文字列関数


第2部 Webスクレイピングとテキストマイニングのためのツールボックス

第9章 Webからのスクレイピング

第10章 統計的テキスト処理

第11章 データ分析プロジェクトの管理


第3部 事例集

第12章 アメリカ上院議員間のコラボレーション・ネットワーク

第13章 半構造化されたドキュメントから情報を抜き出す

第14章 Twitter による2014 年度アカデミー賞予測

第15章 名字の地理的な分布のマッピング

第16章 携帯電話のデータを集める

第17章 商品レビューのセンチメント分析

上記内容は本書刊行時のものです。