書店員向け情報

現場で使える！Python深層強化学習入門強化学習と深層学習による探索と制御伊藤多一(著/文) - 翔泳社

【利用不可】

書店員向け情報 HELP

出版者情報

翔泳社（ショウエイシャ）

書店注文情報

受注専用FAX:

注文電話番号:

なし

注文ＦＡＸ番号:

04-2935-0021

注文メール:

なし

受注センター:

注文電話番号:

03-5362-3810

注文ＦＡＸ番号:

03-5362-3817

注文メール:

なし

注文メール:

注文電話番号:

なし

注文ＦＡＸ番号:

なし

注文メール:

seorder@shoeisha.co.jp

加筆・修正・削除のご依頼はこちらまで

AI & TECHNOLOGY (エーアイアンドテクノロジー)

現場で使える！Python深層強化学習入門強化学習と深層学習による探索と制御 (ゲンバデツカエルパイソンシンソウキョウカガクシュウニュウモンキョウカガクシュウトシンソウガクシュウニヨルタンサクトセイギョ)

伊藤多一 (イトウタイチ)(著/文)今津義充 (イマズヨシミツ)(著/文)須藤広大 (スドウコウダイ)(著/文)仁ノ平将人 (ニノヒラマサト)(著/文)川﨑悠介 (カワサキユウスケ)(著/文)酒井裕企 (サカイユウキ)(著/文)魏崇哲 (ウェイチョンチェァ)(著/文)

発行：翔泳社

A5判

328ページ

定価 3,400円+税

ISBN: 978-4-7981-5992-8 COPY
ISBN 13: 9784798159928 COPY
ISBN 10h: 4-7981-5992-1 COPY
ISBN 10: 4798159921 COPY
出版者記号: 7981 COPY

Cコード: C3055; 3:専門 0:単行本 55:電子通信

書店発売日: 2019年8月7日
登録日: 2019年6月7日
最終更新日: 2019年8月5日

紹介

注目の最新AI技術！深層強化学習の開発手法がわかる！

第一線で活躍する著者陣の書下ろしによる待望の1冊！

【本書の目的】

AlphaGo（アルファ碁）でも利用されている深層強化学習。

AIサービスのみならずロボティクス分野でもその応用が期待されています。

本書は、AI開発に携わる第一線の著者陣が深層強化学習の開発手法について書き下ろした注目の1冊です。

【本書の特徴】

第1部では、まず、深層強化学習の概要について説明します。

次いで、強化学習の基礎（Q学習、方策勾配法、Actor-Critic法）と深層学習の基礎（CNN、RNN、LSTM）を解説します。

さらに、簡単な例題として倒立振子制御を取り上げ、DQNとActor-Critic法による実装例を紹介します。

第2部では、具体的な応用例として3つのアプローチを実装込みで解説します。

1つ目は、連続動作制御です。ヒューマノイドシミュレータの2足歩行制御を試みます。

2つ目は、パズル問題の解法です。巡回セールスマン問題（TSP）やルービックキューブの解探索について説明します。

3つ目は、系列データ生成です。文書生成（SeqGAN）やニューラルネットワークのアーキテクチャ探索（ENAS）を解説します。

全体を通して、行動の制御を担うエージェントのモデル化と、方策ベースの強化学習によるエージェントの学習法について学ぶことができます。

【読者が得られること】

深層強化学習による開発手法を学ぶことができます。

【対象読者】

深層強化学習を学びたい理工学生・エンジニア

■Part 1　基礎編

CHAPTER 1　強化学習の有用性

　1.1　機械学習の分類

　1.2　強化学習でできること

　1.3　深層強化学習とは

CHAPTER 2　強化学習のアルゴリズム

　2.1　強化学習の基本概念

　2.2　マルコフ決定過程とベルマン方程式

　2.3　ベルマン方程式の解法

　2.4　モデルフリーな制御

CHAPTER 3　深層学習による特徴抽出

　3.1　深層学習

　3.2　畳み込みニューラルネットワーク（CNN）

　3.3　再帰型ニューラルネットワーク（RNN）

CHAPTER 4　深層強化学習の実装

　4.1　深層強化学習の発展

　4.2　行動価値関数のネットワーク表現

　4.3　方策関数のネットワーク表現

■Part 2　応用編

CHAPTER 5　連続制御問題への応用

　5.1　方策勾配法による連続制御

　5.2　学習アルゴリズムと方策モデル

　5.3　連続動作シミュレータ

　5.4　アルゴリズムの実装

　5.5　学習結果と予測制御

CHAPTER 6　組合せ最適化への応用

　6.1　組合せ最適化への応用について

　6.2　巡回セールスマン問題

　6.3　ルービックキューブ問題

　6.4　まとめ

CHAPTER 7　系列データ生成への応用

　7.1　SeqGANによる文章生成

　7.2　ネットワークアーキテクチャの探索

APPENDIX　開発環境の構築

　AP1　ColaboratoryによるGPUの環境構築

　AP2　DockerによるWindowsでの環境構築

上記内容は本書刊行時のものです。

オンライン書店で購入

ｈｏｎｔｏ
紀伊國屋 Web Store
ヨドバシ.com
HonyaClub.com
セブンネットショッピング
e-hon
HMV
TSUTAYA
Yahoo!ショッピング
アマゾン
アマゾンの在庫情報について
発送可能時期は表示された日付/時刻の時点のものであり、変更される場合があります。

本商品の購入においては、購入の時点でAmazon.co.jpに表示されている価格および発送可能時期の情報が適用されます。

本サイト上で表示されるコンテンツの一部は、アマゾンジャパン合同会社またはその関連会社により提供されたものです。

これらのコンテンツは「現状有姿」で提供されており、随時変更または削除される場合があります。

版元ドットコムは、Amazonアソシエイトとして適格販売によりアフィリエイト収入を得ています。

プライバシーポリシーはこちら

書店員向け情報 HELP

出版者情報

書店注文情報

現場で使える！Python深層強化学習入門強化学習と深層学習による探索と制御 (ゲンバデツカエルパイソンシンソウキョウカガクシュウニュウモンキョウカガクシュウトシンソウガクシュウニヨルタンサクトセイギョ)

紹介

目次

OpenBSが利用できません！

ご注文はこちらから

オンライン書店で購入

書店の店頭在庫を確認

書店員向け情報 HELP

出版者情報

書店注文情報

現場で使える！Python深層強化学習入門 強化学習と深層学習による探索と制御 (ゲンバデツカエルパイソンシンソウキョウカガクシュウニュウモン キョウカガクシュウトシンソウガクシュウニヨルタンサクトセイギョ)

紹介

目次

OpenBSが利用できません！

ご注文はこちらから

オンライン書店で購入

書店の店頭在庫を確認

現場で使える！Python深層強化学習入門強化学習と深層学習による探索と制御 (ゲンバデツカエルパイソンシンソウキョウカガクシュウニュウモンキョウカガクシュウトシンソウガクシュウニヨルタンサクトセイギョ)