版元ドットコム

探せる、使える、本の情報

文芸 新書 社会一般 資格・試験 ビジネス スポーツ・健康 趣味・実用 ゲーム 芸能・タレント テレビ・映画化 芸術 哲学・宗教 歴史・地理 社会科学 教育 自然科学 医学 工業・工学 コンピュータ 語学・辞事典 学参 児童図書 ヤングアダルト 全集 文庫 コミック文庫 コミックス(欠番扱) コミックス(雑誌扱) コミックス(書籍) コミックス(廉価版) ムック 雑誌 増刊 別冊
現場で使える!Python深層強化学習入門 強化学習と深層学習による探索と制御 伊藤 多一(著/文) - 翔泳社
..
【利用不可】

書店員向け情報 HELP

書店注文情報

受注専用FAX:
注文電話番号:
なし
注文FAX番号:
注文メール:
なし
受注センター:
注文電話番号:
注文FAX番号:
注文メール:
なし
注文メール:
注文電話番号:
なし
注文FAX番号:
なし
注文メール:

現場で使える!Python深層強化学習入門 強化学習と深層学習による探索と制御 (ゲンバデツカエルパイソンシンソウキョウカガクシュウニュウモン キョウカガクシュウトシンソウガクシュウニヨルタンサクトセイギョ)

このエントリーをはてなブックマークに追加
発行:翔泳社
A5判
328ページ
定価 3,400円+税
ISBN
978-4-7981-5992-8   COPY
ISBN 13
9784798159928   COPY
ISBN 10h
4-7981-5992-1   COPY
ISBN 10
4798159921   COPY
出版者記号
7981   COPY
Cコード
C3055  
3:専門 0:単行本 55:電子通信
出版社在庫情報
不明
書店発売日
登録日
2019年6月7日
最終更新日
2019年8月5日
このエントリーをはてなブックマークに追加

紹介

注目の最新AI技術!深層強化学習の開発手法がわかる!

第一線で活躍する著者陣の書下ろしによる待望の1冊!



【本書の目的】

AlphaGo(アルファ碁)でも利用されている深層強化学習。

AIサービスのみならずロボティクス分野でもその応用が期待されています。

本書は、AI開発に携わる第一線の著者陣が深層強化学習の開発手法について書き下ろした注目の1冊です。



【本書の特徴】

第1部では、まず、深層強化学習の概要について説明します。

次いで、強化学習の基礎(Q学習、方策勾配法、Actor-Critic法)と深層学習の基礎(CNN、RNN、LSTM)を解説します。

さらに、簡単な例題として倒立振子制御を取り上げ、DQNとActor-Critic法による実装例を紹介します。

第2部では、具体的な応用例として3つのアプローチを実装込みで解説します。

1つ目は、連続動作制御です。ヒューマノイドシミュレータの2足歩行制御を試みます。

2つ目は、パズル問題の解法です。巡回セールスマン問題(TSP)やルービックキューブの解探索について説明します。

3つ目は、系列データ生成です。文書生成(SeqGAN)やニューラルネットワークのアーキテクチャ探索(ENAS)を解説します。


全体を通して、行動の制御を担うエージェントのモデル化と、方策ベースの強化学習によるエージェントの学習法について学ぶことができます。



【読者が得られること】

深層強化学習による開発手法を学ぶことができます。


【対象読者】

深層強化学習を学びたい理工学生・エンジニア

目次

■Part 1 基礎編



CHAPTER 1 強化学習の有用性

 1.1 機械学習の分類

 1.2 強化学習でできること

 1.3 深層強化学習とは



CHAPTER 2 強化学習のアルゴリズム

 2.1 強化学習の基本概念

 2.2 マルコフ決定過程とベルマン方程式

 2.3 ベルマン方程式の解法

 2.4 モデルフリーな制御



CHAPTER 3 深層学習による特徴抽出

 3.1 深層学習

 3.2 畳み込みニューラルネットワーク(CNN)

 3.3 再帰型ニューラルネットワーク(RNN)



CHAPTER 4 深層強化学習の実装

 4.1 深層強化学習の発展

 4.2 行動価値関数のネットワーク表現

 4.3 方策関数のネットワーク表現



■Part 2 応用編



CHAPTER 5 連続制御問題への応用

 5.1 方策勾配法による連続制御

 5.2 学習アルゴリズムと方策モデル

 5.3 連続動作シミュレータ

 5.4 アルゴリズムの実装

 5.5 学習結果と予測制御



CHAPTER 6 組合せ最適化への応用

 6.1 組合せ最適化への応用について

 6.2 巡回セールスマン問題

 6.3 ルービックキューブ問題

 6.4 まとめ



CHAPTER 7 系列データ生成への応用

 7.1 SeqGANによる文章生成

 7.2 ネットワークアーキテクチャの探索



APPENDIX 開発環境の構築

 AP1 ColaboratoryによるGPUの環境構築

 AP2 DockerによるWindowsでの環境構築

上記内容は本書刊行時のものです。