..
発行:森北出版
菊判
256ページ
定価
4,200円+税
- ISBN
- 978-4-627-85521-2 COPY
-
ISBN 13
- 9784627855212 COPY
-
ISBN 10h
- 4-627-85521-4 COPY
-
ISBN 10
- 4627855214 COPY
-
出版者記号
- 627 COPY
- Cコード
-
C3004
-
専門 単行本 情報科学
- 初版年月日
- 2021年3月
- 書店発売日
- 2021年3月30日
- 登録日
- 2021年2月2日
- 最終更新日
- 2021年3月17日
紹介
推薦システム,金融工学,RPG,…そして,深層強化学習。
さまざまな応用例を交えながら,マルコフ決定過程の理論とモデル化の基礎が身につく一冊。
マルコフ決定過程は,マルコフ連鎖に制御や意思決定の要素を加えた確率モデルです。本書では,前半で基礎理論とアルゴリズムを,後半で応用事例を学んでいきます。モデル式の工夫のしかたや複雑な計算手順を,モデル化の観点から一貫性をもって理解することができます。
マルコフ決定過程は,深層強化学習のアルゴリズムの基礎でもあります。本書の最終章では,深層強化学習の概要とニューラルネットワークで行われる計算のしくみを,マルコフ決定過程の計算を通して学びます。
目次
第1章 マルコフ決定過程とは
第2章 マルコフ決定過程の基本的な問題設定とアルゴリズム
第3章 マルコフ決定過程の基本的な機械学習
第4章 真のパラメータが変化するマルコフ決定過程
第5章 状態,行動,利得に関する工夫
第6章 推薦システムへの適用
第7章 金融工学への適用
第8章 ロールプレイングゲームへの適用
第9章 通信工学への適用
第10章 ベイズ流の仮説検定への適用
第11章 教育工学への適用
第12章 設備保全,アセットマネジメントとヘルスケア支援への適用
第13章 深層強化学習の入口
上記内容は本書刊行時のものです。