版元ドットコム

探せる、使える、本の情報

文芸 新書 社会一般 資格・試験 ビジネス スポーツ・健康 趣味・実用 ゲーム 芸能・タレント テレビ・映画化 芸術 哲学・宗教 歴史・地理 社会科学 教育 自然科学 医学 工業・工学 コンピュータ 語学・辞事典 学参 児童図書 ヤングアダルト 全集 文庫 コミック文庫 コミックス(欠番扱) コミックス(雑誌扱) コミックス(書籍) コミックス(廉価版) ムック 雑誌 増刊 別冊
これからの強化学習 牧野 貴樹(著/文 | 編集) - 森北出版
..
詳細画像 0 詳細画像 1 詳細画像 2
【利用不可】

これからの強化学習 (コレカラノキョウカガクシュウ)

コンピュータ
このエントリーをはてなブックマークに追加
発行:森北出版
菊判
320ページ
定価 4,200円+税
ISBN
978-4-627-88031-3   COPY
ISBN 13
9784627880313   COPY
ISBN 10h
4-627-88031-6   COPY
ISBN 10
4627880316   COPY
出版者記号
627   COPY
Cコード
C3004  
3:専門 0:単行本 04:情報科学
出版社在庫情報
不明
初版年月日
2016年10月
書店発売日
登録日
2016年9月3日
最終更新日
2016年9月3日
このエントリーをはてなブックマークに追加

紹介

◆強化学習は「ポストビッグデータ」の技術である!
人工知能,金融工学,ロボット制御,言語処理,生産現場やサービスの最適化,あらゆる分野に応用が広がる強化学習.十分なデータが与えられることが前提とされる他の機械学習法と異なり,「足りないデータを集めながら最適化すること」に力点を置く強化学習は,ビッグデータの先を行くための重要な技術となることが期待されます.

◆強化学習の「いま」を知り,「これから」を切り拓くための1冊.
本書では,この分野を代表する執筆陣が集い,強化学習の基礎・発展・応用を多面的に解説します.
・基礎:強化学習の動作原理と基本アルゴリズムを,初学者でも分かるように導入.
・発展:より複雑な問題に対処し,高度な研究に進むための,さまざまな発展的手法を解説.
・応用:マルチロボットシステムの制御,対話処理,医療データ分析,囲碁の対局など広範な応用例・研究事例を通して,強化学習の活用法を紹介.人間の行動や脳の動作を説明するモデルとしての理論・実験も解説.

――強化学習の基礎を学びたい方,発展的手法に触れたい方,応用可能性を一望したい方に最適な1冊!

目次

第1章 強化学習の基礎的理論
強化学習とは/強化学習の構成要素/価値関数に基づくアルゴリズム/改善に基づくアルゴリズム/部分観測マルコフ決定過程と強化学習

第2章 強化学習の発展的理論
統計学習の観点から見たTD学習/強化学習アルゴリズムの理論性能解析とベイズ統計による強化学習のモデル化/逆強化学習/試行錯誤回数の低減を指向した手法:経験強化型学習XoL/群強化学習法/リスク考慮型強化学習/複利型強化学習

第3章 強化学習の工学応用
高次元・実環境における強化学習/連続的な状態・行動空間への拡張:マルチロボットシステムへの適用/対話処理における強化学習/マルチエージェント系の報酬設計/自然言語処理における逆強化学習・模倣学習の適用/医療臨床データ分析への応用/深層学習を用いたQ関数の学習:Atariと囲碁への応用

第4章 知能のモデルとしての強化学習
脳の意思決定機構と強化学習/内発的動機付けによるエージェントの学習と発達

著者プロフィール

牧野 貴樹  (マキノタカキ)  (著/文 | 編集

グーグル株式会社   博(理)

澁谷 長史  (シブヤタケシ)  (著/文 | 編集

筑波大学 助教 博(工)

白川 真一  (シラカワシンイチ)  (著/文 | 編集

横浜国立大学 講師 博(工)

浅田 稔  (アサダミノル)  (著/文

大阪大学 教授 工博

麻生 英樹  (アソウヒデキ)  (著/文

産業技術総合研究所

荒井 幸代  (アライサチヨ)  (著/文

千葉大学 教授 博士(工学)

飯間 等  (イイマヒトシ)  (著/文

京都工芸繊維大学 准教授 博(工)

伊藤 真  (イトウマコト)  (著/文

沖縄科学技術大学院大学 博(情報科学)

大倉 和博  (オオクラカズヒロ)  (著/文

広島大学 教授 博(工)

黒江 康明  (クロエヤスアキ)  (著/文

京都工芸繊維大学 教授 学術博士

杉本 徳和  (スギモトノリカズ)  (著/文

情報通信研究機構 博(工)

坪井 祐太  (ツボイユウタ)  (著/文

日本IBM東京基礎研究所 博(工)

銅谷 賢治  (ドウヤケンジ)  (著/文

沖縄科学技術大学院大学 教授 博(工)

前田 新一  (マエダシンイチ)  (著/文

京都大学 助教 博(理)

松井 藤五郎  (マツイトウゴロウ)  (著/文

中部大学 准教授 博(工)

南 泰浩  (ミナミヤスヒロ)  (著/文

電気通信大学 教授 工博

宮崎 和光  (ミヤザキカズテル)  (著/文

独立行政法人大学改革支援・学位授与機構 准教授 博(工)

目黒 豊美  (メグロトヨミ)  (著/文

NTTコミュニケーション科学基礎研究所

森村 哲郎  (モリムラテツロウ)  (著/文

日本IBM東京基礎研究所 博(工)

森本 淳  (モリモトジュン)  (著/文

ATR脳情報研究所 博(工)

保田 俊行  (ヤスダトシユキ)  (著/文

広島大学 助教 博(工)

吉本 潤一郎  (ヨシモトジュンイチロウ)  (著/文

奈良先端科学技術大学院大学 准教授 博(工)

上記内容は本書刊行時のものです。