ISBN: 9789864344307
出版日期: 2019-11-11
作者: Maxim Lapan
譯者: 劉立民
裝訂: 平裝.單色印刷.528頁.23.
實作現代強化學習方法:深度Q網路、值迭代、策略梯度、TRPO、AlphaGo Zero…
強化學習(RL)的最新發展,結合使用深度學習(DL),在訓練代理人「像人類一樣地」解決複雜問題這方面,取得了前所未有的進步。Google團隊利用演算法來玩知名的Atari街機遊戲,並擊敗了它們,這可以說是讓RL領域發光發熱的重要推手,而世界各地的研究人員正馬不停蹄地研發各種新的想法。
《動手做深度強化學習》綜合性地介紹了最新的DL工具與它們的限制。讀者將評估包括交叉熵和策略梯度等方法,再把它們應用於真實的環境之中。本書使用Atari虛擬遊戲和一般家庭常玩的Connect4遊戲作為範例。除了介紹RL的基礎知識之外,作者亦詳述如何製作智慧型學習代理人等專業知識,讓讀者在面對一系列艱鉅的真實世界挑戰時,能游刃有餘。本書也會說明如何在網格世界(grid world)環境中實作Q學習、如何讓代理人學會買賣和交易股票,並學習聊天機器人是如何使用自然語言模型與人類對話的。
在這本書中,你將學到:
・ 了解結合了RL的DL內容,並實作複雜的DL模型
・ 學習RL的基礎:馬可夫決策過程
・ 評估RL方法,包括交叉熵、DQN、Actor-Critic、TRPO、PPO、DDPG、D4PG…等等
・ 了解如何在各種環境中處理離散行動空間和連續行動空間
・ 使用值迭代法來擊敗Atari街機遊戲
・ 建立屬於自己的OpenAI Gym環境,來訓練股票交易代理人
・ 使用AlphaGo Zero演算法,教你的代理人玩Connect4
・ 探索最新的深度RL研究主題,包括AI驅動的聊天機器人等等
下載範例程式檔案:
本書的程式碼是由 GitHub 託管,可以在如下網址找到:github.com/PacktPublishing/Deep-Reinforcement-Learning-Hands-On。
下載本書的彩色圖片:
我們還提供您一個PDF檔案,其中包含本書使用的彩色螢幕截圖/彩色圖表,可以在此下載:static.packt-cdn.com/downloads/DeepReinforcementLearningHandsOn_ColorImages.pdf。
作者簡介
Maxim Lapan
作者簡介
Maxim Lapan
Maxim Lapan是一位深度學習的愛好者,也是一位獨立研究人員。他有15 年的工作經驗,身分是「軟體開發人員」與「系統架構師」,參與的專案從低階的Linux 核心驅動程式開發,到在數千台伺服器上執行的「分散式應用程式」的「設計」與「性能優化」。憑藉著在大數據、機器學習以及大型平行分散式HPC 和非HPC 系統方面的豐富工作經驗,他能用「簡單的句子」與「生動的範例」來解釋複雜事物的關鍵重點。目前他最感興趣的領域是深度學習的實務應用,例如:「深度自然語言處理」和「深度強化學習」。
Maxim 和他的家人住在莫斯科,俄羅斯聯邦,他在以色列新創公司擔任資深NLP 開發人員。

区域 | 订单总额 (RM) | 运费 (RM) |
---|---|---|
West Malaysia | 统一收费 | 6.00 |
区域 | 计算/重量 | 运费 (RM) |
---|---|---|
East Malaysia | 首 1.00 kg | 13.00 |
额外 1.00 kg | 5.00 | |
Singapore | 首 1.00 kg | 25.00 |
额外 1.00 kg | 5.00 | |
Australia, New Zealand | 首 1.00 kg | 159.77 |
额外 0.50 kg | 52.65 | |
Austria, Denmark, Finland, Ireland, Switzerland, Russia | 首 1.00 kg | 157.78 |
额外 0.50 kg | 34.31 | |
Brunei, Cambodia, Laos, Mongolia | 首 1.00 kg | 175.10 |
额外 0.50 kg | 87.14 | |
Belgium,France, Germany, Netherlands, Spain, U.K | 首 1.00 kg | 150.94 |
额外 0.50 kg | 30.46 | |
China | 首 1.00 kg | 96.44 |
额外 0.50 kg | 25.35 | |
Bangladesh, Brazil, Iraq, Pakistan, Qatar, S.Arabia, UAE, Sri Lanka | 首 1.00 kg | 118.52 |
额外 0.50 kg | 24.96 | |
South Africa | 首 1.00 kg | 118.52 |
额外 0.50 kg | 24.96 | |
Philippines | 首 1.00 kg | 91.42 |
额外 0.50 kg | 15.29 | |
Canada, United States, Mexico | 首 1.00 kg | 162.58 |
额外 0.50 kg | 35.90 | |
Hong Kong | 首 1.00 kg | 80.63 |
额外 0.50 kg | 29.06 | |
India | 首 1.00 kg | 113.30 |
额外 0.50 kg | 22.28 | |
Indonesia | 首 1.00 kg | 107.35 |
额外 0.50 kg | 24.87 | |
Japan | 首 1.00 kg | 112.97 |
额外 0.50 kg | 35.03 | |
Macau | 首 1.00 kg | 92.93 |
额外 0.50 kg | 13.82 | |
Singapore | 首 1.00 kg | 74.75 |
额外 0.50 kg | 21.49 | |
Taiwan | 首 1.00 kg | 94.42 |
额外 0.50 kg | 34.76 | |
Thailand | 首 1.00 kg | 94.10 |
额外 0.50 kg | 28.25 | |
Vietnam | 首 1.00 kg | 98.94 |
额外 0.50 kg | 14.34 |