R2D2、MuZero、R2D3に学ぶ、深層強化学習の最新トピックと知っておきたい基礎知識

2月

7
R2D2、MuZero、R2D3に学ぶ、深層強化学習の最新トピックと知っておきたい基礎知識
最新の話題と基本的な話題を組み合わせることで、深層強化学習について知っていただけたらと思います！！

募集内容	テキスト購入者枠 5000円（会場払い）先着順 3/4人通常参加者枠 6000円（会場払い）先着順 2/4人
申込者	申込者一覧を見る
開催日時	2020/02/07(金) 20:00 ～ 22:00 Googleカレンダー icsファイル
募集期間	2020/01/14(火) 18:58 〜 2020/02/07(金) 22:00まで
会場	水道橋駅周辺予定、詳細は確定後に反映させます

イベントの説明

内容概要

Deep Q-Network[2013/2015]、Rainbow[2017]、Ape-X[2018]、R2D2[2019]、
R2D3[2019]、AlphaZero[2017]、MuZero[2019]などの論文を元に、深層強化学習の
最新の研究トレンドとその元となる基本的な考え方について解説します。

↓Rainbow論文
https://arxiv.org/abs/1710.02298

↓Ape-X論文
https://arxiv.org/abs/1803.00933

↓R2D2論文
https://openreview.net/pdf?id=r1lyTjAqYX

↓R2D3論文
https://arxiv.org/abs/1909.01387

↓AlphaZero論文
https://arxiv.org/abs/1712.01815

↓MuZero論文
https://arxiv.org/abs/1911.08265


↓大枠としての強化学習の概念は既知としますので、下記のテキストを軽く目を通した
上でのご参加をお勧めします。
https://note.com/lib_arts/n/n8cf4cbe2dce4
（有料ですが、購入いただいた方はその分参加費を割り引きますので総額は変わらないです）

開催日程

1/13（月）
受付： 15:50〜16:00
講義： 16:00〜18:00

※ 途中5分ほどの休憩を設ける予定です。
※ 19:40より前の入室は原則としてお断りします。

アジェンダ

1. 前提知識の確認(20分)
　　強化学習の問題設定(Sequential Decision Making Problem)
　　Model-freeとModel-basedを一つの図で整理する
　　↓参考
　　https://lib-arts.hatenablog.com/entry/rl_sutton4

2. モデルベース(Model-based)強化学習(30分)
　　モンテカルロ木探索
　　AlphaGo、AlphaGo Zero、AlphaZero
　　↓参考
　　https://lib-arts.hatenablog.com/entry/rl_MCTS_basic
　　https://lib-arts.hatenablog.com/entry/rl_paper5 (1/18投稿予定)

3. モデルフリー(Model-free)強化学習について(30分)
　　Q-learningとDeep Q-Network
　　Rainbow[2017]
　　↓参考
　　https://lib-arts.hatenablog.com/entry/rl_trend6

4. 最新トピックについて(30分)
　　Ape-X[2018]
　　R2D2[2019]
　　MuZero[2019]
　　R2D3[2019]
　　↓参考
　　https://lib-arts.hatenablog.com/entry/rl_paper1
　　https://lib-arts.hatenablog.com/entry/rl_paper2
　　https://lib-arts.hatenablog.com/entry/rl_paper3
　　https://lib-arts.hatenablog.com/entry/rl_paper4

※ 全体の流れは変えませんが、細かい時間配分は内容踏まえて変更する可能性があります。

会場

水道橋駅、神保町駅、九段下駅周辺
千代田区西神田2-7-14 YS西神田ビル2F

対象者

・R2D3やMuZeroなどの深層強化学習の最新トピックに興味がある方
・モデルベース(model-based)とモデルフリー(model-free)の違いについて理解したい方
・DeepLearningの基本的な内容が把握できている方

講師プロフィール

東大工学部卒。
データ分析/AI開発の仕事の経験は7年ほどで、理論/開発/ビジネスのどれも経験があり強い。
また、多くの業界のプロジェクトに関わったためドメイン知識も豊富。
初心者向けの指導実績も多く、1,000名近い。

当日までの準備

・大枠としての強化学習の概念は既知としますので、下記のテキストを軽く目を通した
上でのご参加をお勧めします。
https://note.com/lib_arts/n/n8cf4cbe2dce4

・model-based強化学習について気になる方は下記の8章が詳しいようなのでこちらを
確認するのが良いと思います。
https://www.andrew.cmu.edu/course/10-703/textbook/BartoSutton.pdf
（model-based強化学習については当日時間を取って解説しますので、気になる方だけ
予習いただけたら十分です。）

費用

・6,000円（2h）
（テキスト購入者は5,000円とします。購入の上、購入が証明できるページの印刷など
いただけたら確認がスムーズとなるので嬉しいです。）

※ 領収書発行の際は事務手数料として追加2,000円のお支払いをよろしくお願いいたします

定員

8名（人数に合わせて調整します、別媒体でも募集していますので申し込み人数は当日参加者数を
反映しません。最大でも16名までで考えています。）

ご参加にあたってのお願い

無断欠席や前日以降のキャンセルに関しては当日人数読めなくなり非常に迷惑なので
基本的に行わないようにお願いします。（直前参加は定員的に問題なければ歓迎です！）
体調不良、職務都合、ご家庭の事情などどうしてものケースは別途ご連絡いただくか、
イベントへのお問い合わせよりご連絡いただけますと嬉しいです。
上記がひどいアカウントに関してはブラックリスト処理を行い以後の参加をお断りさせて
いただきますので、その点だけ予めご了承ください。
（7割以上来れる前提でのお申し込みと前日以降のキャンセルはメッセージでのご連絡を
いただくということだけ気をつけていただければ大丈夫だと思います）

モチベーションの高い参加者の方を重視する運営としていきたいと考えています。
ご協力のほど、よろしくお願いいたします。