Feb
7
R2D2、MuZero、R2D3に学ぶ、深層強化学習の最新トピックと知っておきたい基礎知識
最新の話題と基本的な話題を組み合わせることで、深層強化学習について知っていただけたらと思います!!
Registration info |
テキスト購入者枠 ¥5000(Pay at the door)
FCFS
通常参加者枠 ¥6000(Pay at the door)
FCFS
|
---|
Description
内容概要
Deep Q-Network[2013/2015]、Rainbow[2017]、Ape-X[2018]、R2D2[2019]、 R2D3[2019]、AlphaZero[2017]、MuZero[2019]などの論文を元に、深層強化学習の 最新の研究トレンドとその元となる基本的な考え方について解説します。 ↓Rainbow論文 https://arxiv.org/abs/1710.02298 ↓Ape-X論文 https://arxiv.org/abs/1803.00933 ↓R2D2論文 https://openreview.net/pdf?id=r1lyTjAqYX ↓R2D3論文 https://arxiv.org/abs/1909.01387 ↓AlphaZero論文 https://arxiv.org/abs/1712.01815 ↓MuZero論文 https://arxiv.org/abs/1911.08265 ↓大枠としての強化学習の概念は既知としますので、下記のテキストを軽く目を通した 上でのご参加をお勧めします。 https://note.com/lib_arts/n/n8cf4cbe2dce4 (有料ですが、購入いただいた方はその分参加費を割り引きますので総額は変わらないです)
開催日程
1/13(月) 受付: 15:50〜16:00 講義: 16:00〜18:00 ※ 途中5分ほどの休憩を設ける予定です。 ※ 19:40より前の入室は原則としてお断りします。
アジェンダ
1. 前提知識の確認(20分) 強化学習の問題設定(Sequential Decision Making Problem) Model-freeとModel-basedを一つの図で整理する ↓参考 https://lib-arts.hatenablog.com/entry/rl_sutton4 2. モデルベース(Model-based)強化学習(30分) モンテカルロ木探索 AlphaGo、AlphaGo Zero、AlphaZero ↓参考 https://lib-arts.hatenablog.com/entry/rl_MCTS_basic https://lib-arts.hatenablog.com/entry/rl_paper5 (1/18投稿予定) 3. モデルフリー(Model-free)強化学習について(30分) Q-learningとDeep Q-Network Rainbow[2017] ↓参考 https://lib-arts.hatenablog.com/entry/rl_trend6 4. 最新トピックについて(30分) Ape-X[2018] R2D2[2019] MuZero[2019] R2D3[2019] ↓参考 https://lib-arts.hatenablog.com/entry/rl_paper1 https://lib-arts.hatenablog.com/entry/rl_paper2 https://lib-arts.hatenablog.com/entry/rl_paper3 https://lib-arts.hatenablog.com/entry/rl_paper4 ※ 全体の流れは変えませんが、細かい時間配分は内容踏まえて変更する可能性があります。
会場
水道橋駅、神保町駅、九段下駅周辺 千代田区西神田2-7-14 YS西神田ビル2F
対象者
・R2D3やMuZeroなどの深層強化学習の最新トピックに興味がある方 ・モデルベース(model-based)とモデルフリー(model-free)の違いについて理解したい方 ・DeepLearningの基本的な内容が把握できている方
講師プロフィール
東大工学部卒。 データ分析/AI開発の仕事の経験は7年ほどで、理論/開発/ビジネスのどれも経験があり強い。 また、多くの業界のプロジェクトに関わったためドメイン知識も豊富。 初心者向けの指導実績も多く、1,000名近い。
当日までの準備
・大枠としての強化学習の概念は既知としますので、下記のテキストを軽く目を通した 上でのご参加をお勧めします。 https://note.com/lib_arts/n/n8cf4cbe2dce4 ・model-based強化学習について気になる方は下記の8章が詳しいようなのでこちらを 確認するのが良いと思います。 https://www.andrew.cmu.edu/course/10-703/textbook/BartoSutton.pdf (model-based強化学習については当日時間を取って解説しますので、気になる方だけ 予習いただけたら十分です。)
費用
・6,000円(2h) (テキスト購入者は5,000円とします。購入の上、購入が証明できるページの印刷など いただけたら確認がスムーズとなるので嬉しいです。) ※ 領収書発行の際は事務手数料として追加2,000円のお支払いをよろしくお願いいたします
定員
8名(人数に合わせて調整します、別媒体でも募集していますので申し込み人数は当日参加者数を 反映しません。最大でも16名までで考えています。)
ご参加にあたってのお願い
無断欠席や前日以降のキャンセルに関しては当日人数読めなくなり非常に迷惑なので 基本的に行わないようにお願いします。(直前参加は定員的に問題なければ歓迎です!) 体調不良、職務都合、ご家庭の事情などどうしてものケースは別途ご連絡いただくか、 イベントへのお問い合わせよりご連絡いただけますと嬉しいです。 上記がひどいアカウントに関してはブラックリスト処理を行い以後の参加をお断りさせて いただきますので、その点だけ予めご了承ください。 (7割以上来れる前提でのお申し込みと前日以降のキャンセルはメッセージでのご連絡を いただくということだけ気をつけていただければ大丈夫だと思います) モチベーションの高い参加者の方を重視する運営としていきたいと考えています。 ご協力のほど、よろしくお願いいたします。