機能改善 イベント編集時の「重複参加の許可」をデフォルトで「許可しない」から「許可する」に変更しました。詳しくは こちら をご確認ください

お知らせ connpassアカウントのパスワードを設定することで、ソーシャル認証に依存しないログインも可能となります。詳しくは以下のヘルプをご確認ください。
- パスワードの設定
- ソーシャル認証ログインが出来なくなった場合の操作
イベント管理者様・グループ管理者様も上記ヘルプを 一括メッセージ機能 にて参加者・グループメンバーへ案内して、連絡がつかなくならないようご注意ください。

このエントリーをはてなブックマークに追加

Apr

26

【中級者向け】【MAX6名】R2D3やMuZeroから俯瞰する深層強化学習の大枠

基本から研究トレンドまで確認します!!

Registration info

通常参加者枠

6000(Pay at the door)

FCFS
1/6

Description

内容概要

強化学習の基本的な内容を抑えつつ、
Deep Q-Network[2013/2015]Rainbow[2017]Ape-X[2018]R2D2[2019]
R2D3[2019]AlphaZero[2017]MuZero[2019]などの論文を元に、深層強化学習の
最新の研究トレンドとその元となる基本的な考え方について解説します。
https://lib-arts.booth.pm/items/1847279
https://lib-arts.booth.pm/items/1960313
上記のテキストの内容を元に色々とご説明していきます。

下記論文リストです。
Rainbow論文
https://arxiv.org/abs/1710.02298
Ape-X論文
https://arxiv.org/abs/1803.00933
R2D2論文
https://openreview.net/pdf?id=r1lyTjAqYX
R2D3論文
https://arxiv.org/abs/1909.01387
AlphaZero論文
https://arxiv.org/abs/1712.01815
MuZero論文
https://arxiv.org/abs/1911.08265


↓事前に予習したい方は下記を軽く読み流してきてください。
https://lib-arts.booth.pm/items/1847279

開催日程

4/26(日)
受付: 15:5516:00
講義: 16:0018:00

 途中5分ほどの休憩を設ける予定です。
 15:55より前の入室は原則としてお断りします。

アジェンダ

1. 前提知識の確認(30)
  強化学習の問題設定(Sequential Decision Making Problem)
  Model-freeとModel-basedを一つの図で整理する
  条件付き確率と強化学習
  ベルマン方程式と数列の和
  ↓参考
  https://lib-arts.hatenablog.com/entry/rl_sutton4

2. モデルベース(Model-based)強化学習(20)
  モンテカルロ木探索
  AlphaZero
  ↓参考
  https://lib-arts.hatenablog.com/entry/rl_MCTS_basic
  https://lib-arts.hatenablog.com/entry/rl_paper5 (1/18投稿予定)

3. モデルフリー(Model-free)強化学習について(30)
  Q-learningとDeep Q-Network
  Rainbow[2017]
  ↓参考
  https://lib-arts.hatenablog.com/entry/rl_trend6

4. 最新トピックについて(30)
  Ape-X[2018]
  R2D2[2019]
  MuZero[2019]
  R2D3[2019]
  ↓参考
  https://lib-arts.hatenablog.com/entry/rl_paper1
  https://lib-arts.hatenablog.com/entry/rl_paper2
  https://lib-arts.hatenablog.com/entry/rl_paper3
  https://lib-arts.hatenablog.com/entry/rl_paper4

 全体の流れは変えませんが、細かい時間配分は内容踏まえて変更する可能性があります。

会場

水道橋駅、神保町駅、九段下駅周辺
千代田区西神田2-7-14 YS西神田ビル2F

対象者

R2D3やMuZeroなどの深層強化学習の最新トピックに興味がある方
・モデルベース(model-based)とモデルフリー(model-free)の違いについて理解したい方
DeepLearningの基本的な内容が把握できている方

講師プロフィール

東大工学部卒。
データ分析/AI開発の仕事の経験は8年ほどで、理論/開発/ビジネスのどれも経験があり強い。
また、多くの業界のプロジェクトに関わったためドメイン知識も豊富。
初心者向けの指導実績も多く、1,500名近い。

当日までの準備

・事前知識に自信のない方は下記などを軽く読み流してきてください。
https://lib-arts.booth.pm/items/1847279

model-based強化学習について気になる方は下記の8章が詳しいようなのでこちらを
確認するのが良いと思います。
https://www.andrew.cmu.edu/course/10-703/textbook/BartoSutton.pdf

・深層学習の知識については「ゼロから作るDeepLearning」に記載の内容のレベルは
既知とさせてください。

費用

6,000円(2h

 領収書発行の際は事務手数料として追加2,000円のお支払いをよろしくお願いいたします

定員

6名(増枠はしません)

Media View all Media

If you add event media, up to 3 items will be shown here.

Feed

lib-arts-adm

lib-arts-adm published 【中級者向け】【MAX6名】R2D3やMuZeroから俯瞰する深層強化学習の大枠.

04/18/2020 22:54

【中級者向け】【MAX6名】R2D3やMuZeroから俯瞰する深層強化学習の大枠 を公開しました!

Ended

2020/04/26(Sun)

16:00
18:00

You cannot RSVP if you are already participating in another event at the same date.

Registration Period
2020/04/18(Sat) 22:54 〜
2020/04/26(Sun) 18:00

Location

水道橋駅周辺

水道橋駅周辺

Attendees(1)

SnowFox

SnowFox

【中級者向け】【MAX6名】R2D3やMuZeroから俯瞰する深層強化学習の大枠に参加を申し込みました!

Attendees (1)

Canceled (1)