機能改善 イベント資料の投稿において、SlideShareやSpeakerDeckと同様に、Docswellの資料を埋め込みスライド表示できるように対応いたしました。資料の投稿機能は、資料URLを指定するだけで、URLから取得した情報を、適した形でconnpass上で表示・共有できる機能です

このエントリーをはてなブックマークに追加

Nov

1

強化学習・方策勾配法の基本から理解するChatGPT・GPT-4の学習の仕組み

ChatGPTの学習に用いられる仕組みをInstructGPT論文の数式を元に解説します。

Registration info

事前払い (返金できません)

2500 (Pre-pay)

FCFS
4/7

当日払い

3500(Pay at the door)

FCFS
0/1

About Prepayment

About Prepayment Contact Info:

(Only shown to attendees.)

Cancel/Refund Policy:

前払いの参加費については払い戻しはしておりません。

Print receipt data:

発行する (詳しくはこちら)
参加者への情報
(参加者と発表者のみに公開されます)
出席登録
(イベント開始時間の2時間前から終了時間まで、参加者のみに公開されます)

Description

内容概要

昨今ChatGPT・GPT-4が大きな注目を集め、概要や使い方に関するコンテンツが多い一方で、
仕組みの解説コンテンツがそれほど多くありません。ChatGPT・GPT-4自体の直接の論文は
ありませんが、どちらもInstructGPT論文を元に構築されたという見方が有力です。

そこで当企画ではInstructGPTの論文の内容を詳しく確認することでChatGPTの学習の仕組みに
ついて確認します。特に強化学習部分の式については論文の式をそのまま追うだけでは理解が
難しいので、基本的な理論も合わせて取り扱うことで詳しく理解できるように解説を行います。

・参加にあたって注意
下記に基づいて進行しますので、目次を見た上で参加をご判断ください。数式変形が多いのでご注意ください。
https://hello-stats.booth.pm/items/5063778

開催日程

11/1
受付 19:2019:30
講義 19:3021:30
質疑応答 etc21:3021:45

途中10分程度休憩を挟みます質疑応答は伸びる場合がありますが22:00完全撤収
にご協力をお願いいたします

会場設営の都合上19:20分より前の入室はできませんのでご注意ください

場所

・千代田区神田三崎町2-10-5 土本ビル303号室

場所がわからない方は「参加者への情報」記載の緊急連絡先までご連絡ください。
近くまでお越しの場合は当日スタッフがご案内します。

アジェンダ

・InstructGPTで用いる強化学習
- 強化学習超入門:状態価値関数・Q関数・最適方策による意思決定最適化
- 方策勾配法
- PPO

・InstructGPT
- Supervised Fine-tuning
- RewardModel
- 強化学習の目的関数と勾配計算


■ 下記の内容に基づいて解説を行いますので、予習の際は下記をご確認ください。
https://hello-stats.booth.pm/items/5063778

対象者

・Transformerの仕組みについては一通り理解している方
・対数関数の微分など数Ⅲの微分に抵抗のない方


Transformerについては当日は既知である前提で進行します。
学んだことのない方は下記で解説を作成しましたので、合わせてご確認ください。

- pdf版
https://hello-stats.booth.pm/items/4781879
- Udemy
https://www.udemy.com/course/ai-transformer/?couponCode=43D95C0B5686A4EB0F88

費用

・事前払い:2,500円
・当日払い:3,500円

事前払いの場合、支払い後の返金は原則応じられませんが体調不良など止むを得ない場合は
当日開催時刻までに連絡があれば別日に対応しますのでご相談ください。

定員

8 (増枠は行えませんのでご注意ください)

備考

マスク着用については義務付けませんが、体調不良の場合は無理に参加しないようにお願いします。
返金は原則行えませんが、当日開催時刻までに連絡があれば別日に対応しますのでご相談ください。
マスク着用での開催を希望される方はご要望ありましたら検討いたしますのでお問い合わせください。

Media View all Media

If you add event media, up to 3 items will be shown here.

Feed

lib-arts-adm

lib-arts-adm published 強化学習・方策勾配法の基本から理解するChatGPT・GPT-4の学習の仕組み.

10/17/2023 20:40

強化学習・方策勾配法の基本から理解するChatGPT・GPT-4の学習の仕組み を公開しました!

Group

AI・機械学習 for Experts

Number of events 254

Members 671

Ended

2023/11/01(Wed)

19:30
22:00

You cannot RSVP if you are already participating in another event at the same date.

Registration Period
2023/10/17(Tue) 20:40 〜
2023/11/01(Wed) 22:00

Location

水道橋駅付近

東京都千代田区神田三崎町2-10-5 (土本ビル303号室)

Attendees(4)

masashi sato

masashi sato

強化学習・方策勾配法の基本から理解するChatGPT・GPT-4の学習の仕組み に参加を申し込みました!

MikihiroHashimoto

MikihiroHashimoto

強化学習・方策勾配法の基本から理解するChatGPT・GPT-4の学習の仕組み に参加を申し込みました!

wada

wada

強化学習・方策勾配法の基本から理解するChatGPT・GPT-4の学習の仕組み に参加を申し込みました!

KeiichiOkubo

KeiichiOkubo

強化学習・方策勾配法の基本から理解するChatGPT・GPT-4の学習の仕組み に参加を申し込みました!

Attendees (4)