お知らせ 2024年9月1日よりconnpassサービスサイトへのスクレイピングを禁止とし、利用規約に禁止事項として明記します。
9月1日以降のconnpassの情報取得につきましては イベントサーチAPI の利用をご検討ください。

お知らせ connpassではさらなる価値のあるデータを提供するため、イベントサーチAPIの提供方法の見直しを決定しました。2024年5月23日(木)より 「企業・法人」「コミュニティ及び個人」向けの2プランを提供開始いたします。ご利用にあたっては利用申請及び審査がございます。詳細はヘルプページをご確認ください。

このエントリーをはてなブックマークに追加

Nov

1

強化学習・方策勾配法の基本から理解するChatGPT・GPT-4の学習の仕組み

ChatGPTの学習に用いられる仕組みをInstructGPT論文の数式を元に解説します。

強化学習・方策勾配法の基本から理解するChatGPT・GPT-4の学習の仕組み
Registration info

事前払い (返金できません)

2500 (Pre-pay)

FCFS
4/7

当日払い

3500(Pay at the door)

FCFS
0/1

Attendees
masashi sato
MikihiroHashimoto
wada
KeiichiOkubo
View Attendee List
Start Date
2023/11/01(Wed) 19:30 ~ 22:00
Registration Period

2023/10/17(Tue) 20:40 〜
2023/11/01(Wed) 22:00まで

Location

水道橋駅付近

東京都千代田区神田三崎町2-10-5 (土本ビル303号室)

View Map
About Prepayment

About Prepayment Contact Info:

(Only shown to attendees.)

Cancel/Refund Policy:

前払いの参加費については払い戻しはしておりません。

Print receipt data:

発行する (詳しくはこちら)
参加者への情報
(参加者と発表者のみに公開されます)
出席登録
(イベント開始時間の2時間前から終了時間まで、参加者のみに公開されます)

Description

内容概要

昨今ChatGPT・GPT-4が大きな注目を集め、概要や使い方に関するコンテンツが多い一方で、
仕組みの解説コンテンツがそれほど多くありません。ChatGPT・GPT-4自体の直接の論文は
ありませんが、どちらもInstructGPT論文を元に構築されたという見方が有力です。

そこで当企画ではInstructGPTの論文の内容を詳しく確認することでChatGPTの学習の仕組みに
ついて確認します。特に強化学習部分の式については論文の式をそのまま追うだけでは理解が
難しいので、基本的な理論も合わせて取り扱うことで詳しく理解できるように解説を行います。

・参加にあたって注意
下記に基づいて進行しますので、目次を見た上で参加をご判断ください。数式変形が多いのでご注意ください。
https://hello-stats.booth.pm/items/5063778

開催日程

11/1
受付 19:2019:30
講義 19:3021:30
質疑応答 etc21:3021:45

途中10分程度休憩を挟みます質疑応答は伸びる場合がありますが22:00完全撤収
にご協力をお願いいたします

会場設営の都合上19:20分より前の入室はできませんのでご注意ください

場所

・千代田区神田三崎町2-10-5 土本ビル303号室

場所がわからない方は「参加者への情報」記載の緊急連絡先までご連絡ください。
近くまでお越しの場合は当日スタッフがご案内します。

アジェンダ

・InstructGPTで用いる強化学習
- 強化学習超入門:状態価値関数・Q関数・最適方策による意思決定最適化
- 方策勾配法
- PPO

・InstructGPT
- Supervised Fine-tuning
- RewardModel
- 強化学習の目的関数と勾配計算


■ 下記の内容に基づいて解説を行いますので、予習の際は下記をご確認ください。
https://hello-stats.booth.pm/items/5063778

対象者

・Transformerの仕組みについては一通り理解している方
・対数関数の微分など数Ⅲの微分に抵抗のない方


Transformerについては当日は既知である前提で進行します。
学んだことのない方は下記で解説を作成しましたので、合わせてご確認ください。

- pdf版
https://hello-stats.booth.pm/items/4781879
- Udemy
https://www.udemy.com/course/ai-transformer/?couponCode=43D95C0B5686A4EB0F88

費用

・事前払い:2,500円
・当日払い:3,500円

事前払いの場合、支払い後の返金は原則応じられませんが体調不良など止むを得ない場合は
当日開催時刻までに連絡があれば別日に対応しますのでご相談ください。

定員

8 (増枠は行えませんのでご注意ください)

備考

マスク着用については義務付けませんが、体調不良の場合は無理に参加しないようにお願いします。
返金は原則行えませんが、当日開催時刻までに連絡があれば別日に対応しますのでご相談ください。
マスク着用での開催を希望される方はご要望ありましたら検討いたしますのでお問い合わせください。

Media View all Media

If you add event media, up to 3 items will be shown here.

Feed

lib-arts-adm

lib-arts-adm published 強化学習・方策勾配法の基本から理解するChatGPT・GPT-4の学習の仕組み.

10/17/2023 20:40

強化学習・方策勾配法の基本から理解するChatGPT・GPT-4の学習の仕組み を公開しました!

Ended

2023/11/01(Wed)

19:30
22:00

You cannot RSVP if you are already participating in another event at the same date.

Registration Period
2023/10/17(Tue) 20:40 〜
2023/11/01(Wed) 22:00

Location

水道橋駅付近

東京都千代田区神田三崎町2-10-5 (土本ビル303号室)

Attendees(4)

masashi sato

masashi sato

強化学習・方策勾配法の基本から理解するChatGPT・GPT-4の学習の仕組み に参加を申し込みました!

MikihiroHashimoto

MikihiroHashimoto

強化学習・方策勾配法の基本から理解するChatGPT・GPT-4の学習の仕組み に参加を申し込みました!

wada

wada

強化学習・方策勾配法の基本から理解するChatGPT・GPT-4の学習の仕組み に参加を申し込みました!

KeiichiOkubo

KeiichiOkubo

強化学習・方策勾配法の基本から理解するChatGPT・GPT-4の学習の仕組み に参加を申し込みました!

Attendees (4)