Doorkeeper

強化学習講習会

2018-03-17(土)09:15 - 13:00 JST

レアルセミナールーム

東京都新宿区西新宿1-3-13 Zenken PlazaⅡ 7F

詳細

【ゼロからアルファ碁ゼロまで学ぶ、強化学習講習会】

【概要】
強化学習は、実世界の知的な振る舞いを説明するものとして古くから研究され、計算科学やロボティクスにとどまらず認知脳科学、経済学など幅広い分野からも注目を集めています。近年、深層学習と融合し、爆発的な進歩を遂げたことで自動運転や広告戦略などのビジネス転用も考えられる中、実際はキャッチアップが難しいのが現状です。インターネット上には、強化学習を勉強するためのコンテンツとしてたとえば、
Richard S. SuttonとAndrew G. Bartoによる強化学習のバイブル ”Reinforcement Learning”
http://incompleteideas.net/book/bookdraft2018jan1.pdf
UC BerkeleyのSergey Levineの授業CS 294 “Deep Reinforcement Learning”
http://rll.berkeley.edu/deeprlcourse/
UC Berkeleyの研究者を中心にして2017年夏に開催されたBootCamp
https://sites.google.com/view/deep-rl-bootcamp/lectures
がありますが、これらを初心者が理解するのは困難です。そこで、今回、これらの書籍・授業のエッセンスを抽出し、素人向けにかみ砕いた講座を作りました。

【事前知識】
・高校数学を理解していること
・大学1,2年レベルの線形代数、微分積分を理解していること

【この講習会を受けると理解できること】
・強化学習の全体像
・強化学習に関しての最新情報
・これから強化学習を学習するためのとっかかり
・強化学習が今できること
・強化学習の今後の展望

【タイムライン】
09:05    開場
09:15- 09:20 企画紹介・参加者自己紹介
09:20- 09:30 強化学習イントロ
09:30- 09:50 価値関数ベースの手法
09:50- 10:00 休憩
10:00- 10:20 方策関数ベースの手法
10:20- 10:40 Actor-Critic法
10:40- 10:50 休憩
10:50- 11:10 探索と活用のジレンマ
11:10- 11:20 モデルベース強化学習
11:20- 11:40 逆強化学習
11:40- 11:50 休憩
11:50- 12:10 転移学習とマルチタスク学習
12:10- 12:30 メタ学習と模倣学習
12:30- 12:40 アルファ碁Zeroの構成要素と仕組み
12:40- 12:50 強化学習と他分野のつながり
12:50- 13:00 質疑応答
13:00- 解散
-13:30 完全撤収
※内容は告知なしに多少変更することがあります。ご了承ください。

【参加費】
学生:無料(受付にて学生証をお見せください)
社会人:4000円(できるだけおつりのないようにお願いします)

【会場】
新宿駅徒歩2分 レアルセミナールーム
〒160-0023 東京都新宿区西新宿1-3-13 Zenken PlazaⅡ 7F
レアルコンサルティング(株) オフィスと併設
http://www.realconsulting.jp/room/s01/access/

【日時】
2018年3月17日(土)09:15-13:00

【講師】
荻島諒也
東京大学工学部機械情報工学科 4年(4月から同修士課程)
2016年に交換留学生としてMITにて機械学習を学んだ後、現在東大ISI Lab所属

【ファシリテーター】
鈴木瑞人
東京大学大学院新領域創成科学研究科 メディカル情報生命専攻 博士課程
実践的機械学習勉強会 代表

【お問合せ先】
machine.learning.r@gmail.com

【主催】
実践的機械学習勉強会
NPO法人Bizjapanテクノロジー部門BizX

コミュニティについて

実践的機械学習勉強会

実践的機械学習勉強会

データサイエンス・機械学習を実際に自分の手で使えるようにする会です。 概要を説明するよりも、実際に自分の手を動かして学んでいく会が中心です。 学生・ポスドクは基本的に無料で参加できるのでぜひご参加ください。 東大大学院 新領域の大学院を卒業した人が運営してします。 今後扱っていくテーマは、 自然言語解析(日本語)、画像解析(CNNベースのもの)、グラフニューラルネット、機械学習のアプリ実装で...

メンバーになる