強化学習講習会

2018-03-17(土)09:15 - 13:00

レアルセミナールーム

東京都新宿区西新宿1-3-13 Zenken PlazaⅡ 7F

山内浩平 三根徳城 戸田 功貴 Ogawa Tetsuo kawa Soma Utsumi 清野 佑介 星 良 木村亘 太田博三 Masato Fujii 山田 + 28人の参加者
申し込む

申し込み受付は終了しました

今後イベント情報を受け取る

4,000円 会場払い

【ゼロからアルファ碁ゼロまで学ぶ、強化学習講習会】

【概要】
強化学習は、実世界の知的な振る舞いを説明するものとして古くから研究され、計算科学やロボティクスにとどまらず認知脳科学、経済学など幅広い分野からも注目を集めています。近年、深層学習と融合し、爆発的な進歩を遂げたことで自動運転や広告戦略などのビジネス転用も考えられる中、実際はキャッチアップが難しいのが現状です。インターネット上には、強化学習を勉強するためのコンテンツとしてたとえば、
Richard S. SuttonとAndrew G. Bartoによる強化学習のバイブル ”Reinforcement Learning”
http://incompleteideas.net/book/bookdraft2018jan1.pdf
UC BerkeleyのSergey Levineの授業CS 294 “Deep Reinforcement Learning”
http://rll.berkeley.edu/deeprlcourse/
UC Berkeleyの研究者を中心にして2017年夏に開催されたBootCamp
https://sites.google.com/view/deep-rl-bootcamp/lectures
がありますが、これらを初心者が理解するのは困難です。そこで、今回、これらの書籍・授業のエッセンスを抽出し、素人向けにかみ砕いた講座を作りました。

【事前知識】
・高校数学を理解していること
・大学1,2年レベルの線形代数、微分積分を理解していること

【この講習会を受けると理解できること】
・強化学習の全体像
・強化学習に関しての最新情報
・これから強化学習を学習するためのとっかかり
・強化学習が今できること
・強化学習の今後の展望

【タイムライン】
09:05    開場
09:15- 09:20 企画紹介・参加者自己紹介
09:20- 09:30 強化学習イントロ
09:30- 09:50 価値関数ベースの手法
09:50- 10:00 休憩
10:00- 10:20 方策関数ベースの手法
10:20- 10:40 Actor-Critic法
10:40- 10:50 休憩
10:50- 11:10 探索と活用のジレンマ
11:10- 11:20 モデルベース強化学習
11:20- 11:40 逆強化学習
11:40- 11:50 休憩
11:50- 12:10 転移学習とマルチタスク学習
12:10- 12:30 メタ学習と模倣学習
12:30- 12:40 アルファ碁Zeroの構成要素と仕組み
12:40- 12:50 強化学習と他分野のつながり
12:50- 13:00 質疑応答
13:00- 解散
-13:30 完全撤収
※内容は告知なしに多少変更することがあります。ご了承ください。

【参加費】
学生:無料(受付にて学生証をお見せください)
社会人:4000円(できるだけおつりのないようにお願いします)

【会場】
新宿駅徒歩2分 レアルセミナールーム
〒160-0023 東京都新宿区西新宿1-3-13 Zenken PlazaⅡ 7F
レアルコンサルティング(株) オフィスと併設
http://www.realconsulting.jp/room/s01/access/

【日時】
2018年3月17日(土)09:15-13:00

【講師】
荻島諒也
東京大学工学部機械情報工学科 4年(4月から同修士課程)
2016年に交換留学生としてMITにて機械学習を学んだ後、現在東大ISI Lab所属

【ファシリテーター】
鈴木瑞人
東京大学大学院新領域創成科学研究科 メディカル情報生命専攻 博士課程
実践的機械学習勉強会 代表

【お問合せ先】
machine.learning.r@gmail.com

【主催】
実践的機械学習勉強会
NPO法人Bizjapanテクノロジー部門BizX

レアルセミナールーム
東京都新宿区西新宿1-3-13 Zenken PlazaⅡ 7F
Google マップで見る
コミュニティについて
実践的機械学習勉強会

実践的機械学習勉強会

データサイエンス・機械学習を実際に自分の手で使えるようにする会です。 コミュニティの目的は、統計・データサイエンス・機械学習を東大・慶応・早稲田などの学生や研究者に広く普及させることで、研究レベルの底上げを図ることと、一般の社会人に統計・データサイエンス・機械学習を普及させることで、日本のビジネスのレベルを高めることです。 学生・ポスドクは基本的に無料で参加できるのでぜひご参加ください。 東...

メンバーになる