Doorkeeper

データサイエンス講習会Part3

Sun, 15 Oct 2017 14:15 - 17:15 JST

LabCafe

東京都文京区本郷4-1-3 明和本郷ビル7F

Description

【データサイエンス講習会Part3】
【内容】
・基礎統計(平均・分散・標準偏差・標準誤差)(10分)
・線形モデルと一般化線形モデル(ロジスティック回帰(使用言語R))(20分)
・Pythonでのデータサイエンス基礎(NumPy,Pandas)(20分)
・Pythonでの機械学習(Scikitlearn(二項分類(4手法)、多項分類、回帰(4手法)、各ハイパーパラメータチューニング)) (110分)

【目的】
・統計の基礎を知る。
・一般化線形モデル(ロジスティック回帰)の理解。
・NumPyやPandasの使い方を知る。
・scikitlearnを用いた機械学習(DecisionTree、Randomforest、SVM、KNN)。
・ハイパーパラメータチューニングの方法を知る。
・とりあえずPythonで機械学習の結果を出せるようにする。

【日時】2017年10月15日(土)14:15-17:15
【会場】
LabCafe
東京都文京区本郷4-1-3 明和本郷ビル7F
http://lab-cafe.net/page/access
(本郷交番向かいの、ラーメン屋さんが1Fに入っているビルです。)
東京メトロ 丸ノ内線「本郷三丁目」 徒歩3分
都営大江戸線「本郷三丁目」     徒歩3分

以下イベント詳細となります。

【タイムライン】
14:00- 開場
14:15-14:20 各参加者の自己紹介と知りたい分野の口頭発表(一言)
14:20-14:30 基礎統計(平均・分散・標準偏差・標準誤差)
14:30-14:45 一般化線形モデル(基本的に理論のお話でロジスティック回帰ではR言語で実装し説明)
14:45-15:15 NumPy, Pandas入門
15:15-15:25 休憩
15:25-16:25 Pythonでの二項分類4手法(DecisionTree、Randomforest、SVM、KNN)とHyperParameterTuning
16:25-16:35 休憩
16:35-16:55 Pythonでの回帰4手法(DecisionTree、Randomforest、SVM、KNN)とHyperParameterTuning、多項分類
16:55-17:05 学習器保存方法・scikitlearnライブラリの全体像の解説
17:05-17:15 質疑応答
17:15- 解散
※あくまでこのタイムラインは目安です。

【注意点】
基本的にPart1を受講なさられた方が対象です(受けていない方はドットインストールなどでRの基本文法を学んできてください。)
http://dotinstall.com/lessons/basic_r
基本的なRプログラミングの説明は飛ばしがちになります。
Pythonの基本文法についても今回は飛ばします。実はほぼ必要ないのですが不安な方はドットインストールなどで軽く見てきてください。
http://dotinstall.com/lessons/basic_python_v3

【参加方法】
Doorkeeperでご登録ください。

【参加費】
学生・ポスドク 無料(受付にて学生証・身分証をお見せください)
社会人3000円(お釣りのないようにお願いします。以前Part3の講義を受けた方は無料。お名前と受講日を受付にてお申し付けください。)

【当日の持ち物】
ご自身のノートPCを(必ず)お持ちください。

【必要なPCのスペック・必要なソフトウェア】

【Windowsの方】
Windows 7以上を推奨 (Xquartzのダウンロードは不要。Rだけダウンロードインストールお願いします)
1, Rを事前にダウンロードしてきてください(RStudioではありません)。
https://cran.r-project.org/
のDownload R 3.4.1 for Windows (62 megabytes, 32/64 bit)をクリックして、インストールを進めてください。(Download R for Windowsをクリック、baseの文章内のinstall R for the first timeをクリック、Download R 3.4.1 for Windows (70 megabytes, 32/64 bit)をクリックしてダウンロードののち、インストールを行ってください。
2, Anaconda をダウンロード・インストールお願いします。(Python 3.6 version 64bit)
https://www.continuum.io/downloads

【Macの方】
Mac OSX(10.6以上推奨)
1, Rを事前にダウンロードしてきてください(RStudioではありません)。
https://cran.r-project.org/
Download R for (Mac) OS Xをクリック、R-3.4.pkgをクリックするとダウンロードできます。そののちにインストールしてください。
XQuartz(Macのみ)が入っていない方いましたら、ダウンロードを事前に行ってください。
https://www.xquartz.org/
ダウンロード後、ユーティリティの中にあるx11をダブルクリックしてからRをで、コードをご使用ください。
※Windows環境とMac環境両方お持ちの場合は、Windowsを推奨します。
(※当日のパソコン貸し出しは行いません。もし動作がうまくいかない場合、講義を聞くだけになります。その旨ご了承いただける方のみご参加ください。RはOSだけでなく各マシンの種類・設定によっても一部動作しない場合がありますが、それをご理解いただける方のみご参加ください)
2,Pythonでの機械学習環境構築のために、Anacondaをダウンロード・インストールお願いします。 (Python 3.6 version 64bit(CommandLineがわからなければGraphical Installerで))
https://www.continuum.io/downloads

【Linuxの方】
1, https://cran.r-project.org/
から、Download R for Linuxをクリック、その後、各々の環境に沿ってダウンロードインストールを行ってください。
2, Pythonでの機械学習環境構築のために、Anacondaをダウンロード・インストールお願いします。 (Python 3.6 version 64bit)
https://www.continuum.io/downloads

【ハードウェア環境の推奨】
・無線LAN搭載
・HDD空き容量2GB以上
・メモリ4GB以上

【開発環境設定】
当日の運営を円滑に行うため、環境設定はできるだけご自身で事前に行ってください。
※RとRパッケージのダウンロード・インストールで生じたマシンのすべての不具合に関して運営側は責任を負いかねます。

※ご自身のノートPCを必ずお持ちください。
【お願い】
当日、一部でネット環境を必要とします。会場のWi-Fi回線は混みあうことが予想されますので,お持ちの方はモバイルルーターなどをご持参ください(こちらでも用意しています)。

【Part3参加者の感想】
・割と濃い内容がちょうど良いです。いつもありがとうございます。
・ベイズ統計勉強会と同じく、質の高い資料と、少し駆け足でしたがわかりやすい内容の講義でした。
・勉強会として充実している、他者の講義やセミナーはLT化しているのに比べ大変有意義である。
・短時間で基礎から実践までをカバーして下さり、大変素晴らしかったです。スライドやコードなどの下準備ができているからだと思います。いきなり応用から始められるとムリだと思って興味を失ってしまうと思うので、「平均」などからスタートして下さったのはありがたかったです。応用も幅広くカバーしてあり、今後役に立ちそうです。
・numpyとPandasでできることが分かりやすく網羅されていて、全体像が掴めた。できればがっつり統計・数学的な部分も学んでみたいと思った。
・内容が幅広く、テンポもよかった。資料もよくできている。

【講師紹介】
鈴木瑞人
2014年3月東京大学理学部生物学科卒業
2016年3月東京大学大学院新領域創成科学研究科 メディカル情報生命専攻 修士課程卒業
2016年4月東京大学大学院新領域創成科学研究科 メディカル情報生命専攻 博士課程入学

【お問い合わせ先】
machine.learning.r@gmail.com

【主催】
実践的機械学習勉強会

About this community

実践的機械学習勉強会

実践的機械学習勉強会

データサイエンス・機械学習を実際に自分の手で使えるようにする会です。 概要を説明するよりも、実際に自分の手を動かして学んでいく会が中心です。 学生・ポスドクは基本的に無料で参加できるのでぜひご参加ください。 東大大学院 新領域の大学院を卒業した人が運営してします。 今後扱っていくテーマは、 自然言語解析(日本語)、画像解析(CNNベースのもの)、グラフニューラルネット、機械学習のアプリ実装で...

Join community