【3月4日(土)13:30-16:30データサイエンスの講習会Part6@LabCafe】
【概要】
データハンドリング、大きなデータへの対応、欠損値への対応方法、外れ値検知(異常値検知)、不均衡データへの対応を扱いたいと思います。本講習会シリーズで最も実戦的な内容になります。Part1を受講しているか、Rの基本操作ができる方向けの講義になっています。
【タイムライン】
13:15- 開場
13:15-13:20 資料配布と各自自己紹介
13:20-14:20 データハンドリング系、大きなデータへの対応
14:20-14:30 休憩
14:30-15:00 Tidydataについて
15:00-15:30 欠損値への対応
15:30-15:40 休憩
15:40-16:00 外れ値検知
16:00-16:20 不均衡データへの対応
16:20-16:30 質疑応答
16:30- 解散
【会場】
LabCafe @本郷
東京都文京区本郷4-1-3 明和本郷ビル7F
(本郷交番向かいの、ラーメン屋「本郷家」さんが1Fに入っているビル。)
東京メトロ 丸ノ内線「本郷三丁目」 徒歩3分
都営大江戸線「本郷三丁目」 徒歩3分
http://lab-cafe.net/page/access
【日時】
2017年3月4日(土)13:30-16:30
【お申込み方法】
Doorkeeperよりお願いします。
【料金】
学生: 無料・ポスドク(受付で学生証・身分証をお見せください)
社会人3000円(お釣りのないようにご協力よろしくお願いします。以前Part6を受講なされた方は無料です。受付にてお名前と受講日をお申し付けください。)
【当日の持ち物・必要なPCのスペック・必要なソフトウェア】
※ご自身のノートPCを必ずお持ちください。
【Windowsの方】
Windows 7以上を推奨 (Xquartzのダウンロードは不要。Rだけダウンロードインストールお願いします)
Rを事前にダウンロードしてきてください(RStudioではありません)。
https://cran.r-project.org/
のDownload R 3.3.2 for Windows (62 megabytes, 32/64 bit)をクリックして、インストールを進めてください。(Download R for Windowsをクリック、baseの文章内のinstall R for the first timeをクリック、Download R 3.3.2 for Windows (70 megabytes, 32/64 bit)をクリックしてダウンロードののち、インストールを行ってください。
【Macの方】
Mac OSX(10.6以上推奨)
Rを事前にダウンロードしてきてください(RStudioではありません)。
https://cran.r-project.org/
Download R for (Mac) OS Xをクリック、R-3.3.2.pkgをクリックするとダウンロードできます。そののちにインストールしてください。
XQuartz(Macのみ)が入っていない方いましたら、ダウンロードを事前に行ってください。
https://www.xquartz.org/
ダウンロード後、ユーティリティの中にあるx11をダブルクリックしてからRをで、コードをご使用ください。
※Windows環境とMac環境両方お持ちの場合は、Windowsを推奨します。
(※当日のパソコン貸し出しは行いません。もし動作がうまくいかない場合、講義を聞くだけになります。その旨ご了承いただける方のみご参加ください。RはOSだけでなく各マシンの種類・設定によっても一部動作しない場合がありますが、それをご理解いただける方のみご参加ください)
【Linuxの方】
https://cran.r-project.org/
から、Download R for Linuxをクリック、その後、各々の環境に沿ってダウンロードインストールを行ってください。
・無線LAN搭載
・HDD空き容量2GB以上
・メモリ4GB以上
【開発環境設定】
当日の運営を円滑に行うため、環境設定はできるだけご自身で事前に行ってください。
※RとRパッケージのダウンロード・インストールで生じたマシンのすべての不具合に関して運営側は責任を負いかねます。
【今までの講習会の内容】
Part1: 機械学習入門とデータ可視化
Part2: 機械学習の実践と時系列データ解析入門
Part3: 統計、状態空間モデル、一般化線形モデル、Pythonでの機械学習入門
Part4: Rのデータセットを用いた、データ可視化と解析演習
Part5: Caretパッケージ紹介、パラメータチューニング、XgboostでのKaggle参加
Part6: データハンドリング、欠損値への対応方法、外れ値検出、不均衡データへの対応、
【お問い合わせ】
machine.learning.r@gmail.com
【講師紹介】
鈴木瑞人(東京大学大学院新領域創成科学研究科 メディカル情報生命専攻 博士課程1年)
2014年3月東京大学理学部生物学科卒業
2016年3月東京大学大学院新領域創成科学研究科 メディカル情報生命専攻 修士課程卒業
【主催】
東京大学機械学習勉強会
http://www.machine-learning-r.com/
データサイエンス・機械学習を実際に自分の手で使えるようにする会です。 概要を説明するよりも、実際に自分の手を動かして学んでいく会が中心です。 学生・ポスドクは基本的に無料で参加できるのでぜひご参加ください。 東大大学院 新領域の大学院を卒業した人が運営してします。 今後扱っていくテーマは、 自然言語解析(日本語)、画像解析(CNNベースのもの)、グラフニューラルネット、機械学習のアプリ実装で...
メンバーになる