Doorkeeper

4月24日(日)実践的データサイエンス講習会(初心者向け) !

2016-04-24(日)14:30 - 17:30 JST

ソレイユ新宿

新宿区百人町1-18-8太陽堂ビル7階

申し込む

申し込み受付は終了しました

今後イベント情報を受け取る

2,000円 会場払い

詳細

【4月24日(日)実践的データサイエンス講習会(初心者向け) !】
東大の院生をはじめとしたメンバーが、東大内部で初心者・異分野の学生向けに開いていたデータサイエンスの講座を一般向けに作り直したものを今回公開します。

一日前のイベント公開となってしまいすでにご予定のある方には大変申し訳ありません。

データの可視化・多変量解析・機械学習は、研究・ビジネスで広く応用できますが、それを基礎から応用まで教えられる人・教えるための教材を作成した人は多くありません。

本講義はもともと、現在東大大学院博士課程1年の鈴木瑞人が自らのバイオ系研究で機械学習を使おうとして、機械学習を使える人を東大内で探した結果、そもそも教えるノウハウ持っている人があまりおらず、これは自分で勉強するしかないなということで、自分で6か月ゼロから学んだ事をまとめたのが本講義内容となります。R言語を用いますが、プログラミング初心者でもついてこれるような内容となっています。

基本的に、データの可視化・多変量解析・機械学習の関数は、1行書けば実行できてすごくコスパが良いです。

・機械学習って聞いたことあるけどどう勉強していいのかわからない
・書店で機械学習関連の本たくさん買ってたくさん勉強したけど結局できるようにならなかった
・仕組みを詳しく知るよりどういうデータからどんな情報が取り出せるか知りたい方、ぜひご参加ください!

今回の講習会の内容は、大まかに、データサイエンス概略、多変量解析・機械学習概略、データ解析を行うためのツール比較(Excel、R、Python) 、R言語入門、基本的な統計知識、Rを用いたデータの可視化・データの層別化、実際のデータを用いた可視化演習、多変量解析と機械学習の使い方解説を行います。

【Rとは?】
 オープンソースで無償である高機能な統計ソフト。世界中のRユーザが開発したRプログラム(パッケージ)がCRAN(The Comprehensive R Archive Network)というネットワークにより提供されています。プログラミング初心者でも扱いやすく、Referenceが充実しています。Excelと比べデータ可視化のツールのレパートリーが圧倒的に豊富です。R言語によりプログラムを記述します。

【内容・タイムライン】
14:20- 開場
14:40-14:50 データサイエンス概要(10分)
14:50-15:00 多変量解析・機械学習概要(10分)
15:00-15:05 データサイエンスの学習方法(5分)
15:05-15:35 Rプログラミング入門(30分)
15:35-15:55 データの可視化入門(20分)
15:55-16:00 質疑応答
16:00-16:10 休憩
16:10-16:30 データの層別化(20分)
16:30-16:40 全変数の可視化(10分)
16:40-16:50 重回帰分析(10分)
16:50-17:00 クラスター解析(10分)
17:00-17:10 分類木(10分)
17:10-17:20 実際のデータ解析の流れ解説(10分)
17:20-17:30 質疑応答
-17:30 解散
-18:00 完全撤収

【対象層】
・Rでのデータ解析の初歩を学びたい方
・機械学習に興味はあるがどこから勉強を始めてよいかわからない方
・データサイエンスのビックピクチャーを知りたい方
・プログラミングを初めて学びたい方
・データの可視化や機械学習に興味ある方
・実際に自分の手で一通りデータ解析ができるようになりたい方

【会場】
ソレイユ新宿
電車:JR総武線大久保駅北口徒歩1分、JR山手線新大久保駅徒歩4分
住所:新宿区百人町1-18-8太陽堂ビル7階
http://ameblo.jp/soleil-sinjuku/entry-11572338555.html

【参加方法】
Doorkeeperでご登録ください。
https://0f1304e65103e294f80c0307ba.doorkeeper.jp/events/43844

【参加費】
学生 1000円
社会人2000円
(当日受付にてお支払ください。Doorkeeperの価格表示は社会人用です。学生の方は当日学生証を受付にてご提示ください。)

【当日の持ち物・必要なPCのスペック・必要なソフトウェア】

ご自身のノートPCを必ずお持ちください。
・OSについて
Windows 10
Mac OSX以降
以上の環境では動作を確認しております。
Windowsを推奨します。Macですと、いくつか実行できないコマンドがあります。
それ以外の環境では、動作しない恐れがあります。ご了承ください。
・ソフトウェアについて
R(ver3.2.5)※Rは事前にダウンロードしてきてください。
Windows
https://cran.r-project.org/bin/windows/base/
のDownload R 3.2.5 for Windows (62 megabytes, 32/64 bit)をクリックして、インストールを進めてください。
Mac
https://cran.r-project.org/bin/macosx/
のR-3.2.5.pkgをダウンロードしてください。
(※当日のパソコン貸し出しは行いません。もし動作がうまくいかない場合、講義を聞くだけになります。その旨ご了承いただける方のみご参加ください。WindowsとMac環境どちらもお持ちの方には、Windows環境を推奨しています。)
無線LAN搭載
HDD空き容量1GB以上

【開発環境設定】
前回のアンケート結果を踏まえ、当日の運営を円滑に行うため、環境設定はできるだけご自身で事前に行ってください。
※RとRパッケージのダウンロード・インストールで生じたマシンのすべての不具合に関しては運営は責任を負いかねます。

【お願い】
当日、一部でネット環境を必要とします。会場のWi-Fi回線は混みあうことが予想されますので,お持ちの方はモバイルルーターなどをご持参ください(こちらでも用意していますが足りなくなる可能性があります)。

【講師紹介】
・ 鈴木瑞人(東京大学大学院新領域創成科学研究科 メディカル情報生命専攻 博士課程1年)
2014年3月東京大学理学部生物学科卒業
2016年3月東京大学大学院新領域創成科学研究科 メディカル情報生命専攻 修士課程卒業
専門は、生物学・脳科学・ゲノム科学であり、修論はDNAシーケンサーMinIONを用いた、ゲノム情報解析。スパコンを用いて解析を行った。

【お問い合わせ先】
machine.learning.r@gmail.com
08054574608

【主催】
東京大学機械学習勉強会

コミュニティについて

実践的機械学習勉強会

実践的機械学習勉強会

データサイエンス・機械学習を実際に自分の手で使えるようにする会です。 概要を説明するよりも、実際に自分の手を動かして学んでいく会が中心です。 学生・ポスドクは基本的に無料で参加できるのでぜひご参加ください。 東大大学院 新領域の大学院を卒業した人が運営してします。 今後扱っていくテーマは、 自然言語解析(日本語)、画像解析(CNNベースのもの)、グラフニューラルネット、機械学習のアプリ実装で...

メンバーになる