Doorkeeper

【8月21日(日)午前の部 ゼロからのデータサイエンスの講習会】

2016-08-21(日)09:30 - 12:30 JST

ソレイユ新宿

新宿区百人町1-18-8太陽堂ビル7階

申し込む

申し込み受付は終了しました

今後イベント情報を受け取る

3,000円 会場払い

詳細

【8月21日(日)午前の部 ゼロからのデータサイエンスの講習会】
【概要】(午前の部)
1、データ解析の流れは、集計→可視化→解析→解析結果の可視化、となりますが、そもそもどういうデータを集めたらよいのか?何を目標に立てたらよいのか?どういうモデルを立てて検証したらよいのか、データ解析のフレームワークを知っておかないとビジネスも研究も、データ解析の全体を設計できません。まず代表的なフレームワークを小売店の例をとり解説します。
2、多変量解析や機械学習がもてはやされていますが、実は可視化の方が、より重要であることが多いです。データから取り出せる知識が、単にデータを可視化しただけの方が多いということは非常によくあることです。どういうデータに対してどういう可視化が適しているのか、それについてまとめた本が、日本語でも英語でもなく、いまだに体系だったものが存在していないことが、本講義資料を作ることになったきっかけです。
3、統計というと聞きなれた言葉のように思いますが、どの程度機械学習とかぶっているかご存知の方は少ないと思います。統計は、t検定→分散解析→回帰分析(線形モデル)→一般化線形モデル→一般化線形混合モデル、というふうに発展し、一般化線形モデルは、例えばPythonの機械学習ライブラリscikitlearnで大きなウェイトを占めます(http://scikit-learn.org/stable/modules/linear_model.html)。実は機械学習の前に統計をしっかりやることは避けて通れないことなのです(多くの人は避けてますが、単純にできることが減ってしまうのでもったいないです。)。

【経緯】
今まで、合計3つの講義を行ってきました。
1、 ゼロからのデータサイエンス講習会、2、教師有・無しの機械学習と時系列データ解析講習会、3、データサイエンス講習会Part3
これらを大きく二つに分け、一日で網羅できるようにしてみました。
【目的】
午前の部
・データ解析の概要をつかむ。
・データの可視化を行えるようにしてもらう。
・統計のビックピクチャーを理解してもらう。
(午後の部)
(・多変量解析と機械学習の理論を理解する。)
(・教師有・無しの機械学習を大まかに理解・実行できるようにする。)
(・時系列データ解析の全体像をつかんでもらう。)
(・Pythonでのデータ解析の雰囲気をつかんでもらう。)

【日時】午前の部2016年8月21日(日)9:30 - 12:30

【会場】ソレイユ新宿
東京都新宿区百人町1-18-10 太陽堂ビル7F
http://ameblo.jp/soleil-sinjuku/

以下イベント詳細となります。
【タイムライン】
【午前の部】
09:15 開場
09:30-09:35 各参加者の自己紹介と知りたい分野の口頭発表(一言)
09:35-10:05 データ解析のフレームワーク紹介(実際のビジネスや研究への落とし方など)
10:05-10:10 質疑応答
10:10-10:20 休憩
10:20-11:20 Rプログラミングとデータの可視化
11:25-12:25 統計入門(分散、t検定、分散分析、線形モデル、一般化線形モデル)
12:25-12:30 質疑応答
12:30-12:45 お昼休憩
【午後の部】
(12:45-13:45 機械学習各種手w法概説と教師有機械学習(分類と回帰各3種)と教師なし機械学習の実践)
(13:45-13:50 質疑応答)
(13:50-14:00 休憩)
(14:00-14:40 時系列データ解析入門)
(14:40-14:45 質疑応答)
(14:45-14:55 休憩)
(14:55-15:25 scikitlearn入門)

(15:25-15:30質疑応答)
(15:30- 撤収)
※あくまでこのタイムラインは目安です。
※初めに各参加者の興味分野と今回参加したモチベーションを一人ひとりお聞きします。その内容によって各話題のボリュームや量を調整しようと思います。

【注意点】
・一応、前回参加なさられなかった方にもわかるような講義にしていますが、前回で話した内容については基本的に深く扱いません。
【対象者層】
・RやPythonの細かい文法は今回はやらないため、基本的なプログラミングスキルがあり、できたら、RやPythonの文法基礎までできる方。

【Rとは?】
 オープンソースで無償である高機能な統計ソフト。世界中のRユーザが開発したRプログラム(パッケージ)がCRAN(The Comprehensive R Archive Network)というネットワークにより提供されています。プログラミング初心者でも扱いやすく、Referenceが充実しています。Excelと比べデータ可視化のツールのレパートリーが圧倒的に豊富です。R言語によりプログラムを記述します。

【参加方法】
Doorkeeperでご登録ください。
【定員】
12名
【参加費】
学生 無料
社会人3000円(この値段は午前参加分で、午後も参加する場合、追加で3000円かかります。)
(当日受付にてお支払ください。Doorkeeperの価格表示は社会人用です。学生の方は当日学生証を受付にてご提示くだされば無料です。)

【当日の持ち物・必要なPCのスペック・必要なソフトウェア】
※ご自身のノートPCを必ずお持ちください。
※ 午前のみ参加の方は、Anacondaは必要ありません。
【Windowsの方】
Windows 7以上を推奨 (Xquartzのダウンロードは不要。Rだけダウンロードインストールお願いします)
Rを事前にダウンロードしてきてください(RStudioではありません)。
https://cran.r-project.org/
のDownload R 3.3.1 for Windows (62 megabytes, 32/64 bit)をクリックして、インストールを進めてください。(Download R for Windowsをクリック、baseの文章内のinstall R for the first timeをクリック、Download R 3.3.1 for Windows (70 megabytes, 32/64 bit)をクリックしてダウンロードののち、インストールを行ってください。
・Scikitlearnの開発環境設定
https://www.continuum.io/downloads
から、PYTHON3.5 WINDOWS 64-BIT GRAPHICAL INSTALLER をクリックしてダウンロード・インストールする。(お使いのPCによっては32bitを選択。わからなければ当日聞いてください。)
【Macの方】
Mac OSX(10.6以上推奨)
Rを事前にダウンロードしてきてください(RStudioではありません)。
https://cran.r-project.org/
Download R for (Mac) OS Xをクリック、R-3.3.1.pkgをクリックするとダウンロードできます。そののちにインストールしてください。
XQuartz(Macのみ)が入っていない方いましたら、ダウンロードを事前に行ってください。
https://www.xquartz.org/
ダウンロード後、ユーティリティの中にあるx11をダブルクリックしてからRをで、コードをご使用ください。
※XQuartzが入ってない場合、講習会の一部でコードが実行できないことがあることをご了承ください(講習会のごく一部で、GGallyパッケージとrglパッケージです)。
※Windows環境とMac環境両方お持ちの場合は、Windowsを推奨します。
・Scikitlearnの開発環境設定
https://www.continuum.io/downloads
から、(PYTHON3.5 for OS X ) MAC OS X 64-BIT GRAPHICAL INSTALLER をクリックしてダウンロード・インストールする。
(※当日のパソコン貸し出しは行いません。もし動作がうまくいかない場合、講義を聞くだけになります。その旨ご了承いただける方のみご参加ください。RはOSだけでなく各マシンの種類・設定によっても一部動作しない場合がありますが、それをご理解いただける方のみご参加ください)
【Linuxの方】
https://cran.r-project.org/
から、Download R for Linuxをクリック、その後、各々の環境に沿ってダウンロードインストールを行ってください。
・Scikitlearnの開発環境設定
https://www.continuum.io/downloads
から、PYTHON3.5 LINUX 64-BIT をクリックしてダウンロード・インストールする。(お使いのPCによっては32bitを選択)
・無線LAN搭載
・HDD空き容量4GB以上
・メモリ3GB以上(メモリ2GB以下だとロードできないパッケージがいくつかあります。)

【開発環境設定】
当日の運営を円滑に行うため、環境設定はできるだけご自身で事前に行ってください。
※RとRパッケージのダウンロード・インストールで生じたマシンのすべての不具合に関して運営側は責任を負いかねます。

【お願い】
当日、一部でネット環境を必要とします。会場のWi-Fi回線は混みあうことが予想されますので,お持ちの方はモバイルルーターなどをご持参ください(こちらでも用意しています)。
【講師紹介】
・ 鈴木瑞人(東京大学大学院新領域創成科学研究科 メディカル情報生命専攻 博士課程1年)
2014年3月東京大学理学部生物学科卒業
2016年3月東京大学大学院新領域創成科学研究科 メディカル情報生命専攻 修士課程卒業
【お問い合わせ先】
machine.learning.r@gmail.com
【主催】
東京大学機械学習勉強会

コミュニティについて

実践的機械学習勉強会

実践的機械学習勉強会

データサイエンス・機械学習を実際に自分の手で使えるようにする会です。 概要を説明するよりも、実際に自分の手を動かして学んでいく会が中心です。 学生・ポスドクは基本的に無料で参加できるのでぜひご参加ください。 東大大学院 新領域の大学院を卒業した人が運営してします。 今後扱っていくテーマは、 自然言語解析(日本語)、画像解析(CNNベースのもの)、グラフニューラルネット、機械学習のアプリ実装で...

メンバーになる