Doorkeeper

【5月15日(日)朝9時~ ゼロから始めるデータサイエンス講習会】

2016-05-15(日)09:00 - 15:00 JST

ABEJA.Inc

〒105-0001 東京都港区虎ノ門4-1-20 田中山ビル10階

詳細

【5月15日(日)朝9時~ ゼロから始めるデータサイエンス講習会】
東大の院生をはじめとしたメンバーが、東大内部で初心者・異分野の学生向けに開いていたデータサイエンスの講座を一般向けに作り直したものを公開します。
【内容】
今回の講習会の内容は、大まかに、データサイエンス概略、多変量解析・機械学習概略、データ解析を行うためのツール比較(Excel、R、Python) 、R言語入門、多変量解析・機械学習の実行に最低限必要な統計知識、Rを用いたデータの可視化基礎、データの層別化、全変数での同時可視化、Rでの多変量解析実行、機械学習関数実行の解説を行います。

【目的】
学生向け:Rを使えるようになり、データの可視化、多変量解析・機械学習の概念を理解してもらい、自分でそれらのデータ解析ができるようになってもらい、論文の深い理解、データ解析まで考えた実験計画の作成をできるようになってもらう。
社会人向け:Rを使えるようになり、データの可視化、多変量解析・機械学習の概念を理解してもらい、自分でそれらのデータ解析ができるようになってもらい、ご自分がお持ちのデータ解析をできるようになる。データ解析を考えたうえでのビジネス案構築に結びつけていただけるようになっていただく。できたら社会に役立つビジネスに結び付けていただく。
【日時】2016年5月14日(土)13-18時
【会場】
講習会の場所は、国内のAI系ベンチャー2強(個人的主観ですが)のうちの一つ、ABEJA.Inc様の虎の門のオフィスです!http://www.abeja.asia/
※今回ABEJAさんのオフィスを提供していただけることになったのは、非常に光栄でして、最高の講義を提供したいと思っています。
【実績】
既に、一般の方々への3回のレクチャーと、1回の企業様向けレクチャーを経て内容も進行も少しずつ洗練され、当初3時間のレクチャーも5時間になりました。受講者の満足度は78%が最高の満足度(5段階評価で5)、22%がやや満足(5段階評価で4)という評価をいただいています。

講義の内容は、Rによるデータの可視化・多変量解析・機械学習です。

以下イベント詳細となります。

【タイムライン】
9:00 ~ 開場
9:30-10:30 データサイエンス・多変量解析・機械学習概要
10:30-10:40 質疑応答
10:40-10:50 休憩
10:50-11:20 多変量解析・機械学習の各種手法紹介
11:20-11:30 質疑応答
11:30-11:50 Rプログラミング基礎
11:50-12:00 質疑応答
12:00-12:20 昼休み(※お昼休みが短いのであらかじめ何か買ってきてください。ごみはお持ち帰りください。)
12:20-13:20 Rを用いたデータの可視化(低級可視化関数、全変数の可視化、層別化)
13:30-13:40 質疑応答
13:40-13:50 休憩
13:50-14:50 Rによる多変量解析・機械学習の実践
14:50-15:00 質疑応答
15:00- 解散

【内容詳細】
今回の講習会の内容は、大まかに、データサイエンス概略、多変量解析・機械学習概略、データ解析を行うためのツール比較(Excel、R、Python) 、R言語入門、多変量解析・機械学習の実行に最低限必要な統計知識、Rを用いたデータの可視化基礎、データの層別化、全変数での同時可視化、Rでの多変量解析実行、機械学習関数実行の解説を行います。

【本レクチャーコースの特徴】
データの可視化のうち、層別化と、全変数の可視化を体系立ててしっかり教えられる人・書籍は現状かなり少なく、その部分の資料作成にかなりの時間を割いたので、特にデータの可視化に特徴があるコースです。

【対象者層】
・研究・ビジネスでデータ解析・機械学習を使いたい方。
・書店で機械学習関連の本たくさん買ってたくさん勉強したけど結局できるようにならなかった方。
・仕組みを詳しく知るより、とりあえずデータ解析・機械学習ができるようになりたい方。
・どういうデータからどんな情報が取り出せるか知りたい方。
・Rでのデータ解析の初歩を学びたい方
・機械学習に興味はあるがどこから勉強を始めてよいかわからない方
・データサイエンスのビックピクチャーを知りたい方
・プログラミングを初めて学びたい方
・データの可視化や機械学習に興味ある方
・実際に自分の手で一通りデータ解析ができるようになりたい方

【Rとは?】
 オープンソースで無償である高機能な統計ソフト。世界中のRユーザが開発したRプログラム(パッケージ)がCRAN(The Comprehensive R Archive Network)というネットワークにより提供されています。プログラミング初心者でも扱いやすく、Referenceが充実しています。Excelと比べデータ可視化のツールのレパートリーが圧倒的に豊富です。R言語によりプログラムを記述します。

【会場】ABEJA.Inc様オフィス
〒105-0001 東京都港区虎ノ門4-1-20 田中山ビル10階
アクセス:日比谷線神谷町駅より徒歩7分
    南北線六本木1丁目駅より徒歩10分
【参加方法】
Doorkeeperでご登録ください。
【定員】
20名
【参加費】
学生 無料
社会人3000円
(当日受付にてお支払ください。Doorkeeperの価格表示は社会人用です。学生の方は当日学生証を受付にてご提示くだされば無料です。)

【当日の持ち物・必要なPCのスペック・必要なソフトウェア】
ご自身のノートPCを必ずお持ちください。
・OSについて
Windows 10推奨
Mac OSX(10.6以上推奨)
もしWindows環境とMac環境両方お持ちの場合は、Windowsを推奨します。Macですと、いくつか実行できないコマンドがあります。
それ以外の環境では、動作しない恐れがあります。ご了承ください。
・ソフトウェアについて
R(RStudioではない)※Rは事前にダウンロードしてきてください。
Windows
https://cran.r-project.org/bin/windows/base/
のDownload R 3.3.0 for Windows (62 megabytes, 32/64 bit)をクリックして、インストールを進めてください。
Mac
https://cran.r-project.org/
のR-3.3.0.pkgをダウンロード・インストールしてください。
(※当日のパソコン貸し出しは行いません。もし動作がうまくいかない場合、講義を聞くだけになります。その旨ご了承いただける方のみご参加ください。RはOSだけでなく各マシンの種類・設定によっても一部動作しない場合がありますが、それをご理解いただける方のみご参加ください)
無線LAN搭載
HDD空き容量1GB以上

【開発環境設定】
当日の運営を円滑に行うため、環境設定はできるだけご自身で事前に行ってください。
※RとRパッケージのダウンロード・インストールで生じたマシンのすべての不具合に関しては運営側は責任を負いかねます。

【お願い】
当日、一部でネット環境を必要とします。会場のWi-Fi回線は混みあうことが予想されますので,お持ちの方はモバイルルーターなどをご持参ください(こちらでも用意しています)。

【参加者が感じた講義の難易度】
・やや難33%
・普通33%
・やや易しい22%
・易しい12%
【参加者が感じたハンズオンの難易度】
・やや難11%
・普通33%
・やや易しい44%
・易しい12%
【講義の内容について参加者のご感想】
・5時間だけど濃かった。
・今後のためのよいインデックスとなった。
・入門としてはちょうど良かった。
・講義の評価を「やや難しい」としましたが、普通に考えると難解かつ広範囲な学習の成果をシンプルにまとめていただいていたので、実のところは全然難しい感じを受けなかったですし、それってすごいことなんだろうなと思いました。
・文系出身者でも一分野の奥深い世界にコミットできる一端に入り込める余地があった。
・とりあえずplotすることで多くのことが分かるかもしれないのがよく分かった。
・多変量解析が重要であることがよく分かった。
【ハンズオンの内容についてご感想】
・データの可視化方法に関して教えて頂き、デモデータをもとに進めるという流れで時間のロスも少なくて良かったです。これを自分の思い通りに使いこなせるようになると楽しくなるだろうと思いました。
・コピペでも対応できるようになっていたのは親切だと思った。
・実際に何度も手を動かすことでRに慣れることが出来た。
・スキルに個人差があるため、躓く人は多かったが、ある程度無視して進めたのが良かった。
・インストールしたRのシステムエラーこそあったものの、独学で学んでいた頃に比べて、「このようにシンプルに解析・グラフィクスができる」のを身を持って実感できた。
【講師紹介】
・ 鈴木瑞人(東京大学大学院新領域創成科学研究科 メディカル情報生命専攻 博士課程1年)
2014年3月東京大学理学部生物学科卒業
2016年3月東京大学大学院新領域創成科学研究科 メディカル情報生命専攻 修士課程卒業
【お問い合わせ先】
machine.learning.r@gmail.com
08054574608(当日のみ)
【会場ご提供】
ABEJA.Inc様
【主催】
東京大学機械学習勉強会

コミュニティについて

実践的機械学習勉強会

実践的機械学習勉強会

データサイエンス・機械学習を実際に自分の手で使えるようにする会です。 概要を説明するよりも、実際に自分の手を動かして学んでいく会が中心です。 学生・ポスドクは基本的に無料で参加できるのでぜひご参加ください。 東大大学院 新領域の大学院を卒業した人が運営してします。 今後扱っていくテーマは、 自然言語解析(日本語)、画像解析(CNNベースのもの)、グラフニューラルネット、機械学習のアプリ実装で...

メンバーになる