Doorkeeper

【12月11日(日)午後の部13-16時 データ解析講習会Part2@本郷】

2016-12-11(日)13:00 - 16:00 JST

LabCafe

東京都文京区本郷4-1-3 明和本郷ビル7F

詳細

【12月11日(日)午後の部13-16時 データ解析講習会Part2@本郷】

【内容】
1, データ解析のフレームワークの紹介とそれに基づいた、データ解析への課題の落とし込み方
2, 教師有機械学習と教師無し機械学習の実践
3, 時系列データ解析
4, データ可視化を含めたデータ解析の手順

【目的】
・Rで、教師有と無しの機械学習を一通り、実行できるようになる。
・時系列解析の概念を理解する。
・実際の課題をどのように機械学習または、時系列データ解析まで落とし込むか理解する。

【日時】2016年12月11日(日)13:00-16:00

【会場】LabCafe
東京都文京区本郷4-1-3 明和本郷ビル7F
http://lab-cafe.net/page/access
(本郷交番向かいの、ラーメン屋さんが1Fに入っているビルです。)
東京メトロ 丸ノ内線「本郷三丁目」 徒歩3分
都営大江戸線「本郷三丁目」     徒歩3分

以下イベント詳細となります。

【タイムライン】
12:45- 開場
13:00-13:05 各参加者の自己紹介と知りたい分野の口頭発表(一言)
13:05-13:30 データ解析のフレームワーク紹介
13:30-14:00 機械学習概説・Part1補足・始めてきた方向け重回帰分析説明
14:00-14:10 休憩
14:10-14:40 解析の流れ(回帰・分類・クラスタリング・次元削減・可視化)
14:40-15:00 Rでの時系列データ解析入門1
15:00-15:10 休憩
15:10-15:50 Rでの時系列データ解析入門2
15:50-16:00 質疑応答
16:00- 解散
※あくまでこのタイムラインは目安です。
※初めに各参加者の興味分野と今回参加したモチベーションを一人ひとりお聞きします。その内容によって各話題のボリュームや量を調整しようと思います。

【注意点】
・基本的にPart1を受講なさられた方が対象です。基本的なRプログラミングの説明は飛ばしがちにます。あと可視化についても同様です。

【Rとは?】
 オープンソースで無償である高機能な統計ソフト。世界中のRユーザが開発したRプログラム(パッケージ)がCRAN(The Comprehensive R Archive Network)というネットワークにより提供されています。プログラミング初心者でも扱いやすく、Referenceが充実しています。Excelと比べデータ可視化のツールのレパートリーが圧倒的に豊富です。R言語によりプログラムを記述します。

【参加方法】
Doorkeeperでご登録ください。
【定員】
12名

【参加費】
学生 無料(受付にて学生証をお見せください)
社会人3000円(お釣りのないようにお願いします。以前Part2の講義を受けた方は無料。お名前と受講日を受付にてお申し付けください。)

【当日の持ち物・必要なPCのスペック・必要なソフトウェア】
※ご自身のノートPCを必ずお持ちください。

【Windowsの方】
Windows 7以上を推奨 (Xquartzのダウンロードは不要。Rだけダウンロードインストールお願いします)
Rを事前にダウンロードしてきてください(RStudioではありません)。
https://cran.r-project.org/
のDownload R 3.3.2 for Windows (62 megabytes, 32/64 bit)をクリックして、インストールを進めてください。(Download R for Windowsをクリック、baseの文章内のinstall R for the first timeをクリック、Download R 3.3.2 for Windows (70 megabytes, 32/64 bit)をクリックしてダウンロードののち、インストールを行ってください。

【Macの方】
Mac OSX(10.6以上推奨)
Rを事前にダウンロードしてきてください(RStudioではありません)。
https://cran.r-project.org/
Download R for (Mac) OS Xをクリック、R-3.3.2.pkgをクリックするとダウンロードできます。そののちにインストールしてください。
XQuartz(Macのみ)が入っていない方いましたら、ダウンロードを事前に行ってください。
https://www.xquartz.org/
ダウンロード後、ユーティリティの中にあるx11をダブルクリックしてからRをで、コードをご使用ください。
※Windows環境とMac環境両方お持ちの場合は、Windowsを推奨します。
(※当日のパソコン貸し出しは行いません。もし動作がうまくいかない場合、講義を聞くだけになります。その旨ご了承いただける方のみご参加ください。RはOSだけでなく各マシンの種類・設定によっても一部動作しない場合がありますが、それをご理解いただける方のみご参加ください)

【Linuxの方】
https://cran.r-project.org/
から、Download R for Linuxをクリック、その後、各々の環境に沿ってダウンロードインストールを行ってください。
・無線LAN搭載
・HDD空き容量2GB以上
・メモリ4GB以上
【開発環境設定】
当日の運営を円滑に行うため、環境設定はできるだけご自身で事前に行ってください。
※RとRパッケージのダウンロード・インストールで生じたマシンのすべての不具合に関して運営側は責任を負いかねます。

※ご自身のノートPCを必ずお持ちください。
【お願い】
当日、一部でネット環境を必要とします。会場のWi-Fi回線は混みあうことが予想されますので,お持ちの方はモバイルルーターなどをご持参ください(こちらでも用意しています)。
【Part2の講義全体の満足度】
満足53%
やや満足40%
普通7%
やや不満0%
不満0%
【Part2講義の難易度】
難 7%
やや難43%
普通 37%
やや易 13%
易0%
【Part2ハンズオンの難易度】
難 0%
やや難 18%
普通68%
やや易 7%
易 7%
【講義についてのご感想】
・少し抽象的過ぎて、理解はできるけど自分でできるかなと思いました。
・どういう感じで解析していくのかという流れが分かったので満足です。
・目的は達成できたのでよかったです。
・内容が多岐に渡るのであと1時間くらい時間をのばしたスケジュールでもよかったかと思いました。
・様々な手法とパッケージの使い方を網羅的に学べるのがよいです。また、価格設定も低めで、参加しやすいです。

【今後の講義の改善点についてのご意見】
・結果が理解できるデータを使ったほうがいいのではないでしょうか。
・結果の見方、実際の課題に沿った機械学習の適用例の説明などあるとより良いと思いました。
・時系列分析のモデルの違いは理解が追いつかなかった。おそらく時系列分析自体が難しい分野だと思うのですが。
・ここにきているレベル層から数式での説明は必要ないのでは?と感じました!
・今回の内容はエンジニアだけでなく、文系分野にも応用できる範囲であったが、今後の文系の参加者のために「差分」や「行列」といった話題はもう少し基礎概念を掘り下げる方が良いと考えました。
・マイクがあると、助かります。

【イベント全体に関する感想、追加して欲しいコンテンツ等】
・R以外でもお願いいたします。
・データのクレンジングを。
・前回に続き機械学習に関わるトピックを幅広く扱っていただいたので勉強になりました。モデルの評価、解釈に重点をおいた講義があれば聞いてみたいです。
・予測の時に、一番最初に予測値を出した後に、中身がどうなっているかを説明したほうがイメージしやすいと思いました!全体的に満足です!ありがとうございました!
・時系列分析という経済学でも用いられている手法が取り上げられていたので、実際の株式データ(ネット上で入手可能)や財務諸表を利用した分析のハンズオンも設置していただければ、ビジネスマンにも食いつきやすいと思います。
・Rを用いた機械学習の実例紹介など、分かる範囲で欲しいです。
・講義途中の質問に丁寧に答えてくださり、いい感じに疑問が解決されたので話が頭にすんなり入ってきた。

【講師紹介】
鈴木瑞人(東京大学大学院新領域創成科学研究科 メディカル情報生命専攻 博士課程1年)
2014年3月東京大学理学部生物学科卒業
2016年3月東京大学大学院新領域創成科学研究科 メディカル情報生命専攻 修士課程卒業

【お問い合わせ先】
machine.learning.r@gmail.com

【主催】
東京大学機械学習勉強会

コミュニティについて

実践的機械学習勉強会

実践的機械学習勉強会

データサイエンス・機械学習を実際に自分の手で使えるようにする会です。 概要を説明するよりも、実際に自分の手を動かして学んでいく会が中心です。 学生・ポスドクは基本的に無料で参加できるのでぜひご参加ください。 東大大学院 新領域の大学院を卒業した人が運営してします。 今後扱っていくテーマは、 自然言語解析(日本語)、画像解析(CNNベースのもの)、グラフニューラルネット、機械学習のアプリ実装で...

メンバーになる