〒112-0004 東京都文京区後楽2-2-10 松屋ビル9階
【8月27日(土) データサイエンスの講習会Part3】
【内容】
今まで飛ばしてきた、統計入門とPythonによる機械学習入門。時系列情報解析の時に飛ばした、状態空間モデルを扱います。言語は何であれデータ解析をやる際に避けて通れない統計について、基礎(平均・分散・分散解析)から線形モデル・一般化線形モデルまでを扱います。一般化線形混合モデルと階層ベイズモデルについても導入を行います。
※Pythonでデータ解析を行いたいという方が多いですが、Pythonでデータ解析するには、かなり自分で書かないといけないことが多いです。またPythonの機械学習ライブラリscikitlearnに関して日本語のドキュメントは少なく、英語・統計・機械学習すべてに自信がある人以外は、R言語でのデータ解析から入った方が、無難です。新しい統計モデルを学習する際そういう本での実装はほぼR言語で行われているため。
【今までの経緯】
Part1では、多変量解析・機械学習入門、データ可視化
Part2では、ビジネスや研究での機械学習の活用方法、機械学習とその可視化、時系列情報解析入門
今回のPart3では、機械学習のベースにある統計の入門、Pythonによるデータ解析入門、状態空間モデル(時系列)、線形モデルと一般化線形モデル(モデリングからモデル評価まで)
【目的】
・基礎統計から高度な統計までの概念をつかむ。
・今までの知識を整理する。
【日時】2016年8月27日(土)13-17時
【会場】株式会社ジースタイラス様
http://www.gstylus.co.jp/gaiyo/
以下イベント詳細となります。
【タイムライン】
12:45- 開場
13:00-13:10 各参加者の自己紹介と知りたい分野の口頭発表(一言)
13:10-14:10 scikitlearn入門(Python)
14:10-14:15 質疑応答
14:15-14:25 休憩
14:25-15:25 統計入門(分散、t検定、分散解析、回帰分析、、)
15:25-15:30 質疑応答
15:30-15:40 休憩
15:40-16:40 線形モデル、 一般化線形モデル、一般化線形混合モデル(導入)、階層ベイズモデル(導入)、状態空間モデル(以上R言語)
16:40-16:50 質疑応答
16:50-17:00 撤収
※あくまでこのタイムラインは目安です。
※初めに各参加者の興味分野と今回参加したモチベーションを一人ひとりお聞きします。その内容によって各話題のボリュームや量を調整しようと思います。
【注意点】
・一応、前回参加なさられなかった方にもわかるような講義にしていますが、前回で話した内容については基本的に深く扱いません。
【対象者層】
・RやPythonの細かい文法は今回はやらないため、基本的なプログラミングスキルがあり、できたら、RやPythonの文法基礎までできる方。
【Rとは?】
オープンソースで無償である高機能な統計ソフト。世界中のRユーザが開発したRプログラム(パッケージ)がCRAN(The Comprehensive R Archive Network)というネットワークにより提供されています。プログラミング初心者でも扱いやすく、Referenceが充実しています。Excelと比べデータ可視化のツールのレパートリーが圧倒的に豊富です。R言語によりプログラムを記述します。
【会場】株式会社ジースタイラス様オフィス(http://www.gstylus.co.jp/gaiyo/)
〒112-0004 東京都文京区後楽2-2-10 松屋ビル9階
【参加方法】
Doorkeeperでご登録ください。
【定員】
15名
【参加費】
学生 無料
社会人3000円
(当日受付にてお支払ください。Doorkeeperの価格表示は社会人用です。学生の方は当日学生証を受付にてご提示くだされば無料です。)
【当日の持ち物・必要なPCのスペック・必要なソフトウェア】
※ご自身のノートPCを必ずお持ちください。
【Windowsの方】
Windows 7以上を推奨 (Xquartzのダウンロードは不要。Rだけダウンロードインストールお願いします)
Rを事前にダウンロードしてきてください(RStudioではありません)。
https://cran.r-project.org/
のDownload R 3.3.1 for Windows (62 megabytes, 32/64 bit)をクリックして、インストールを進めてください。(Download R for Windowsをクリック、baseの文章内のinstall R for the first timeをクリック、Download R 3.3.1 for Windows (70 megabytes, 32/64 bit)をクリックしてダウンロードののち、インストールを行ってください。
・Scikitlearnの開発環境設定
https://www.continuum.io/downloads
から、PYTHON3.5 WINDOWS 64-BIT GRAPHICAL INSTALLER をクリックしてダウンロード・インストールする。(お使いのPCによっては32bitを選択。わからなければ当日聞いてください。)
【Macの方】
Mac OSX(10.6以上推奨)
Rを事前にダウンロードしてきてください(RStudioではありません)。
https://cran.r-project.org/
Download R for (Mac) OS Xをクリック、R-3.3.1.pkgをクリックするとダウンロードできます。そののちにインストールしてください。
XQuartz(Macのみ)が入っていない方いましたら、ダウンロードを事前に行ってください。
https://www.xquartz.org/
ダウンロード後、ユーティリティの中にあるx11をダブルクリックしてからRをで、コードをご使用ください。
※XQuartzが入ってない場合、講習会の一部でコードが実行できないことがあることをご了承ください(講習会のごく一部で、GGallyパッケージとrglパッケージです)。
※Windows環境とMac環境両方お持ちの場合は、Windowsを推奨します。
・Scikitlearnの開発環境設定
https://www.continuum.io/downloads
から、(PYTHON3.5 for OS X ) MAC OS X 64-BIT GRAPHICAL INSTALLER をクリックしてダウンロード・インストールする。
(※当日のパソコン貸し出しは行いません。もし動作がうまくいかない場合、講義を聞くだけになります。その旨ご了承いただける方のみご参加ください。RはOSだけでなく各マシンの種類・設定によっても一部動作しない場合がありますが、それをご理解いただける方のみご参加ください)
【Linuxの方】
https://cran.r-project.org/
から、Download R for Linuxをクリック、その後、各々の環境に沿ってダウンロードインストールを行ってください。
・Scikitlearnの開発環境設定
https://www.continuum.io/downloads
から、PYTHON3.5 LINUX 64-BIT をクリックしてダウンロード・インストールする。(お使いのPCによっては32bitを選択)
・無線LAN搭載
・HDD空き容量4GB以上
・メモリ4GB以上(メモリ2GB以下だとロードできないパッケージがいくつかあります。)
【開発環境設定】
当日の運営を円滑に行うため、環境設定はできるだけご自身で事前に行ってください。
※RとRパッケージのダウンロード・インストールで生じたマシンのすべての不具合に関して運営側は責任を負いかねます。
【お願い】
当日、一部でネット環境を必要とします。会場のWi-Fi回線は混みあうことが予想されますので,お持ちの方はモバイルルーターなどをご持参ください(こちらでも用意しています)。
【講師紹介】
・ 鈴木瑞人(東京大学大学院新領域創成科学研究科 メディカル情報生命専攻 博士課程1年)
2014年3月東京大学理学部生物学科卒業
2016年3月東京大学大学院新領域創成科学研究科 メディカル情報生命専攻 修士課程卒業
【お問い合わせ先】
machine.learning.r@gmail.com
【会場ご提供】
株式会社ジースタイラス様
【主催】
東京大学機械学習勉強会
データサイエンス・機械学習を実際に自分の手で使えるようにする会です。 概要を説明するよりも、実際に自分の手を動かして学んでいく会が中心です。 学生・ポスドクは基本的に無料で参加できるのでぜひご参加ください。 東大大学院 新領域の大学院を卒業した人が運営してします。 今後扱っていくテーマは、 自然言語解析(日本語)、画像解析(CNNベースのもの)、グラフニューラルネット、機械学習のアプリ実装で...
メンバーになる