【データサイエンス講習会Part1】
【内容】
今回の講習会の内容は、大まかに、R言語入門、Rを用いたデータの可視化基礎、全変数での同時可視化、Rでの多変量解析の軽い実行の解説を行います。本講義Part1からPart6までありますが、その一番入門的なPart1です。
【日時】2017年9月10日(日)9時半-12時半
【会場】
LabCafe
東京都文京区本郷4-1-3 明和本郷ビル7F
http://lab-cafe.net/page/access
(本郷交番向かいの、ラーメン屋さんが1Fに入っているビルです。)
東京メトロ 丸ノ内線「本郷三丁目」 徒歩3分
都営大江戸線「本郷三丁目」 徒歩3分
以下イベント詳細となります。
【タイムライン】
09:15- 開場
09:30-09:35 各参加者の自己紹介と知りたい分野の口頭発表(一言)
09:35-10:30 Rプログラミング入門
10:30-10:40 休憩
10:40-11:30 データ可視化基礎
11:30-11:40 休憩
11:40-12:20 高度な可視化
12:20-12:30 質疑応答
12:30- 解散
※あくまでこのタイムラインは目安です。
※初めに各参加者の興味分野と今回参加したモチベーションを一人ひとりお聞きします。その内容によって各話題のボリュームを調整しようと思います。
【Part1の内容詳細】
ーRプログラミング入門ー
R紹介とhead関数とhelp関数
Rでの計算とデータ構造
データ型と要約関数
Rの比較演算子
データフレームの扱い方
ディレクトリ移動とデータの入出力
Rパッケージ関連
for文による繰り返し処理
sample関数によるサンプリング
ーRによる可視化基礎ー
質的変数の可視化
量的変数の可視化
散布図行列
stars関数による可視化
parcoord関数による可視化
rglパッケージによる三次元の可視化
tabplotパッケージによる可視化
ーRによる高度な可視化ー
ggplot2パッケージによる一次元の量的変数の可視化
ggplot2パッケージによる二次元の量的変数の可視化
ggplot2パッケージによる一次元の質的変数の可視化
ggplot2パッケージによる二次元の質的変数の可視化
ggplot2パッケージによる質的変数と量的変数の可視化
散布図行列の発展
平行座標プロットの発展版
階層構造があるデータの可視化
【Part1の特徴】
データの可視化のうち、層別化と、全変数の可視化を体系立ててしっかり教えられる人・書籍は現状かなり少なく、その部分の資料作成にかなりの時間を割いたので、特にデータの可視化に特徴があるコースです。
【対象者層】
・データの集計・データ可視化・解析ができるようになりたい方。
・Rでのデータ解析の初歩を学びたい方
・実際に自分の手で一通りデータ解析ができるようになりたい方
【Rとは?】
オープンソースで無償である高機能な統計ソフト。世界中のRユーザが開発したRプログラム(パッケージ)がCRAN(The Comprehensive R Archive Network)というネットワークにより提供されています。プログラミング初心者でも扱いやすく、Referenceが充実しています。Excelと比べデータ可視化のツールのレパートリーが圧倒的に豊富です。R言語によりプログラムを記述します。
【参加方法】
Doorkeeperでご登録ください。
【参加費】
学生・ポスドク 無料(受付にて学生証または身分証をご提示ください)
社会人3000円(Part1を以前受講なされた方は無料です。受講日とお名前を受付でお申し付けください)
(当日受付にてお支払ください。お釣りのないようにお願いします。Doorkeeperの価格表示は社会人用です。学生の方は当日学生証を受付にてご提示くだされば無料です。またUdemyの動画(https://www.udemy.com/r-data-visualization/)をご購入いただいた方も無料です。ご購入記録を受付にてご提示ください。)
【当日の持ち物・必要なPCのスペック・必要なソフトウェア】
※ご自身のノートPCを必ずお持ちください。
【Windowsの方】
Windows 7以上を推奨 (Xquartzのダウンロードは不要。Rだけダウンロードインストールお願いします)
Rを事前にダウンロードしてきてください(RStudioではありません)。
https://cran.r-project.org/
のDownload R 3.4.1 for Windows (62 megabytes, 32/64 bit)をクリックして、インストールを進めてください。(Download R for Windowsをクリック、baseの文章内のinstall R for the first timeをクリック、Download R 3.4.1 for Windows (70 megabytes, 32/64 bit)をクリックしてダウンロードののち、インストールを行ってください。
【Macの方】
Mac OSX(10.6以上推奨)
Rを事前にダウンロードしてきてください(RStudioではありません)。
https://cran.r-project.org/
Download R for (Mac) OS Xをクリック、R-3.4.1pkgをクリックするとダウンロードできます。そののちにインストールしてください。
XQuartz(Macのみ)が入っていない方いましたら、ダウンロードを事前に行ってください。
https://www.xquartz.org/
ダウンロード後、ユーティリティの中にあるx11をダブルクリックしてからRをで、コードをご使用ください。
※Windows環境とMac環境両方お持ちの場合は、Windowsを推奨します。
(※当日のパソコン貸し出しは行いません。もし動作がうまくいかない場合、講義を聞くだけになります。その旨ご了承いただける方のみご参加ください。RはOSだけでなく各マシンの種類・設定によっても一部動作しない場合がありますが、それをご理解いただける方のみご参加ください)
【Linuxの方】
https://cran.r-project.org/
から、Download R for Linuxをクリック、その後、各々の環境に沿ってダウンロードインストールを行ってください。
・無線LAN搭載
・HDD空き容量2GB以上
・メモリ4GB以上
【開発環境設定】
当日の運営を円滑に行うため、環境設定はできるだけご自身で事前に行ってください。
※RとRパッケージのダウンロード・インストールで生じたマシンのすべての不具合に関して運営側は責任を負いかねます。
【開発環境設定】
当日の運営を円滑に行うため、環境設定はできるだけご自身で事前に行ってください。
※RとRパッケージのダウンロード・インストールで生じたマシンのすべての不具合に関して運営側は責任を負いかねます。
【お願い】
当日、一部でネット環境を必要とします。会場のWi-Fi回線は混みあうことが予想されますので,お持ちの方はモバイルルーターなどをご持参ください(こちらでも用意しています)。
【講師紹介】
鈴木瑞人(東京大学大学院新領域創成科学研究科 メディカル情報生命専攻 博士課程1年)
2014年3月東京大学理学部生物学科卒業
2016年3月東京大学大学院新領域創成科学研究科 メディカル情報生命専攻 修士課程卒業
【お問い合わせ先】
machine.learning.r@gmail.com
【主催】
実践的機械学習勉強会
データサイエンス・機械学習を実際に自分の手で使えるようにする会です。 概要を説明するよりも、実際に自分の手を動かして学んでいく会が中心です。 学生・ポスドクは基本的に無料で参加できるのでぜひご参加ください。 東大大学院 新領域の大学院を卒業した人が運営してします。 今後扱っていくテーマは、 自然言語解析(日本語)、画像解析(CNNベースのもの)、グラフニューラルネット、機械学習のアプリ実装で...
メンバーになる