【DeepLearning関連+Tableau勉強会】
【概要】
セッション1:GCPML+Tensorflow+Sonnet+CNN
セッション2:Kaggle Competition Digit Recongnizer + CNN
セッション3:Tableau Data Visualization
【タイムライン】
13:15 開場
13:30-13:40 企画紹介と講師紹介、各参加者の自己紹介
---セッション1---
13:40-14:00 環境についての説明と、各参加者の環境が動くかチェック
14:00-14:20 Tensorflowに関しての説明
14:20-14:30 TensorflowのwrapperであるSonnetの概説
14:30-14:40 休憩
14:40-15:20 TensorflowとSonnetを用いたDeepLearning(CNN)の実装と実行
15:20-15:30 質疑応答
15:30-15:40 休憩
---セッション2---
15:40-16:00 Kaggle Competitionでの成果発表(発表者:鈴木瑞人, 10月3日時点DigitRecognizer145位/1680チーム)
---セッション3---
16:00-16:25 Tableau を使った簡単データ探索・ステップバイステップ
16:25-16:30 質疑応答
16:30 解散
※セッション2に関してはTensorflow、Sonnetに関しての講義が長引けば中止になることがあります。
【内容】
---セッション1---(110分)(ハンズオン)
GoogleCloudDataLab(xTensorFlow)とGoogleCloudMachineLearningEngineを環境として使用し、TensorFlowのWrapperであるSonnetを使用した講義になります。Sonnet(Python3対応済み)は、深層強化学習の分野で世界最強のDeepMind社が公開しているもので彼らが実務で使用しており、覚えておくと今後DeepMind社の実装コードが読みやすくなるかと思います。
まだ、内容はすべて確定ではないのですが、ベイズ周りの事もふれつつ、機械学習に関するよもやま話もはさみつつ、いろいろ伝授してくれるそうです。ハンズオンの会となります。Googleアカウントを取得し、Google Cloud SDKをダウンロード・インストールしておいてください(本告知文の事前準備の部分参照)。
※セッション1の参加に必要な基礎知識
・回帰や分類など概要を知っている。
・Python、NumPyの文法を知っている。
---セッション2---(20分)(ハンズオフ)
9月17日に開催した”Kaggleに挑戦してみよう会キックオフ”のイベントでKaggleに挑戦したい人を集め、それぞれ(数名)がKaggleコンテストに挑戦しているのですが、その中間報告をします。実戦的機械学習勉強会の主催者である鈴木瑞人が, RのkerasパッケージでDigitRecognizer145位/1680チーム(10月3日時点)をとったので、kerasパッケージでのDeepLearning(CNN)とハイパーパラメータチューニングなどについてお話します。
※セッション2の参加に必要な基礎知識
・DeepLearning系の知識(ゼロから作るDeep Learning( https://www.oreilly.co.jp/books/9784873117584/ )に書いてあるような内容)
・Rプログラミング基礎
---セッション3---(25分)(ハンズオン)
Tableau Japan(シニアテクニカルサポート)岩橋氏によるTableauの使い方やTableauの可視化例の探し方(ギャラリー https://public.tableau.com/s/gallery )のTutorialです。本講習会Part4での解析事例であるKobeBryant選手のデータの可視化をTableauで行ってくれるそうです。鈴木瑞人個人的な感想としては、RやPythonの可視化がPlotlyのようなWebブラウザを介したものに移り変わってきていること、GoogleのFacetsによるwebブラウザでの可視化が出てきていることを考えると、今Tableauを取り上げることはそれなりにTimelyなのかなと思います。RやPythonで可視化するにしてもネット上に公開されているTableauの可視化事例を参考にすることは有益と思います。Tableauにしかできないことはまだ僕の中でははっきりしてないのですが、印象ではRやPythonがアドビと融合した感じが長所かなと思います。
※セッション3の参加に必要な基礎知識
・できればデータ可視化に関する知識があるとよいです。
【講師紹介1】
講師:笠井航(Ph.D) 株式会社Splink
ご経歴:
2010 - 2011年 IBM基礎研究所で大規模交通シミュレーションの研究に従事
2011 - 2014年 株式会社ドワンゴでニコニコ動画の検索、リコメン基盤開発に従事
2014 - 2017年 ソニー株式会社でデータ分析プラットフォームの構築に従事
・機械学習分野で博士(工学)
・システム開発 & データ分析周りの案件を多数経験。
【講師紹介2】
講師:鈴木瑞人
2014年3月東京大学理学部生物学科卒業
2016年3月東京大学大学院新領域創成科学研究科 メディカル情報生命専攻 修士課程卒業
2016年4月東京大学大学院新領域創成科学研究科 メディカル情報生命専攻 博士課程入学
【講師紹介3】
講師:岩橋智宏 Tableau Japan(プリンシパル・テクニカルサポート)
ご経歴:
~2016年1月 日本IBMシステムズ・エンジニアリングにてアナリティクス製品サポート
2016年2月 Tableau Japan にてテクニカル・サポートに従事
【セッション1参加のための事前準備】
1, google アカウントを作成してください
https://accounts.google.com/SignUp?hl=en
2,Google Cloud SDK のダウンロード・インストール
https://cloud.google.com/sdk/downloads?hl=ja
【セッション2参加のための事前準備】
なし
【セッション3参加のための事前準備】
ハンズオンに当たり、Tableau Desktopトライアル版(14日間)を以下のリンクよりダウンロード、インストールください。以下リンクより、e-mailのアドレスを入力し、“DOWNLOAD FREE TRIAL” をクリックしてください。インストール用の実行ファイルがダウンロードされたらこれを実行し、指示に従ってインストールを実行します。
https://www.tableau.com/products/trial
※ すでに試用期間が完了しているまたは、試用版を利用したくない場合は、以下Tableau Public(無料版)をインストールください。こちらはCSV・EXCELファイルへの接続利用が可能ですが、ワークブックファイルの作成、読み込みができません。
https://public.tableau.com/s/download
※ Tableau Desktopのダウンロードとインストールの詳細についてはこちらを参照ください。
https://onlinehelp.tableau.com/current/desktopdeploy/ja-jp/desktop_deploy_download_and_install.htm
【日時】2017年10月8日(日)13:30-16:30
【会場】
LabCafe
東京都文京区本郷4-1-3 明和本郷ビル7F
http://lab-cafe.net/page/access
(本郷交番向かいの、ラーメン屋さんが1Fに入っているビルです。)
東京メトロ 丸ノ内線「本郷三丁目」 徒歩3分
都営大江戸線「本郷三丁目」 徒歩3分
【参加費】
学生・ポスドク:無料(受付にて学生証または身分証をご提示ください)
社会人:無料(本データサイエンス講習会Part1-6のうち4回以上参加なされた方。受講日とお名前を受付でお申し付けください。)
社会人:1000円(本データサイエンス講習会Part1-6のうち1回以上参加なされた方。受講日とお名前を受付でお申し付けください。)
社会人:2000円(本データサイエンス講習会Part1-6に参加されたことがない方。)
【お願い】
当日Wifi環境は用意しますが、会場のWi-Fi回線は混みあうことが予想されます。お持ちの方はモバイルルーターなどをご持参ください。
【お問い合わせ先】
machine.learning.r@gmail.com
【主催】
実践的機械学習勉強会
データサイエンス・機械学習を実際に自分の手で使えるようにする会です。 概要を説明するよりも、実際に自分の手を動かして学んでいく会が中心です。 学生・ポスドクは基本的に無料で参加できるのでぜひご参加ください。 東大大学院 新領域の大学院を卒業した人が運営してします。 今後扱っていくテーマは、 自然言語解析(日本語)、画像解析(CNNベースのもの)、グラフニューラルネット、機械学習のアプリ実装で...
メンバーになる