Doorkeeper

【DeepLearningを使った商品レコメンドシステムの作り方講座】

2019-01-12(土)13:00 - 15:50

吉積情報株式会社・クラウドエース株式会社 セミナー室

〒100-0004 東京都千代田区大手町2-6-2 日本ビルヂング11F 1106

+ 17人の参加者
申し込む

申し込み受付は終了しました

今後イベント情報を受け取る

5,000円 会場払い

【DeepLearningを使った商品レコメンドシステムの作り方講座】

【概要】
機械学習は、多くの商品レコメンドシステムで採用されており、その有用性が知られています。近年のDeepLearningの進歩により、多くのレコメンドエンジンがDeepLearningベースに置き換わったはずですが、その情報は書籍でもネットでも出てこない状況にあります。
書籍での推薦エンジン情報は、
推薦システム: 統計的機械学習の理論と実践
Deepak K. Agarwal (著), Bee‐Chung Chen (著)
Courseraでの推薦エンジン講座は、
Recommender Systems専門講座
https://www.coursera.org/specializations/recommender-systems
がありますが、いずれも、協調フィルタリングを使った推薦エンジンは教えているものの、協調フィルタリング以外のDeepLearningを用いた推薦エンジンの作り方は教えていません。

今回は、協調フィルタリングではない、DeepLearningを用いた商品レコメンドシステムの作り方を解説、実装する講座を作成しました。
使用するデータは、台湾のとあるスーパーマーケットのPOS(Point of Sales)データである、
Ta Feng Grocery Dataset(Ta Feng Grocery Dataset - Nov 2000 to Feb 2001)
https://www.kaggle.com/chiranjivdas09/ta-feng-grocery-dataset
になります。
Colaboratoryで、各自実行していただきます。
Colaboratoryで実行するためにデータは下記手順で事前にGoogle Driveにアップロードしてきてください。
もしわからなければ、当日の初めに作業することも可能です。

興味ある方ぜひご参加ください。

【日時】2019年01月12日(土)13:00-15:50

【参加費】
学生・ポスドク:1000円(受付にて学生証・身分証をお見せください。今回は、学術要素は薄く、この値段としました。)
社会人:5000円(できるだけおつりのないようにお願いします)

【必要な事前知識】
一応知識0でもできるようにはしてありますが、できれば、
・Python文法の基礎
・Pandas基礎
・Numpy基礎
はできたほうがよいです。

【この講習会を受けると理解できること】
・POSデータの扱い方
・協調フィルタリングでない、DeepLearningを使った商品レコメンドシステムの作り方

【タイムライン】
12:40    開場
13:00- 13:20 会場説明・Colabの使い方説明・環境準備
13:20- 13:50レコメンドシステムを作る上でのPython, Pandas, Numpyの必須知識
13:50- 14:00 休憩
14:00- 14:20 POSデータになれるための集計・可視化基礎
14:20- 14:50 レコメンドエンジンの実装
14:50- 15:00 休憩
15:00- 15:30 レコメンドエンジンの実装の続き
15:30- 15:40 質疑応答
15:40- 15:50 予備時間
16:00 解散

【事前準備】
できるだけ事前におこなってきてください。わからなければ当日聞いてください。
1, kaggleのアカウントを作成、ログイン
https://www.kaggle.com/
2, Ta Feng Grocery Datasetをダウンロード、解凍。
https://www.kaggle.com/chiranjivdas09/ta-feng-grocery-dataset
3, googleアカウントを作成(あるなら必要ありません。セキュリティ上仕事用でないものをおすすめします)
4, GoogleDriveのMy DriveにLecture20190112フォルダを作成(ファイルが大きく、商用のGoogleアカウントでないと普通にアップロードできません。Colabの方からアップロードする必要があります。)
5, ColaboratoryにGoogleDriveをMountし、そこからLecture20190112フォルダに移動し、そこにta_feng_all_months_merged.csvをアップロードします。
まずは、googleでColaboratoryを検索し、
Hello, Colaboratory - Colaboratory
を選択します。
右下のPHYTHON3の新しいNotebookを選択し
右上の「接続」を選択し、「ホスト型ランタイムを選択」を選択します。
from google.colab import drive
drive.mount('/content/drive')
をセルに張り付け、shift+Enterで実行します。
Go to this URL in a browser:の右にでてくるURLをクリックして、
自分のgoogleアカウントで認証します。
セルに、%lsを入力しshift+Enterで実行します。すると、drive/があるのがわかります。
drive/の中の、'My Drive'/の中の、Lecture20190112に今回のcsvをアップロードします。
ホスト型ランタイムに接続した状態で、Colaboratoryの画面の左上の黒い「>」ボタン→ファイル→driveの右の▲選択→My Driveの▲選択→Lecture20190112を右クリックし、(ローカルのデータを)アプロードを選択、の手順でもアップロードできます。
アップロードが完了したら、
%lsでアップロードができているのを確認できます。
終ったらすべて閉じてしまって大丈夫です。
※以下では最新版のChrome webブラウザを使うことを想定しています。
※本講習会の準備、当日配布するコードの実行で生じる、いかなる不具合や損害に対して、講師、主催団体、共催団体ともにいかなる責任も負いかねます。それを了承いただける方のみご参加ください。

【持ち物】
・ノートパソコン
(データさえGoogleDriveにアップロードできていれば、Colaboratoryは、スマートフォンやタブレットでの実行も可能ですが、すべての環境でテストできているわけではないので、ノートパソコンをおすすめします。)
・wifi環境は用意していますが、mobile wifiルーターをお持ちの方は、各自ご自身のものを使っていただけますと幸いです。

【会場】
CloudAce株式会社・吉積情報株式会社 セミナー室
〒100-0004 東京都千代田区大手町2-6-2 日本ビルヂング11F 1106
http://www.cloud-ace.jp/company/map/
PASONA JOBHUB SQUAREの後ろのビルです。

【諸注意】
会場は禁煙です。
喫煙は建物外の指定の場所でお願いします。

【その他】
講義の動画を後にUdemyにアップすることを考えているので、音声が拾われたり、後頭部が動画に入ってしまうことがありますが(できるだけスクリーンだけにするものの)、それをご了承の方のみご参加ください。
https://www.udemy.com/r-data-visualization/

【講師】
鈴木瑞人
株式会社パッパーレ

【講師経歴】
2014年3月 東京大学 理学部 生物学科 卒業
2016年3月 東京大学大学院 新領域創成科学研究科 修士課程 卒業(医科学修士)
2017年12月株式会社パッパーレ創業

【株式会社パッパーレについて】
機械学習のシステム製作で運転資金を稼ぎ、稼いだ分をすべてバイオ系への機械学習の応用にあてるベンチャーとして、2018年12月に創業。現在従業員3人。
某国立のがんを研究する機関との共同研究をメインに、
運転資金獲得のため、POSデータを用いたレコメンドシステムやマッチングシステムの作成などをしている。

【お問合せ先】
machine.learning.r@gmail.com

【主催】
株式会社パッパーレ
実践的機械学習勉強会

【協賛】
会場提供
吉積情報株式会社様 

コミュニティについて
実践的機械学習勉強会

実践的機械学習勉強会

データサイエンス・機械学習を実際に自分の手で使えるようにする会です。 コミュニティの目的は、統計・データサイエンス・機械学習を東大・慶応・早稲田などの学生や研究者に広く普及させることで、研究レベルの底上げを図ることと、一般の社会人に統計・データサイエンス・機械学習を普及させることで、日本のビジネスのレベルを高めることです。 学生・ポスドクは基本的に無料で参加できるのでぜひご参加ください。 東...

メンバーになる