〒100-0004 東京都千代田区大手町2-6-2 日本ビルヂング11F 1106
【DeepLearningを使った商品レコメンドシステムの作り方講座】
【概要】
機械学習は、多くの商品レコメンドシステムで採用されており、その有用性が知られています。近年のDeepLearningの進歩により、多くのレコメンドエンジンがDeepLearningベースに置き換わったはずですが、その情報は書籍でもネットでも出てこない状況にあります。
書籍での推薦エンジン情報は、
推薦システム: 統計的機械学習の理論と実践
Deepak K. Agarwal (著), Bee‐Chung Chen (著)
Courseraでの推薦エンジン講座は、
Recommender Systems専門講座
https://www.coursera.org/specializations/recommender-systems
がありますが、いずれも、協調フィルタリングを使った推薦エンジンは教えているものの、協調フィルタリング以外のDeepLearningを用いた推薦エンジンの作り方は教えていません。
今回は、協調フィルタリングではない、DeepLearningを用いた商品レコメンドシステムの作り方を解説、実装する講座を作成しました。
使用するデータは、台湾のとあるスーパーマーケットのPOS(Point of Sales)データである、
Ta Feng Grocery Dataset(Ta Feng Grocery Dataset - Nov 2000 to Feb 2001)
https://www.kaggle.com/chiranjivdas09/ta-feng-grocery-dataset
になります。
Colaboratoryで、各自実行していただきます。
Colaboratoryで実行するためにデータは下記手順で事前にGoogle Driveにアップロードしてきてください。
もしわからなければ、当日の初めに作業することも可能です。
興味ある方ぜひご参加ください。
【日時】2019年01月12日(土)13:00-15:50
【参加費】
学生・ポスドク:1000円(受付にて学生証・身分証をお見せください。今回は、学術要素は薄く、この値段としました。)
社会人:5000円(できるだけおつりのないようにお願いします)
【必要な事前知識】
一応知識0でもできるようにはしてありますが、できれば、
・Python文法の基礎
・Pandas基礎
・Numpy基礎
はできたほうがよいです。
【この講習会を受けると理解できること】
・POSデータの扱い方
・協調フィルタリングでない、DeepLearningを使った商品レコメンドシステムの作り方
【タイムライン】
12:40 開場
13:00- 13:20 会場説明・Colabの使い方説明・環境準備
13:20- 13:50レコメンドシステムを作る上でのPython, Pandas, Numpyの必須知識
13:50- 14:00 休憩
14:00- 14:20 POSデータになれるための集計・可視化基礎
14:20- 14:50 レコメンドエンジンの実装
14:50- 15:00 休憩
15:00- 15:30 レコメンドエンジンの実装の続き
15:30- 15:40 質疑応答
15:40- 15:50 予備時間
16:00 解散
【事前準備】
できるだけ事前におこなってきてください。わからなければ当日聞いてください。
1, kaggleのアカウントを作成、ログイン
https://www.kaggle.com/
2, Ta Feng Grocery Datasetをダウンロード、解凍。
https://www.kaggle.com/chiranjivdas09/ta-feng-grocery-dataset
3, googleアカウントを作成(あるなら必要ありません。セキュリティ上仕事用でないものをおすすめします)
4, GoogleDriveのMy DriveにLecture20190112フォルダを作成(ファイルが大きく、商用のGoogleアカウントでないと普通にアップロードできません。Colabの方からアップロードする必要があります。)
5, ColaboratoryにGoogleDriveをMountし、そこからLecture20190112フォルダに移動し、そこにta_feng_all_months_merged.csvをアップロードします。
まずは、googleでColaboratoryを検索し、
Hello, Colaboratory - Colaboratory
を選択します。
右下のPHYTHON3の新しいNotebookを選択し
右上の「接続」を選択し、「ホスト型ランタイムを選択」を選択します。
from google.colab import drive
drive.mount('/content/drive')
をセルに張り付け、shift+Enterで実行します。
Go to this URL in a browser:の右にでてくるURLをクリックして、
自分のgoogleアカウントで認証します。
セルに、%lsを入力しshift+Enterで実行します。すると、drive/があるのがわかります。
drive/の中の、'My Drive'/の中の、Lecture20190112に今回のcsvをアップロードします。
ホスト型ランタイムに接続した状態で、Colaboratoryの画面の左上の黒い「>」ボタン→ファイル→driveの右の▲選択→My Driveの▲選択→Lecture20190112を右クリックし、(ローカルのデータを)アプロードを選択、の手順でもアップロードできます。
アップロードが完了したら、
%lsでアップロードができているのを確認できます。
終ったらすべて閉じてしまって大丈夫です。
※以下では最新版のChrome webブラウザを使うことを想定しています。
※本講習会の準備、当日配布するコードの実行で生じる、いかなる不具合や損害に対して、講師、主催団体、共催団体ともにいかなる責任も負いかねます。それを了承いただける方のみご参加ください。
【持ち物】
・ノートパソコン
(データさえGoogleDriveにアップロードできていれば、Colaboratoryは、スマートフォンやタブレットでの実行も可能ですが、すべての環境でテストできているわけではないので、ノートパソコンをおすすめします。)
・wifi環境は用意していますが、mobile wifiルーターをお持ちの方は、各自ご自身のものを使っていただけますと幸いです。
【会場】
CloudAce株式会社・吉積情報株式会社 セミナー室
〒100-0004 東京都千代田区大手町2-6-2 日本ビルヂング11F 1106
http://www.cloud-ace.jp/company/map/
PASONA JOBHUB SQUAREの後ろのビルです。
【諸注意】
会場は禁煙です。
喫煙は建物外の指定の場所でお願いします。
【講師】
鈴木瑞人
株式会社パッパーレ
【講師経歴】
2014年3月 東京大学 理学部 生物学科 卒業
2016年3月 東京大学大学院 新領域創成科学研究科 修士課程 卒業(医科学修士)
2017年12月株式会社パッパーレ創業
【お問合せ先】
machine.learning.r@gmail.com
【主催】
株式会社パッパーレ
実践的機械学習勉強会
【協賛】
会場提供
吉積情報株式会社様
データサイエンス・機械学習を実際に自分の手で使えるようにする会です。 概要を説明するよりも、実際に自分の手を動かして学んでいく会が中心です。 学生・ポスドクは基本的に無料で参加できるのでぜひご参加ください。 東大大学院 新領域の大学院を卒業した人が運営してします。 今後扱っていくテーマは、 自然言語解析(日本語)、画像解析(CNNベースのもの)、グラフニューラルネット、機械学習のアプリ実装で...
メンバーになる