Doorkeeper

Rでの自然言語解析入門1

2017-12-24(日)09:30 - 12:00 JST

LabCafe

東京都文京区本郷4-1-3 明和本郷ビル7F

申し込む

申し込み受付は終了しました

今後イベント情報を受け取る

一般チケット 10円 会場払い
3,000円 会場払い

詳細

【Rでの自然言語解析入門1】
【概要】
英語でのテキスト解析と日本語でのテキスト解析を行います。
・英語:英語テキストの読み込みと要約、英語テキストの前処理とSentimentAnalysis、英語での用例索引、Bag-of-Words(BOW)、ngram、TF-IDF、skip-gramまたはCBOWとテキスト分類。
・日本語:日本語の文書読み込み、MeCabでの形態素解析、用例索引、Bag-of-Words(BOW)、ngramとテキスト分類。

【タイムライン】
9:15- 開場
9:30-9:40 企画紹介と参加者の自己紹介
9:40-9:55 英語テキストの読み込みと要約
9:55-10:10 英語テキストの前処理とSentimentAnalysis
10:10-10:20 英語での用例索引
10:20-10:30 休憩
10:30-10:40 Bag-of-Words(BOW)とテキスト分類
10:40-10:50 ngramとテキスト分類とネットワークグラフ
10:50-11:00 TF-IDFとテキスト分類
11:00-11:10 skip-gramまたはCBOWとテキスト分類
11:10-11:20 休憩
11:20-11:30 日本語の文書読み込み、MeCabでの形態素解析
11:30-11:40 日本語での用例索引
11:40-11:50 日本語でのBag-of-Words(BOW)とテキスト分類
11:50-12:00 日本語でのngramとテキスト分類とネットワークグラフ
12:00- 解散

【日時】2017年12月24日(土)午前09:30-12:00
【会場】
LabCafe
東京都文京区本郷4-1-3 明和本郷ビル7F
http://lab-cafe.net/page/access
(本郷交番向かいの、ラーメン屋さんが1Fに入っているビルです。)
東京メトロ 丸ノ内線「本郷三丁目」 徒歩3分
都営大江戸線「本郷三丁目」     徒歩3分

【参加費】
学生・ポスドク 無料(受付にて学生証・身分証をお見せください)
社会人3000円(お釣りのないようにお願いします)(初めに間違えて10円参加者の枠を作ってしまいましたが3000円の間違いです)

【当日の持ち物・必要なPCのスペック・必要なソフトウェア】
※ご自身のノートPCを必ずお持ちください。
【Rのダウンロード・インストール】
【Windowsの方】
Windows 7以上を推奨。
まだRをいれてない方は、Rをダウンロード・インストールしてください。
https://cran.r-project.org/
のDownload R for Windows→base→Download R 3.4.3 for Windows (62 megabytes, 32/64 bit)インストールを進めてください。

【Macの方】
Mac OSX(10.6以上推奨)
Rを事前にダウンロードしてきてください(RStudioではありません)。
https://cran.r-project.org/
Download R for (Mac) OS Xをクリック、R-3.4.3.pkgをクリックするとダウンロードできます。そののちにインストールしてください。

【Linuxの方】
https://cran.r-project.org/
から、Download R for Linuxをクリック、その後、各々の環境に沿ってダウンロードインストールを行ってください。

【MeCabのダウンロードインストール】
【Windowsの方】
以下URLに飛んだあと(MeCabと検索いただいても結構です)
http://taku910.github.io/mecab/
ダウンロード→MeCab 本体→Binary package for MS-Windows→mecab-0.996.exe:ダウンロードの”ダウンロード”をクリック。

【Macの方】
xcode入っていない方は、xcodeをインストール
ターミナルに以下のコマンドを入力
xcode-select --install
homebrewが入っていない方は、以下コマンドをターミナルに入力してhomebrewをいれる、
/usr/bin/ruby -e "$(curl -fsSL https://raw.githubusercontent.com/Homebrew/install/master/install)"
その次に、
brew install wget
と入力。
その後以下コマンドを、一行ずつ入力
cd /tmp
wget -O mecab-0.996.tar.gz "https://drive.google.com/uc?export=download&id=0B4y35FiV1wh7cENtOXlicTFaRUE"
tar xzf mecab-0.996.tar.gz
cd mecab-0.996
./configure
make
sudo make install
cd ..

wget -O mecab-ipadic-2.7.0-20070801.tar.gz "https://drive.google.com/uc?export=download&id=0B4y35FiV1wh7MWVlSDBCSXZMTXM"
tar xzf mecab-ipadic-2.7.0-20070801.tar.gz
cd mecab-ipadic-2.7.0-20070801
./configure --with-charset=utf8
make
sudo make install
cd ..
rm -rf /tmp/mecab-*

【その他環境】
・無線LAN搭載
・HDD空き容量2GB以上
・メモリ4GB以上

【開発環境設定】
当日の運営を円滑に行うため、環境設定はできるだけご自身で事前に行ってください。
※RとRパッケージのダウンロード・インストールで生じたマシンのすべての不具合に関して運営側は責任を負いかねます。

※ご自身のノートPCを必ずお持ちください。
【お願い】
当日、一部でネット環境を必要とします。会場のWi-Fi回線は混みあうことが予想されますので,お持ちの方はモバイルルーターなどをご持参ください(こちらでも用意しています)。

【講師紹介】
鈴木瑞人
2014年3月東京大学理学部生物学科卒業
2016年3月東京大学大学院新領域創成科学研究科 メディカル情報生命専攻 修士課程卒業
2016年4月東京大学大学院新領域創成科学研究科 メディカル情報生命専攻 博士課程入学

【お問い合わせ先】
machine.learning.r@gmail.com

【主催】
実戦的機械学習勉強会

コミュニティについて

実践的機械学習勉強会

実践的機械学習勉強会

データサイエンス・機械学習を実際に自分の手で使えるようにする会です。 概要を説明するよりも、実際に自分の手を動かして学んでいく会が中心です。 学生・ポスドクは基本的に無料で参加できるのでぜひご参加ください。 東大大学院 新領域の大学院を卒業した人が運営してします。 今後扱っていくテーマは、 自然言語解析(日本語)、画像解析(CNNベースのもの)、グラフニューラルネット、機械学習のアプリ実装で...

メンバーになる