自然言語処理

 

わかりやすい。自然言語処理自体の基礎の部分。

www.creativevillage.ne.jp

 

自然言語処理の前処理。

ノイズを消したり、単語完成号を取ったりする方法。

qiita.com

 

ストップワードのリスト。

http://svn.sourceforge.jp/svnroot/slothlib/CSharp/Version1/SlothLib/NLP/Filter/StopWord/word/Japanese.txt

 

自然言語処理の勉強方法(サイト)や基本など。

www.tech-teacher.jp

 

MeCabの使い方。実際に使った。

qiita.com

 

Mecabのユーザー辞書登録の方法。

M1Macでの導入方法。

note.com

 

MeCabのユーザー辞書登録方法と、

自然言語処理機械学習の簡単な説明。

techblog.gmo-ap.jp

 

とても良い記事。使った。

ウェブから情報を抜いてきて、分かち書きして、機械学習の流れがわかりやすく書いてある。

サンプルプログラム付き。

developers.wonderpla.net

 

Mecabを使った後の機械学習

toukei-lab.com

 

テキストデータの特徴量。機械学習

kamonohashiperry.com

まだ使ってないが大事なことがまとめてある。

Mecab、日本語、禁止ワード、ワードクラウド

www.teamxeppet.com

 

ーーーーーーーーーーーー

ストップワードの処理には地道にやるしかない。ライブラリなどはない。

大文字小文字やノイズ処理、正規化は正規表現など使う。

www.dskomei.com