Web を内容毎に自動分類する上での処理の流れ
読了まで:約0分
概要
- Web ページを
内容毎に 自動的に 分類したい!
と
どの
様に その処理を 行なえば 良いか
と
Web を内容毎に自動分類する上での処理の流れ
基本的には
- Web ページから
本文を 抽出する - 抽出した
本文を 分かち書きを する (特に 日本語の 場合) - 分かち書きを
した テキストを、 ベクトルや スコアなどに 変換する - そのベクトルや
スコアから、 関連度を 抽出する - そして
最後に、 その関連度を 利用して 分類する
そして
以上
僕自身、
なんか