形態素解析(テキストマイニング)をAmazonの人気商品リサーチに活用する

ちょっとかわった商品リサーチのネタです。
形態素解析(テキストマイニング)を使った、Amazonの人気商品リサーチに活用する方法を紹介します。

テキストマイニングとは?

テキストマイニング

形態素解析(けいたいそかいせき、Morphological Analysis)とは、文法的な情報の注記の無い自然言語のテキストデータ()から、対象言語の文法や、辞書と呼ばれる単語の品詞等の情報にもとづき、形態素Morpheme, おおまかにいえば、言語で意味を持つ最小単位)の列に分割し、それぞれの形態素の品詞等を判別する作業である。

自然言語処理の分野における主要なテーマのひとつであり、機械翻訳かな漢字変換など応用も多い(もちろん、かな漢字変換の場合は入力が通常の文と異なり全てひらがなであり、その先に続く文章もその時点では存在しないなどの理由で、内容は機械翻訳の場合とは異なったものになる)。

wikipediaの引用をもってきました。
これを読んでもさっぱり何を言ってるのか、わかりづらいですね。
小難しいことはともかく、キーワードを指定すれば、上記画像のようなデータが得られるということだけわかれば十分です。

オンライン無料テキストマイニングツール「ユーザーローカル」

Screenshot of textmining.userlocal.jp

https://textmining.userlocal.jp/

今回はテキストマイニングツールは無料のツール「ユーザーローカル」を使います。
導入も使い方も自体は簡単です。

  • ブラウザ上で動作
  • アカウント登録不要
  • ソフトウェアのダウンロード不要

データを用意します。

まずは元なるテキストデータを用意します。

例として、
過去の売れ筋商品データ(月間)
からデータをエクスポートします。

過去の売れ筋商品データ(月間)とは、amazonが公開しているカテゴリ別の売上上位商品です。

過去の売れ筋商品データ(月間)

過去の売れ筋商品データ(月間)

「対象年月」「商品カテゴリ」を入力後、
「レポートのURLを表示」をクリックします。

URLが表示されるので、URLを右クリックし「リンク先を別名で保存」をクリックします

ダウンロードしたデータは以下です。
今回はおもちゃ&ホビーのデータを使いました。
D列の商品名の部分をまとめて選択し後、コピーします。

次にテキストマイニング 無料ツール by ユーザーローカルを開きます。

入力フォームに先程コピーしたデータをはりつけ、「テキストマイニングする」をクリックし調査を開始します。

すると、解析結果が表示されます。

共起ネットワーク
 
ワードクラウド
 
スコア
 
ここではワードクラウドに着目してみましょう。
出現頻度が高いデータを資格的に確認することができます。
 
「プラモデル」は予想がつきますが、「マキシマム」というキーワードも目立っていたらので、調べてみます。
Amazonでの検索結果です。
どうやら、仮面ライダーのグッズのようです。
テキストマイニングツールを使うことで、どのなキーワードが多くあるか、視覚的に把握することができます。
  • 他のカテゴリのトップ1000リスト
  • オークファンプロの5000位
  • ZoNASINハンターでデータを集める

等もっと大きいデータを扱ってもなかなか面白い結果になります。
多くの文字情報を見える化することで、どんな商品が流行っていいるのか、調べる手段の一つです。

他の活用方法として、商品レビュースクピングで一気に集め、テキストマイニングデータにかけるといいう方法もあります。
頻出するキーワードを抽出することで、優先度の高い改善点をみつけるのに役立てることができます。

最後 に

形態素解析(テキストマイニング)でAmazonの人気商品リサーチに活用する方法を紹介しました。
レビューの分析するのにも役立ちます。

元となるテキストデータをあつめるために、Amazonからデータを収集する方法は色々あります。
収集方法は以下の記事を参考にしてください。

発想次第で色々なリサーチに役立ててください。