URL入力で簡単! WEBスクレイピングツール import.ioの使い方

import_1

使い方が簡単な無料のWEBサービス「import.io」を紹介します。

import.ioとは

URLを入力するだけで、WEBサイトのデータを抽出することができる無料スクレイピングツールです。

import_1

 

URLを入力するだけで、
自動でデータ箇所を判別し情報を収集ができるスクレイピングサービスです。
無料で利用することができます。
(より大規模の収集を行う場合、有料版もあります。)

WEB版とアプリケーション版

import.ioの提供形態は2種類です。

  • WEB版
  • デスクトップアプリケーション版

WEB版

簡易的なスクレピング URLをコピー&ペーストて抽出する

デスクトップアプリケーション版

項目の指定、抽出方法など、複数URLからの抽出など、WEB版に比べより高度が抽出ができる。

import.io WEB版の使い方

import.ioの基本的なWEB版の使い方を説明します。
使い方といってもURLをコピー&ペーストするだけなので、難しいことはありません。

1.データ収集したい対象サイトを開きます。
ここではヤマダウェブコムを例として取得してみます。

import_yamada

2.ページのURLをimport.ioのフォーム入力して「Try it Out」ボタンをクリックします。

import_3

3.データ取得されます。

データ収集されるまで少し待ちます。
すると以下のように商品画像、タイトル、価格など自動で判定し収集されました。

import.io
ではこのようにデータ箇所を自動判定して情報を集めてくれます。

import_2

取得したデータはCSVとしてエクスポートすることもできます。

import.ioアプリケーション版

アプリケーション版ではWEB版に比べ、より高度なデータ抽出ができます。

例えば。WEB版ではimport.ioではデータ箇所を自動判定ですが、
アプリケーション版では項目のカスタマイズも可能です。

アプリケーション版の特徴

アプリケーション版には主に以下の特徴を持っています。

  • アカウントの登録が必要(googleのアカウント、githubで可能)
  • スクレイピングのルールをAPIとして登録できる
  • APIを複数のウェブページに適応し、まとめて実行し、1つのCSVとしてDLできる

アプリケーション版のインストール

アプリケーション版のインストールは以下の手順で行います。

ダウンロード
https://www.import.io/standard-plans/

 

画面
import-io_5

 

まとめ

通常、WEBスクレピングには専門のプログラミング知識を必要とします。
しかい、URLのコピペで簡単に収集できるのがimport.ioの大きな特徴です。

物販に活用するなら、マーケティング、価格調査、在庫調査など様々な用途での使用が想定できますね。

ぜひ、データの分析に役立てましょう。

また、こうしたスクレイピングツールはimport.ioだけではありません。
他のスクレイピングツールについては、
悪用厳禁!プログラミング知識の不要のWEBスクレイピングツール 5選」で紹介しています。

この記事ためになりましたら、ぜひシェアをお願いします。
Pocket