WEBスクレイピングツール import.ioの使い方

import_1

import.ioとは

WEBサイトのデータを抽出することができる無料スクレイピングツールです。

import_1

 

URLを入力するだけで、
自動でデータ箇所を判別し情報を収集ができるスクレイピングサービスです。

無料で利用ができます。

(より大規模の収集を行う場合、有料版もあります。)

WEB版とアプリケーション版

提供形態は2種類です。

  • WEB版
  • デスクトップアプリケーション版

WEB版

簡易的なスクレピング URLをコピー&ペーストて抽出する

デスクトップアプリケーション版

項目の指定、抽出方法など、複数URLからの抽出など、WEB版に比べより高度が抽出ができる。

import.io WEB版の使い方

基本的なWEB版の使い方を説明します。
URLをコピー&ペーストするだけなので、難しいことはありません。

1.データ収集したい対象サイトを開きます。

import_yamada

2.ページのURLをimport.ioのフォーム入力して「Try it Out」ボタンをクリックします。

import_3

3.データ取得されます。

import_2

CSVとしてエクスポートすることもできます。

アプリケーション版

WEB版に比べより高度が抽出ができます。

アプリケーション版の特徴

  • アカウントの登録が必要(googleのアカウント、githubで可能)
  • スクレイピングのルールをAPIとして登録できる
  • APIを複数のウェブページに適応し、まとめて実行し、1つのCSVとしてDLできる

アプリケーション版のインストール

ダウンロード
https://www.import.io/standard-plans/

 

画面
import-io_5

Pocket