Initial Site

Initial Site

Initial Site

Webスクレイピングについて!WEB屋のメモ帳

  • ヤスダ2015/04/24 14:20
gf1420316397w

こんにちは。

スクレイピングっていいよね。
WEB屋の保田です。

以下のページを参考にしました。
http://qiita.com/nezuq/items/c5e827e1827e7cb29011
「Webスクレイピングの注意事項一覧」

Webスクレイピングについて気になったことを
リストアップしてみました。

■目的は下記のものに限る。
・情報解析。

(´・ω・`)「。。。。」

■対象コンテンツは下記のものに限る。
・文章の一部。
・画像の一部。
・音声、映像。

(´・ω・`)「ほとんど全部だよね。。。」

■Webサイトへアクセスする時は下記の制限を守る。
・robots.txt/robotsメタタグのアクセス制限内容を守る。

(´・ω・`)「ルールは守るつもりだけど、robots.txtとかもクロールしなきゃいけないのか。」

■データを公開する時

(´・ω・`)「ん?公開していいの?しかも、」

集計データを公開する場合は許可を取る必要はない。
ただし、個人が特定されるデータの場合は許可を取る必要がある。
個別データを公開する場合は許可を取る必要がある。
ただし、Web検索サービスで先方のサイトを紹介する為の利用は除きます。

(´・ω・`)「収集先を紹介していれば、公開していいみたい。」

コンテンツに対する著作権ってあんまりないんだな。
キュレーションって、あれだしね。

次回もWEB関連の記事を書く予定です。

WEB屋の保田でした。


この記事の作者

アバター
ヤスダ


総記事本数:11

コメントをどうぞ

おすすめ記事

  1. 2af1a7d9bbe73319a6c346c407cdefbf_m
    リモートワークに移行します
  2. ウィルス画像
    横浜のブラック企業 Initial Site(イニシャルサイト)からコロナウイルスで考えたこと。B…
  3. E5DxwzVgVHYHr411581668296_1581668370
    わたしは公家ではありませんでした(多分)
  4. 1b8493ba94ff68762824c3c7274b3128-e1499313795652
    イオンの保存容器はジップロック超えた!?※主観的視点