robots.txtファイルは、サイト内の特定のページが Googlebot などのウェブクローラ ソフトウェアにクロールされないようにするテキスト ファイルです。
このファイルは基本的には Allow や Disallow 等のコマンドで、コマンドでウェブクローラに URL の取得の可否を指示します。
robots.txt で許可されていない URL とそこにあるコンテンツは Google 検索の検索結果に表示されません。
robots.txt ファイルが必要な場合。
サイトに Google などの検索エンジンのインデックスに登録したくないコンテンツがある。
サイト全体が Google のインデックスに登録されるようにする場合は、robots.txt ファイルは作成しません。
サイトの中で Google のクローラがアクセスできるようになっている URL とアクセスできないようになっている URL を確認するには、robots.txt テスターで試す事が出来ます。
robots.txt の限界を理解する
robots.txt を作成する前に、URL をブロックする手段として robots.txt だけを使用した場合のリスクを理解しましょう。
robots.txtには限界がある為、他の方法を検討することが必要になる場合もあります。
非公開情報が安全であることを確認する
robots.txt ファイル内のコマンドは、どのクローラも従わなければならない規則ではありません。
あくまでガイドラインです。
Googlebot などのウェブクローラは robots.txt ファイルの指示に従いますが、他のクローラも従うとは限りません。
そのため、robots.txtで情報をブロックしても共有されてしまう可能性があります。
非公開情報のセキュリティを維持するには、サーバー上の非公開ファイルをパスワードで保護する方法など、他のブロック方法を利用します。
クローラごとに適切な構文を使用する
信頼できるウェブクローラは robots.txt ファイルのディレクティブに従います。
しかしウェブクローラによってはファイルのディレクティブを別の意味に解釈する可能性があります。各種のロボットに対応するには、適切な構文を知る必要があります。
ロボットによっては、一部の指示を理解しない可能性があります。
他のサイトにある自サイトの URL についてもクローラをブロックする
Google のクローラが robots.txt でブロックされているコンテンツをクロールしたりインデックスに登録したりすることはありません。
しかし、許可されていない URL についての情報をウェブ上の他の場所で検出してインデックスに登録する可能性があります。
その結果、URL アドレスや、場合によっては、サイトに対するリンクのアンカー テキスト等の公開情報が、Google 検索の検索結果に表示される可能性があります。
robots.txt と併せて、サーバー上のファイルをパスワードで保護する方法や HTML にメタタグを挿入する方法など複数使用することで、URL が確実に検索結果に表示されないようにすることができます。
東大阪在住。印刷系・通販系が得意です。半年で取得するPマーク導入支援、SNS・懸賞サイトを使った、ローコストSEO対策・コンバージョンアップ、会社を変えるISO9001、効果的なSPツール・プレミアムグッズ・景品等の解説をブログでおこなっています。 現在はお仕事の依頼を受け付けておりません。
analytics
このブログを検索
登録:
コメントの投稿 (Atom)
人気の投稿
-
フェイスブックにフォロワー機能があるのご存知ですよね。 友達申請はしなくても、その人の投稿等がタイムランに表示される機能です。 この機能ってね、結構ありがたく使ってます。 知り合いではない、でも、対象者の発言が気になる、良い、参考になる、勉強になる等々。 特に今、コミュ...
-
セッション ID や URL パラメータによって、同じコンテンツに複数の異なる URL からアクセスできる仕様にしている場合があります。 セッション ID とは URL パスの末尾に付けられる数字。 ID に対応するユーザー個人に合わせた内容のページを新たに作成するものです...
-
アメリカ大豆協会からお知らせがありました。 今後はアメリカ本国でプロモーション活動が行われます。 日本におけるソイシール(SOY INKマーク)の使用許諾契約業務を9月末日で終了。 商標登録有効期限は2011年4月末日まで。 ソイシールの使用は2011年9月頃まで...
-
文書の作成は、どのように手をつければいいか、なかなか分かりにくいものだと思います。 書店などには、文書の作成例や雛形等もあり、便利なのですが、あくまでも作成例であり、自分の組織にあっているとは限りません。 文書の形態は同じでも、組織の大小、業態により、多少なりとも中身が変化...
-
サイト運営者様のウェブサイト上で、広告が表示される場所です。
-
各学校でPTAの会議が始まっている頃ですね。 はじめての方、数回経験のある方、無理やり参加されている方。 色々な方がいらっしゃると思いますが、新年度スタートです。 はじめての本格的な会議で、ドキドキの方もいらっしゃるかも知れませんね。 議題としては、これからある協議会や...
-
facebook。 使っていらっしゃる方も多いのかな~っと思います。 facebookは基本実名登録(その後でニックネームの設定は出来ます)。 実名や自分の顔を載せたりしている人が多いので、距離感はぐっと縮まります。 また会社名なども公開している人が多いので、知っ...
-
この方法は、サイトのサーバーにアクセスできない場合に適している確認方法です。 メタ タグを追加してサイトを確認。 ウェブマスター ツールのホームで、該当するサイトの横にある 【サイトを管理】 ボタンをクリックしてから、【このサイトを確認】をクリックします。 ...
-
ISOを簡単に言ってしまうと、経営のツールです。 ISO9001を簡単に言うと、経営改善 ISO14001を簡単に言うと、環境改善 ISO27001を簡単に言うと、情報セキュリティ ISOをお荷物にしないで、正しく運用している会社・組織は、時間はかかりますが、経営...
-
規格の3.3.6は、計画書について記述されています。 規格の文面からも判る様に、計画書は教育と監査だけで必要になる物ではありません。 規格には 個人情報保護マネジメントシステムを確実に実施する為に必要な教育、監査等の計画を~~ とありますので、個人情報保護...
0 件のコメント:
コメントを投稿