![]() |
||||
![]() |
![]() |
![]() |
||
robots.txt を置くことで検索エンジンのインデックスに特定のページを登録されないようにしたり、サイトマップファイルをクローラーに教えてあげることが出来ます。
robots.txt 自体は拡張子から分かるとおり単なるテキストファイルなので、誰でも見ることが出来ますので、隠しページなどに使うと却ってみんなにばれてしまいます。
あくまでも検索エンジンのクローラーをコントロールするためだけに使用します。但し、必ず robots.txt に従うとは限りませんので、その点はご承知おき下さい。
以下のように記述し、ファイル名を「robots.txt」で保存します。
User-agent
対象の検索ロボットを指定します。
全てのロボットを対象にする場合は * (アスタリスク)にします。
特定のロボットだけを対象にする場合はロボット名を記述します。
例)User-agent: Googlebot
ロボット名は Database of Web Robots, Overview を参照して下さい。
Sitemap
サイトマップファイルがある場合はフルパスで指定します。
※ サイトマップページではなく、検索エンジン用の XML ファイルです。
「サイトマップメーカー Pro」で作成することが出来ます。
Disallow
インデックスしてほしくないページを指定します。
上記例の「Disallow: /figure/」は「figure」フォルダ以下全てを禁止する指定になります。
「Disallow: /figure/index.html」とすると、そのページのみ禁止する指定になります。
改行で複数指定することが出来ます。
必ずルートディレクトリに置きます。
ルートディレクトリというのはトップページと同じ場所になります。
このサイトで言うと「http://www.kanaya440.com/robots.txt」になります。