さらに、タイトルタグやalt 属性など主要なコンテンツタグや属性に含まれる情報を処理します。Google は多種多様なコンテンツを処理しています。
ただし、HTML、PDF、Flash ファイルは処理していますが、Silverlight など他のリッチメディアフォーマットのクロールやインデックス登録には課題を残しています。
- サイトのインデックス登録の統計情報を確認する。この統計情報は、Google インデックスでサイトがどのように登録されているか表示します。
- サイトの構成を確認する。ほとんどの検索エンジンはテキストベースで処理を行います。つまり、クローラーは、画像ファイル、Flash 以外のほとんどのリッチ メディア ファイル、JavaScript が生成するページ、ログインの必要なページに含まれているテキストを読み取れません。テキストベースの解読可能なコンテンツにすれば、ユーザーやクローラーがアクセスしやすいサイトを作ることが出来ます。
0 件のコメント:
コメントを投稿