サイトマップは、その名前の通りWEBサイト上の地図のことで、WEBサイト上のリンクが集約されたページ(やファイル)の事となります。サイトマップには種類があり、主にユーザー向けに使用される、【HTMLサイトマップ】そして、Googleなどのロボット型検索エンジン収集プログラムであるクローラー(Crawler)用に使用される【XMLサイトマップ】があります。
ここでは、【XMLサイトマップ】とXMLサイトマップが簡単につくるこができるワードプレスプラグイン「Google XML Sitemaps」の使い方を紹介していきます。
【HTMLサイトマップ】と【XMLサイトマップ】とは?
【HTMLサイトマップ】
HTMLサイトマップは、訪れているWEBサイトの内部リンクを視覚的に集約したものです。主に実際にWEBサイトに訪れるユーザーの利便性向上を目的として作成されます。特にページ数が多いWEBサイトや、階層の深いWEBページになってくると目的のページへ辿り着くにも一苦労だったりします。こういった場合、HTMLサイトマップがあれば目的のページにダイレクトに移動することができます。
また、内部リンクが特定のページにまとまっていることで、クローラーがWEBページを巡回しやすくなるメリットもあります。
【XMLサイトマップ】
XMLサイトマップは、ロボット型検索エンジン収集プログラムであるクローラー(Crawler)用に作成するサイトマップで、HTMLサイトマップとは違い実際にサイトに訪問するユーザーが使用するものではありません。
WEBクローラーは、膨大なWEBページのリンクを辿ってWEBページの情報を収集し必要に応じて自動的にWEBページを検索エンジンにインデックス登録していきます。インデックス登録されなければ、どんな優良なコンテンツであってもGoogleなどの検索エンジンでいくら検索をかけても人の目に触れることはありません。
クローラーは内部リンクが適切に設置されていれば、特に何もしなくても(XMLサイトマップを作らなくても)検索エンジンにインデックス登録を行ってくれますが、ページ数が異常に多いWEBサイトや、内部リンクが貼られていないページ等はインデックス登録から漏れてしまったり、登録までに時間がかかったりする場合があります。
XMLサイトマップを作成して、検索エンジンに知らせてあげることで、こいったインデックス登録に関する様々な問題を解決する手段の一つになります。
簡単にXMLサイトマップがつくれるプラグイン「Google XML Sitemaps」の導入方法と使い方
「Google XML Sitemaps」はその名の通りXMLサイトマップが作れるワードプレスのプラグインとなります。このプラグインは単純にXMLサイトマップ作るだけではなく、「検索エンジンに登録させたくない価値のないページへのnoindex設定」や、逆に「優先的にインデクス登録を促すインデックス登録の優先順位の設定」などインデックス登録に関わる様々な設定ができます。
「Google XML Sitemaps」の導入方法
ワードプレスのダッシュボードを開き「プラグイン」⇒プラグイン「新規追加」に進みます。
キーワード部分に「Google XML Sitemaps」を入れて検索をかけ、「今すぐインストール」を選択。インストールを終えると「有効化」が表示されるので、そのまま「有効化」を選択します。
以上で、「Google XML Sitemaps」の導入は完了です。次は「Google XML Sitemaps」の使い方と設定に移ります。
「Google XML Sitemaps」の使い方と設定
「Google XML Sitemaps」の有効化ができたら、「設定」⇒「XML Sitemaps」の順に進み「XML Sitemap Generator for WordPress」のページを開きます。
設定はデフォルトのままで使用可能なので特にさわるとこは無いと思います。上から順番に項目を確認していきます。
No registration required, but you can join the Google Webmaster Tools to check crawling statistics.
サイトの更新をGoogleに通知する。
Googleのウェブマスターツール(現在のGoogle Search Console)で統計情報を確認することができます。
チェックを入れておくことでXMLサイトマップが更新されるとGoogleに通知してくれまするのでチェックを入れておきましょう。
No registration required, but you can join the Bing Webmaster Tools to check crawling statistics.
サイトの更新をBing(MSN Live Search)に通知する。
Bing Webmaster Toolsで統計情報を確認することができます。
チェックを入れておくことでXMLサイトマップが更新されるとBing(MSN Live Search)に通知してくれまするのでチェックを入れておきましょう。
The virtual robots.txt generated by WordPress is used. A real robots.txt file must NOT exist in the site directory!
WordPressによって生成された仮想robots.txtが使用されます。実際のrobots.txtファイルは、サイトディレクトリに存在してはいけない。
サイトマップのURLをrobots.txtに記述します。robots.txtは、クローラーに収集されたくないコンテンツをクロールされないようにするプログラムです。不要なコンテンツをクロールさせないことで、重要なコンテンツがクロールされやくなるので、チェックを入れておきましょう。
Disable this option if you get garbled content or encoding errors in your sitemap.
要求元がサポートしている場合は、サイトマップを自動的に圧縮する。
サイトマップが圧縮され軽くなります。チェックを入れておきましょう
この設定は、XMLサイトマップに自動で追加されないURLを指定することでXMLサイトマップに追加させる設定です。例えばドメインがwww.foo.comで、サイトがwww.foo.com/siteにある場合、ホームページをwww.foo.comに含めることができます。基本的に設定することはありません。
投稿されている記事のクロールの優先度を選択します。運営するWEBサイトによって異なると思います。私が運営しているWEBサイトではコメント数とクロール優先度は比例しないので、一番上の「優先順位を自動的に計算しない」にチェックを入れています。
この設定は、XMLサイトマップに含めるコンテンツを選択していきます。全てをチェックを入れても良いかもしれませんが、アーカイブページや投稿者ページ、タグページ等は記載されている内容が重複する場合があるため、チェックをはずしています。
【最終更新時刻】は「非常に推奨」らしい・・・のでチェックをいれています。
この設定では、XMLサイトマップから除外するカテゴリーを選択します。基本的にチェックは入れる必要は無いと思いますが、クロールされてほしくないカテゴリーがある場合はチェックを入れておきましょう。
Change Frequenciesの設定では、【ホームページ】【投稿-個別記事】【固定ページ】【カテゴリー】【アーカイブ】【古いアーカイブ】【タグページ】【投稿者ページ】の更新頻度の目安を検索エンジンに通知します。メモに記載されている通り、あくまで目安を通知するだけなので、この設定によって劇的にクローラーの動きが変わるようなことはありません。
「Google XML Sitemaps」最後の設定です。
【ホームページ】【投稿-個別記事】【投稿優先度の最小値】【固定ページ】【カテゴリー】【アーカイブ】【タグページ】【投稿者ページ】のうち、クローラーにクロールしてほしいページの優先度を【1.0~0.0】の値で示します。数字が大きいほど優先度が高いということをクローラーに示すことができます。【Change Frequencies】の設定時と同様に目安なので、この設定でクローラーの挙動が大きく変化することはありません。
一通りの設定を終えたら、設定の更新を選択して設定は終了です。
Google Search ConsoleでXMLサイトマップを送信、登録する
「XMLサイトマップ」は作成するだけでは意味がありません。作成した「XMLサイトマップ」は検索エンジンに送信して「XMLサイトマップ」を登録する必要があります。Google Search ConsoleはGoogleのサービスになるので、Googleアカウントが必要になります。GoogleアカウントやGoogle Search Consoleについては、下記のページで紹介しているので、これらの設定がまだの方は記事を参考にGoogle Search ConsoleにWEBサイトの登録を済ませてください。
Google Search ConsoleはGoogle Analyticsと同様にホームページやブログを運営 …
XMLサイトマップのURLを確認してGoogle Search Consoleに送信する
まずは、送信するXMLサイトマップのURLを確認します。
基本的には、自分のWEBサイトURL+sitemap.xmlになっているはずです。当サイトの場合は、https://ryu-ku.net/sitemap.xmlとなっています。
確認方法は、ワードプレスのダッシュボードから「設定」⇒「XML-Sitemap」に進むと【pingの結果】の直下に表示されているはずです。
XMLサイトマップのURLを確認できたらGoogle Search Consoleに移動して、サイトマップを登録します。「Google Search Console」⇒「サイトマップ」に移動して、XMLサイトマップのURLを入力&送信すれば登録完了となります。