はてなブログの「サイトマップのURL」の確認の仕方【XMLサイトマップ】

  • 投稿 : 2015-05-26

XMLサイトマップ

ブログのTOPのURL/sitemap_index.xml

現状はこれです。

調べ方など

ブログtop/robots.txt
http://staff.hatenablog.com/robots.txt

User-agent: *
Sitemap: http://staff.hatenablog.com/sitemap_index.xml
Disallow: /api/
Disallow: /draft/

Google Search Console(旧:ウェブマスターツール)に登録するサイトマップのURLの調べ方ですが、ブラウザのアドレスバーに「ブログtop/robots.txt」と入力すると、上記ようなものが表示されるかと思います。

上記は、「はてなブログ開発ブログ」です。
ツールに登録するのは「sitemap_index.xml」になります。

たぶん、昔のはてなブログから変更になってると思います。公式のどこかに情報が書いてあるか少し探してみましたが見当たりませんでした。まあ、上記の方法で確実に分かるので、不安な人はこの方法で調べてそのURLを登録してください。

昔は、「sitemap.xml」となっていて、今でもこれで登録しても問題ないサイトもあるようですが、動作が不安定になりがちなので理由がない限り辞めた方がよいでしょう。

実際に、sitemap.xmlでアクセスしても、sitemap_index.xmlと同じ内容が表示されるわけですが、

<sitemapindex xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
<sitemap>
<loc>http://staff.hatenablog.com/sitemap.xml?page=1</loc>
<lastmod>2014-09-05</lastmod>
</sitemap>
<sitemap>
<loc>http://staff.hatenablog.com/sitemap.xml?page=2</loc>
<lastmod>2014-09-05</lastmod>
</sitemap>
<sitemap>
<loc>http://staff.hatenablog.com/sitemap.xml?page=3</loc>
<lastmod>2014-09-05</lastmod>
</sitemap>
<sitemap>
<loc>http://staff.hatenablog.com/sitemap.xml?page=4</loc>
<lastmod>2014-09-05</lastmod>
</sitemap>
</sitemapindex>

中身がこうなっていて、
sitemap.xmlが内部で?page付きで使われているので、どうもサイトマップURL自身に「sitemap.xml」を使用すると、Google Search Consoleのほうがうまく処理してくれない感じになるようです。

参考

再送信して少し経てばステータスが戻るのですが、数日おきに保留中になるので、その都度再送信を続けていました。
はてなブログのサイトマップは「sitemap_index.xml」だった件 - いつもマイナーチェンジ!

「sitemap.xml」で登録すると、多くの場合は上記のようになるかと思う。
スポンサーリンク