[WP] WordPress/robots.txtの設定が不良で新版Google Search Consoleで”ブロックされている”と表示される件 [2019/08/24]

robots.txtの問題

自前のSynology NASにWordPressを立ち上げている場合で、SEO pluginにrobots.txtを設定しているにもかかわらず、Google Search Consoleでrobots.txtでブロックされている、と警告が出ていた。

この問題は、約半年の間冷やしたり、温めたりして、問題解決を素人なりに模索していました。

当サイトの場合、以下のアドレスを表示させるとrobots.txtの内容が確認できるらしい事がわかったので、以下のアドレスをChromeで表示してみました。

結果は、正にブロックされていることが分かりました。「Disallow: /」がそれです。ルート以下が許可されていませんでした。

https://harikiri.diskstation.me/robots.txt

User-agent: *
Disallow: /

ですが、当サイトでは、もう一つ下の階層”myblog”にblogを設置しているので、Chromeで以下のアドレスを表示してみたが、ファイルが無いと吐かれました。

注意

この記事を書いている時期は、サプディレクトの「myblog」以下にサイトを構築していました。2020/04現在では、Redirectionプラグインで、このサブディレクトは、必要なくなりました。
https://harikiri.diskstation.me/ でOKです。

https://harikiri.diskstation.me/myblog/robots.txt -> “ファイルがない、とのメッセージ”

以上の結果は、All in One SEOで設定した内容が、なぜか何処にも正しい設定内容で、且つ、正しいフォルダ位置に反映されていないという事です。

自前でrobots.txtを用意

仕方がないので、robots.txtを自前で用意して、今は分からない何処かのフォルダーに設置するこにしました。

1. アクセス権が正しい「robots.txt」雛形ファイルを作る

自前で保管する場合、心配になるのがアクセス権の設定です。この問題は、WordPress用のPluginであるYoast SEOを使用しましたた。robots.txtを記述して保管する機能があります。

その後、Yoast SEOは役割を終えましたので停止させました。

2. robots.txtを配置する

作成したrobots.txtは、ルート以下「/」と、サブディレクトリ以下「/myblog/」に作成した同じrobots.txtファイルを配置しました。後から不要な一方は削除する予定。

3. Googleにクロールさせる

色々ググってみると、旧版のGoogle Search Consoleなるものがあって(新版Google Search Consoleの左メニューの一番下に「以前のバージョンに戻す」があり、これが旧版)、そこには、左メニューに「クロール」-> robots.txtテスターなるものがあります。

これを使用して、以下、robots.txtの内容をGoogleに知らせることができます。更に、新版からインデックスできるように設定することができました。

インデックスの試行錯誤は、以下の試行錯誤を行いました。

4. robots.txtの解決

編集

以上のように、当サイトには2つのフォルダにrobots.txtが存在する状態で、以下の旧版Google Search Consoleを使用して問題解決を進めた。

旧版Google Search Consoleのrobotsテスターでテストする場合,実サイトには修正したrobots.txtを配置しているのに,再読み込みをしてくれない。よって,robotsテスターを実行しても、以前の内容のままなのでエラーになる。

そこで,旧版Google Search Console -> クロール -> robots.txt -> “robots.txtの内容が表示される”。この内容を直に編集する。横にあるリンク”公開済みのrobots.txtを表示する”で実サイトのrobots.txtの内容を表示できるので、この内容をコピぺしてもいい。

送信

その後、送信ボタンを押すと、ダイアログが表示される。以下の”3. Googleに更新リクエスト”について送信ボタンを押す。

1. 更新されたコードのダウンロード

2. アップロードされたバージョンを確認

3. Googleに更新をリクエスト

ダイアログの✖️でダイアログを消し、その下のテスト・ボタン(Googlebotを選択した状態)を押す -> テスト・ボタンは”許可済み”の表示となる。

5. URL検査

新版から”URL 検査”を実行すると,これまでは,15秒程度で”robots.txtがブロックしている”とのエラーが出ていたものが,今回の操作のあとは,検査の実行後に、その結果が返ってくるまでの時間が、明らかに伸びてインデックス処理をしている感触があった。その結果、以下のように、半年間進展がなかった懸案が、以下、表示されたように進展をみることができた。

新版Google Search Console -> URL検査 -> サイトのアドレスを入れて、実行

✅URLはGoogleに登録できますが、問題があります・・・”やっと登録できた。うれしい^^”

✅登録の可否 : URLはインデックスに登録できます・・・”やったぞ,やっとだ.やってやった”

その後、「インデックス登録をリクエスト」を実行した。しばらくすると、上記の表示は以下のように変化した。

✅URLはGoogleに登録されています。・・・”あはぁ”

✅カバレッジ: インデックスは登録されましたが、サイトマップに送信していません”・・・”もうすこしだ”

以上で,Robots.txt問題は,とりあえず次のステップへと進む.

to be continue.

編集履歴

2019/08/24 Mr.Harikir
2020/04/24 文言整備
2020/10/04 編集履歴追加 (読み返して、GoogleにIndexできたのが、2019/08/24であったことを思い出した。それまで6ヶ月は泣かず飛ばすで、誰も訪問者が来なかったことを思い出した)