Honmushi blog
2019/01/07

GoogleSearchConsoleの「クロール済み-インデックス未登録」状態の対処

GoogleSearchConsoleを確認していて気づいたのですが、インデックス項目のカバレッジで「除外」となっているURLが多く存在してました。「エラー」や「警告あり」は0件です。

意図的に「noindex」の指定をしている箇所が「除外」になっているのであれば問題ないですが、件数的にそうではないようです。このままだと「除外」になっているページがgoogleの検索結果に表示されないので確認してみました。

結論を最初に言うと

推測になりますが、「インデックスして検索結果に表示するほどでないページ」とGoogleに判断されたため無視されたのではないかと考えられます。 コンテンツを書き直したり追記した後でもう一度クロールしてもらい「除外」状態が解決され、インデックスに登録されることを目指します。

対応方法としては、文字数を増やす、h2+h3などの見出しをしっかりつける、検索ワードを意識して増やす、といったことが簡単にできます。他にもサイト全体のコンテンツ量が増えれば、一つ一つの記事の価値も高く評価されます。諦めずにコンテンツの量と質を目指すことにしました。

【追記】上記の対応を行った後、2ヶ月後確認したところ「除外」状態が大きく減っていました。これらの対応の効果がありました。
「クロール済み-インデックス未登録」を解消するに記載しています。参考にどうぞ。

以下詳細な調査の内容です。

SearchConsoleを確認する

「有効」と同じくらい「除外」のページがありました。 除外になっているものは、Googleによってクロールされたが検索結果には出てこない状態です。望ましい状態ではありません。 意図的にnoindexをしている場合も「除外」に入るのですが、今回はnoindexの指定をしていないURLでも「除外」になっていました。

詳細の箇所には以下の2つの状態が表示されており、URLがどちらの状態なのか確認できます。

  • noindexタグによって除外されました
    noindexタグを設定しており意図的に除外している
  • クロール済み - インデックス未登録
    意図的ではなく除外されてしまった

クロール済み - インデックス未登録 の理由を調べる

上記の「クロール済み - インデックス未登録」の状態は意図した状態ではないので解決したいです。 インデックス未登録とされた原因を公式のドキュメントで調べてみました。

SeachConsoleヘルプ

ヘルプによると「除外」になる理由は以下でした。山盛りな上にイマイチピンとこないです。

  • noindexタグを設定している
  • ページ削除ツールによってブロックされている
    URL削除ツールを使ってURLのindexを削除した場合に該当します。今回私は行っていないので関係なかったです。
  • robots.txtによりブロック
  • 未承認のリクエストが原因
    401エラーが発生した場合です。ベーシック認証などが必要な画面で、クローラが認証を通れなかった場合に発生する状態です。
  • クロールエラー
    URL取得時に4xxまたは5xxのエラーが発生した場合です。
  • クロール済み - index未登録
    クロールはされたがインデックスには登録されていません。今後インデックスに登録される可能性がありますが、されない可能性もあります。
  • 検出 - インデックス未登録
    検出はされたが、クロールされていない状態です。サイトが高負荷だったなどの理由で、クロールの再スケジュールを行った場合です。
  • 代替ページ
    他のURLと内容が重複しており、すでに代替となるページがインデックス済みです。
  • ページが重複しています
    他のURLと内容が重複しており、どのページも正しいページと指定されていない状態です。
  • 非HTMLページの重複
    HTML以外のコンテンツ(PDFファイルなど)が別のページと重複しています。
  • ユーザーがマークしたページとは異なるページが正規ページとして選択されました
    別のページを正規ページとして判断しています。
  • 見つかりませんでした
    404エラーが返された場合です。
  • 法的申し立てによりページが削除されました
  • ページにリダイレクトがあります
    リダイレクトが発生したため、このURLはインデックスに登録されません。
  • クロールのキューに追加されました
    数日後にクロールされます。
  • ソフト404
  • 送信されたURLは削除済みです
    以前インデックスに登録されていたが、何らかの理由で削除されたものです。
  • 送信されたURLがcanonicalとして選択されていません
    他のURLと内容が重複していたため、他のページが正しいページとしてindexされています。

対応方法は情報の質を磨くこと

「クロール済み - index未登録」というズバリな項目があるのでこれが該当します。しかし、どう対処すればいいのかはわかりませんでした。放っておいたらいい、でもindexするかしないかはわからないという状態です。

いろいろ調べてみたところ、コンテンツが「indexするほどの情報ではない」と判断されて除外されているようです。ヘルプに書かれていないことなので確証はありませんが、それなら納得です。 対処法としては、記事のリライトや追記などをすることでインデックスしてくれるかもしれません。 または、サイト全体の評価が上がることでインデックスされやすくなります。

Googleの立場で考えてみれば、検索結果に有意義でない情報は表示したくないはずです。これを信じて自分の記事の情報のクオリティを磨くのが良さそうです。

「クロール済み - index未登録」になっているコンテンツについて、リライトしたり追記を行ったりしてインデックスされないか見守ろうと思います。

追記

後日確認したところ、「除外」状態が大きく減っていました。これらの対応の効果のようです。
「クロール済み-インデックス未登録」を解消するに記載しています。参考にどうぞ。

  • このエントリーをはてなブックマークに追加