サイトの外部リンクのリンク切れを一括でチェックする

各記事ごとに外部リンク貼り付けていたりする場合が多いと思いますが、Web情報は流れていくのが早く、リンク切れなんて頻繁におこります。
3年経てば、サイトが閉鎖しているなんて、極あたりまえのことなんで、3年前に書いた記事をみるとリンク切れが多数みつかったりりする。

こういうリンク切れを放置しておくと、Googleの評価もよくないし、第一せっかく記事を見に来てくれた人が、リンクを踏んだのに404エラーとかだとガッカリしちゃうし、使えない情報載せているサイトだという印象になってしまうかもしれない。
こういうデメリットがあるので、リンク修正しなきゃとはわかっているけど、結構大変。1つずつ確認していくのが確実だとは思うけど、サイトが大きくなればなるほど本当に辛い。
定期的にやらなければならないんでしょうが、優先順位をどうしても低くしてしまいがちで、そのまま忘れてしまうパターンが多い。

めんどくせーっていう人。CMSを使ってなくてリンクに規則性がないサイトの人。内部リンクもリンク切れしてないか確認したい人とかは、リンクチェッカー(リンク切れチェックツール) dead-link-checker.com を使えばいいと思う。
トップページのURLを入力してチェックボタンを押すと、中規模サイトだと2~3時間くらいで結果がでてくるのでそれを元にすればいい。

いやいや、外部リンクのURLはリストで一覧であるんだよ。これだけをチェックしたいんだよって人。
僕がそうでした。CMS使っているので内部リンク切れはまず無いと自信あるし、サイト全体のリンク精査をさせるなんて膨大なページがあって、そんなに長時間チェックを待ってられない。
幸い、僕の場合は外部リンクをCMSのカスタムフィールドで固定入力にしていたので、その箇所から一覧で抽出できた。
なので、このURL一覧だけをリンク切れチェックさせたい。
昔は、CSVなどでURL一覧を読み込ませてチェックしてくれるツールなんかがVectorとかにいっぱいあったけど、Windows8ではもう動作しないものばかり。

さあどうしようか。と思いWebサービスツールで探してみたら、ありました。
W3Cリンクチェッカー

しかしローカルツールではないので、ちょっとめんどくさい作業がある。
URL一覧をハイパーリンク形式<a href="./"></a>に変えてhtmlで保存して、それをサーバーにアップロードしてから、そのページを読み込ますということをしなければならない。
でも、他によい方法がないので、僕はこれで運用しています。