SEO対策を意識した記事を書くためには、競合サイトの調査が不可欠です。たとえば、見出しタグやキーワードなどは、必ず調査する項目でしょう。
ただ、この調査の問題は、とても時間がかかることです。
そこで、役に立つのがWebスクレイピングという技術です。
ここでは、Webスクレイピングの技術を活用して、SEOコンテンツを作製する方法について解説していきます。
Webスクレイピングとは
Webスクレイピングとは、Webサイト上に溢れている情報の中から、特定の情報だけを抽出する技術です。
具体的には、複数のサイトを巡回して、指定されたHTML情報を入手するプログラムを作成するのです。
そして、プログラム言語には、良くPythonが使われています。
スクレイピング用ライブラリとして有名な「beautifulsoup」と相性が良いため、Pythonが良く選ばれているのです。
WebスクレイピングでSEO対策!
このWebスクレイピングの技術を使って、競合である上位サイトの調査を自動化できます。
この自動化できる、という点が大きなメリットなのです!
たとえば、見出しタグ(h2)をプログラムに指定することで、HTMLの「h2」の記載情報を一瞬で抜き出してくれるのです!
自分自身で調査すると、少なくとも記事全体に目をとおすため、時間がかかってしまいますよね。
Webスクレイピングで上位サイトから情報収集
それでは、実際にPythonのプログラムによって、Webスクレイピングを実施していきたいと思います。
取得できるHtml情報としては、「title」「meta descriptoin」「h1,h1」などが挙げられます。
ここでは、分かりやすくHtml「h2」タグの情報を抽出していきます。
以下が、Webスクレイピングのコードになります。
【サンプル】Webスクレイピング コード
①調査対象のサイトURLを指定する
まず、26行目の sc=Scr([“”]) に指定URLに入力します。
今回は、自社サイトのURLを入力しました。
②調査対象のHtml情報を入力する
次に、16行目の find_all(“”) に、取得したいhtml情報である「h2」を入力します。
③実行結果
プログラムを実行します。
そうすると、以下のように対象ページの「h2」情報だけが抽出されます。
このように、一瞬で対象ページの情報を抜き出すことができるのです!
WebスクレイピングでSEO対策を自動化
ここでは、Webスクレイピングの技術を使って、SEO対策における調査の自動化について紹介しました。
Pythonの詳細は他のサイトに譲りますが、複数の情報を自動でエクセルに抽出するようなことも可能です。
自動化できる作業はツールなどに任せて、可能なかぎり効率的にコンテンツを作成していきましょう!