「正規表現」はプログラミングに使われる文字列のルール。
いろいろな文字列を一つの形式で表現するためのもので、覚えておくとGoogleアナリティクスでセグメントを作成するときやフィルタを使うときに役に立ちます。
正規表現には多くの種類がありますが、すべて覚えなくても大丈夫。その中でもGoogleアナリティクスでよく使う正規表現を7つご紹介します。
いずれかの条件(OR条件)
google|yahoo|bing
「|」はバーティカルバーと読み、条件とする文字列を「|」で区切るとOR条件になります。
上記の例では、URLに上記の「google」「yahoo」「bing」のいずれかの文字列が含まれているものを抽出できるようになります。
一部だけをOR条件にする
google(2019|2020)
「()」は括弧(かっこ)と読みます(それくらい知ってる! ですよね)
「()」で囲むとその語句内の一部だけを条件にできます。
上記の例では、OR条件と併用し、「google2019」または「google2020」が含まれるものを抽出条件にしています。
正規表現ではないことを示す(直後の正規表現記号をエスケープする)
google\.com
「\」はバックスラッシュと読みます。
「.」「/」「?」「-」はURLでよく使われますが、この記号、じつは正規表現として使われているため、そのままではデータ取得には使えません。
そこで直後の「.」「/」「?」「-」が正規表現ではないことを示すために「\」を使っています。
上記の例では直後の「.」を打ち消して、「google.com」という文字列で抽出条件を設定しています。
細かい例外はありますが、正規表現で何かのデータを取得するとき、条件に「.」「/」「?」「-」が入っている場合は、その前に「\」を入れると覚えましょう。
先頭を条件にする
「^」はハット、まはたキャレットと読みます。
これで「/google」という文字列が先頭にあるときのみ、データが抽出されます。(わかりづらいですが、上記の例では「\」で直後の正規表現「/」を打ち消しています)
たとえば
- google/content1.html
- list/google/html
この2つであれば、1.のみ抽出できるようになります。
末尾を条件にする
google\/$
「$」はドルと読み、直前の文字列が末尾にある場合に抽出できるようになります。
上記の例では「google/」という文字列が末尾にあるときのみ抽出されます。
- google/content1.html
- list/html/google
であれば、2.のみ抽出できるようになります。
特定の数値の範囲を条件にする
20[0–1][0–9]
「[]」は角括弧(かくかっこ)と読みます。「[」が始め角括弧で「]」が終わり角括弧です。
[X-Y]という書き方をすると、XとYの間の数値(XとYを含む)が抽出条件になります。
上記の例では、URLに2000から2019が含まれている文字列が抽出できるようになります。
特定の桁数の文字列を取得する
\d{2,}
(最後は少し、難しくなりましたね)
「{}」は中括弧(なかかっこ)で「{」が始め中括弧で、「}」が終わり中括弧です。
「\d」は=数値という条件になり、{2,}の部分が2桁以上ということになります。
たとえば、{2,8}であれば2桁〜8桁になり、{,5}であれば、5桁以下の数値を意味します。
また、dを大文字のDにすると数値ではなく文字を条件にすることができます。
チェックツールで正規表現を確認する
「正規表現」というくらいですから、正しく設定しないと取りたいデータの条件づけができません。
正しく設定できているかどうか不安なときはチェックツールを使って確認するようにしましょう。
下のチェッカーは無料で使えるので便利ですよ。
WEB ARCH LABO Tools(WEB開発サポートツール) https://weblabo.oscasierra.net/tools/regex/
使い方は簡単。設定したい正規表現と抽出したいURLを入れてチェックするだけです。条件とURLが一致するとURLの該当箇所がハイライトされます。
以上、Googleアナリティクスのデータ抽出でよく使う正規表現7つでした。これだけでもかなり役に立つと思います。
【無料レポート】「インターネット集客の教科書」
そんな怒りにも似た気持ちで、私はこのレポートを書きました。
いつも思うのは、 「インターネットを使えばもっと簡単にできるのに」ということ。
事実、見込み客だけでなく取引先や従業員まで、あなたのビジネスに関係 するすべての人をもっと簡単に集めることができます。それもあまりお金 をかけずに、です。
インターネットを使えば資金力のある大企業とだって戦えます。
というよりも、インターネットを使わないと勝負になりません。 潤沢な資金のある大企業があなたのテリトリーに攻め込んできら、まず 太刀打ちできないでしょう。