データ分析(Python × GA4) / 2026.01.13

はじめに:データ分析って、結局なにをすること?


「データ分析の本質」を解説するアイキャッチ画像。散乱する数字(データ)が、レンズを通すことで「分類・比較・意味の抽出」という3ステップで整列し、進むべき道(矢印)に変わる様子をイメージ。

「今月、売上が落ちました」「PVが減りました」
ここまでは誰でも言えます。けれど、それだけでは次の行動が決まりません。

データ分析が役に立つのは、数字を見て“反省”するためではなく、何が原因で、次に何を打つべきかを決めるためです。

この記事では、仮想のコンビニ売上データを使って、

  • 分類(内訳を作る)
  • 比較(差を作る)
  • 意味の抽出(原因として言葉にする)

を一連で体感します。ここまでできて、はじめて「分析した」と言えます。


1 データ分析の定義:分類→比較→意味の抽出

データ分析の3ステップ全体像。1.分類(内訳を作りデータを整理)、2.比較(期間や属性で差を浮き彫りにする)、3.意味の抽出(差の原因を言語化し次の打ち手へ繋げる)という、分析の定義と流れを解説する概念図。

データ分析を一言でいうと、次の3ステップです。

  1. 分類:同じもの同士をまとめる(内訳を作る)
  2. 比較:差を作る(先月 vs 今月、A店 vs B店)
  3. 意味の抽出:差の原因を“言葉”にして次のアクションへつなげる

大事なのは3つ目の「意味の抽出」です。
分類と比較だけだと、まだ“集計”の範囲で止まりがちです。


2 “分析”と“集計”の違い(最初に線引きする)

データ活用の習熟度を示す階段図。レベル0「感想(増えた/減った)」、レベル1「集計(表やグラフ化)」、レベル2「比較(差を見つける)」、レベル3「意味の抽出(原因の言語化=分析)」の4段階を示し、単なる集計で終わらず分析まで到達する必要性を説明。

ここで、線引きをはっきりさせます。

  • 集計:数字を出す(事実の提示)
    例)今月の売上は90万円でした
  • 比較:差を見つける(変化の発見)
    例)先月より10万円下がりました
  • 分析:差の原因を説明し、次の行動に繋げる(意味の抽出)
    例)売上低下の7割は「飲料」の落ち込み。棚縮小とキャンペーン終了が影響していそう。来月は棚復旧+販促再開を検討。

本記事の合格ラインはこれです。

「売上低下の主因カテゴリが言える」+「なぜそう言えるかを言語化できる」=分析


3 仮想データを用意しよう(今回の題材:コンビニ売上)

データ分析練習用の仮想データ表。カテゴリ(食品・雑貨・衣類・家電)ごとの「先月売上」と「今月売上」を並べ、最下部に合計行を設けた比較表のサンプル。

今回の前提はシンプルです。

  • 期間:先月と今月
  • 指標:売上(円)
  • 切り口:カテゴリ(弁当、飲料…)

3-1 仮想データ(先月・今月の売上)

カテゴリ先月売上今月売上
弁当・惣菜300,000320,000
飲料250,000180,000
お菓子180,000170,000
日用品120,000115,000
コーヒー90,00085,000
その他60,00030,000
合計1,000,000900,000

まず言えるのは「合計が10万円減った」という事実です。
でも、これだけでは何も決まりません。ここからが本番です。


3-2 Step1:分類(カテゴリ別に“同じもの同士”を並べる)

分類の目的は、原因を“切り分け可能な形”にすることです。

今回の分類軸は「カテゴリ」ですが、現場では他にも分類軸があります。

  • 時間帯(朝・昼・夜)
  • 曜日(平日・休日)
  • 客層(学生・会社員)
  • 購入点数(まとめ買い・単品)

ただし最初の練習としては、カテゴリ分類が一番わかりやすく、差が出やすいのでおすすめです。


3-3 Step2:比較(先月 vs 今月で“差”を作る)

売上データの比較表。先月と今月の数値に加え、計算した「差分」と「変化率」の列を追加。特に売上が減少しているカテゴリのマイナス数値を赤字と下向き矢印で強調し、比較のポイントを可視化しています。

比較では、最低限この2つを出します。

  • 差分:今月 − 先月
  • 変化率:(今月 − 先月)÷ 先月

差分と変化率を追加

カテゴリ先月今月差分(今-先)変化率
弁当・惣菜300,000320,000+20,000+6.67%
飲料250,000180,000-70,000-28.00%
お菓子180,000170,000-10,000-5.56%
日用品120,000115,000-5,000-4.17%
コーヒー90,00085,000-5,000-5.56%
その他60,00030,000-30,000-50.00%
合計1,000,000900,000-100,000-10.00%

ここまで来ると、「飲料が大きく落ちている」「その他も落ち幅が大きい」が見えてきます。
でも、まだ“分析”ではありません。

ここでよくある罠

  • 変化率が大きい(例:-50%)=重要、とは限りません
    母数が小さいと、率は大きく見えがちです。

だから次は、「全体の減少にどれだけ効いているか」を出します。


3-4 Step3:意味の抽出(原因カテゴリを“意味”として言語化)

売上減少の主因を特定する寄与度ランキング図。全体差分に対するカテゴリ別の影響度を横棒グラフで示し、最も影響の大きかった「飲料カテゴリ」に「売上減少の主因」というラベルを付与して、分析の結論を可視化しています。

意味の抽出では、次の順で進めると迷いません。

  1. 全体の差分(今回は -100,000円)を確認
  2. 各カテゴリの差分が、全体差分の何%か(寄与度)を見る

寄与度(全体-10万円にどれだけ効いているか)

寄与度=(各カテゴリ差分)÷(全体差分)

全体差分は -100,000円 なので、次のようになります。

カテゴリ差分寄与度
弁当・惣菜+20,000-20%(減少を打ち消した)
飲料-70,00070%
お菓子-10,00010%
日用品-5,0005%
コーヒー-5,0005%
その他-30,00030%
合計-100,000100%

ここで、ようやく“原因として言える形”になります。

  • 主因:飲料(寄与度70%)
  • 副因:その他(寄与度30%)
  • 弁当は増えており、全体の減少を一部打ち消している

3-5 「意味」を文章にする(分析文テンプレ)

ここからが“分析”の肝です。
数字を、誰でも読める言葉に変換します。

分析文テンプレ(そのまま使ってOK)

全体は(増減)した。内訳を見ると(最も影響した要因)は(差分・寄与度)で、全体の変化の中心になっている。背景として(仮説)が考えられる。次は(確認すべき追加データ)を見て、(打ち手)を検討する。

3-6 今回の結論(例)

今月の売上は先月比で10万円減(-10%)。内訳では飲料が-7万円で、売上減少の70%を占めるため主因と考えられる。次にその他が-3万円(寄与度30%)で副因。弁当は+2万円で減少を一部打ち消している。背景として、飲料棚の縮小・キャンペーン終了・気温低下による需要減が仮説として考えられる。次は飲料の在庫/欠品/棚面積/販促有無を確認し、棚復旧や販促再開を検討する。

このレベルまで落とし込めたら、もう「分析した」と言ってよいです。


4 ここまで到達して初めて“分析”と呼べる(線引きの明文化)

最後に、レベル分けで整理します。

  • レベル0:感想
    「落ちた、やばい」
  • レベル1:集計
    「今月は90万円」
  • レベル2:比較
    「先月より-10万円」
  • レベル3:意味の抽出(分析)
    「飲料が-7万円で全体減の70%を占める。背景仮説は○○。次は○○を確認し、○○を打つ」

データ分析道場の合格ラインはレベル3です。
数字を“言葉にして”、次の行動まで繋げることが条件です。


5 Webマーケに置き換えるとどうなる?(GA4に接続)

コンビニの売上分析とGA4のデータ分析の対応表。カテゴリ分類をチャネルやランディングページ(LP)分析へ、先月比較を期間比較機能へ、寄与度の特定をコンバージョン(CV)減少要因の特定へと置き換え、分析のステップがWebマーケティング実務に直結することを説明。

コンビニ売上の話は、GA4でもほぼ同じ構造です。

分類(ディメンションの切り口)

  • チャネル(Organic / Paid / SNS など)
  • 参照元(Source/Medium)
  • ランディングページ
  • デバイス(PC/スマホ)
  • 新規/リピーター

比較(差を作る)

  • 先月 vs 今月
  • 施策前 vs 施策後
  • 平日 vs 休日

意味の抽出(原因として言語化)

たとえば「CVが落ちた」とき、

  • 流入が減ったのか(セッション減)
  • 流入はあるが成約しないのか(CVR低下)
  • 特定LPだけ落ちているのか(LP別CVR)

を寄与度で切り分け、仮説と次の確認(ヒートマップ、フォーム離脱、検索意図ズレ)に繋げます。


まとめ:データ分析は「分類→比較→意味の抽出」

この記事の結論はこれです。

  • データ分析=分類→比較→意味の抽出
  • 「差がある」だけでは足りない
    “主因が何か”を寄与度で示し、言葉にして次の一手へが分析

宿題(3分でOK)

あなたの仕事で扱う「ログ」を1つ選び、書き出してください。

  1. 扱うログ:例)GA4の流入、LP別CV、広告クリック など
  2. 分類軸を3つ:例)チャネル/LP/デバイス
  3. 比較軸を1つ:例)先月 vs 今月

← 前の記事 次の記事 →