データ分析(Python × GA4) / 2026.01.14

「集計」と「分析」は何が違う?お弁当売上の例で理解する|データ分析道場 第2回


「集計」と「分析」の違いをお弁当の売上を例に解説するアイキャッチ画像。単なる売上金額の合計(集計)から、おかずの内訳を比較し「なぜ売れたか」という理由(分析)を導き出すプロセスをイメージした、初心者にも分かりやすいデザイン。

「先月より売上が落ちました」
ここまでは言えるのに、上司にこう返されて固まったことはありませんか?

  • 「で、原因は?」
  • 「何をすれば戻るの?」
  • 「次に何を見ればいい?」

この“詰まる感じ”の正体は、集計はできても分析になっていないことが多いからです。

この記事では、コンビニの「弁当・飲料・雑誌」を例にして、
集計と分析の違いをストーリーと仮想データ+Pythonで体感します。


1 この記事のゴール

この記事を読み終えると、次のことができるようになります。

  • 集計=「数字をまとめる」
  • 分析=「数字に意味をつけて、次の行動を決める」

そして、会議で使える形で

  • 「だから何が言えるか」
  • 「次に何を見るか」

まで言えるようになります。


2 結論|「集計」と「分析」の違いは“次の意思決定”まで行けるか

「集計」と「分析」の違いを明確にする比較図。集計は合計や平均を出し「表にする作業」であるのに対し、分析は差分や寄与度から「原因を特定し、次の打ち手(仮説)を導き出す思考」であることを対比して説明しています。

2-1 集計とは(数字を並べる)

集計は、ざっくり言うと 数字の整理です。

  • 合計
  • 平均
  • 件数
  • カテゴリ別にまとめる
  • 月別に表にする

例:
「先月と今月のカテゴリ別売上を表にしました」

これは正しいし大切です。
ただし、ここで止まると“分析”ではありません。

2-2 分析とは(意味づけして、次の一手を決める)

分析は、集計結果に対して次の流れで進めます。

  1. 差分を見る(何が変わった?)
  2. 原因を絞る(どれが効いてる?)
  3. 仮説を立てる(なぜ起きた?)
  4. 次に見るデータを決める(どう確かめる?)
  5. 打ち手につなぐ(何をする?)

つまり、分析は「数字」ではなく、意思決定がゴールです。

覚えやすい一言

  • 集計:数字をまとめる
  • 分析:数字に意味をつけて次の行動を決める

3 ストーリーで体感|上司と分析者の会話(弁当・飲料・雑誌)

上司と部下の会話シーンの図解。コマ1では、部下が「売上が下がりました」と集計結果だけを報告し、上司に「で、原因は?」と突き返される。コマ2では、部下が「Aキャンペーンの不振が主因です」と分析結果を報告し、上司から次のアクション指示を得る様子を対比。

ここからは、コンビニ店長(上司)と分析担当(あなた)の会話です。
同じデータでも、答え方で評価が変わります。

登場人物

  • 上司:忙しい。結論と次のアクションが欲しい
  • 分析者:数字を扱う。説明責任も担う

3-1 会話①:集計だけの回答(会議が止まる例)

分析者:「今月は先月より売上が落ちました。弁当が下がっています。」
上司:「どれくらい落ちたの?」
分析者:「弁当が…下がってます。」
上司:「他は?弁当が原因って言えるの?なぜ?対策は?」
分析者:「……(言えない)」

この状態は、“事実の報告”で止まっているだけです。
集計はできているけど、意思決定につながっていません。


3-2 会話②:分析的な回答(意思決定が進む例)

分析者:「全体売上は先月比で-19万円です。
内訳を見ると、弁当が-20万円で、減少のほとんどを占めます。飲料は-1万円、雑誌は+2万円です。」

上司:「つまり原因は弁当?」
分析者:「はい、まず“原因カテゴリは弁当”と言えます。
次に、弁当を商品別(新商品/定番)、値引き率、欠品で分けて、何が動いたか確認します。
仮説は『定番の欠品が増えた』か『新商品の当たり外れ』です。欠品ログと商品別売上を見に行きます。」

これが“分析”です。
原因の特定→仮説→次に見るものまで言えているので、会議が前に進みます。


4 集計だけの回答 vs 分析的な回答(同じデータで差が出る)

ここで、同じデータを2種類のアウトプットにします。

4-1 集計アウトプット(表にしただけ)

  • 先月:弁当 120万、飲料 80万、雑誌 20万
  • 今月:弁当 100万、飲料 79万、雑誌 22万

ここまでだと「へぇ」で終わります。
上司が欲しいのは次です。

4-2 分析アウトプット(差分・変化率・寄与まで)

  • 差分(今月−先月)
    • 弁当:-20万
    • 飲料:-1万
    • 雑誌:+2万
    • 合計:-19万
  • 変化率(差分÷先月)
    • 弁当:-16.7%
    • 飲料:-1.25%
    • 雑誌:+10%
  • 寄与(影響度)
    • 全体-19万のうち、弁当-20万がほぼ全部
    • 雑誌が+2万で少し“穴埋め”している

ここまで言えると、次の判断ができます。

  • まずは弁当を深掘りすべき
  • 飲料や雑誌に時間を使いすぎると効率が悪い

4-3 線引き:どこまでやって分析?

  • 原因カテゴリ特定:分析の入口
  • 「だから何が言えるか」「次に何を見るか」まで書いて初めて分析として成立

5 仮想データ+Pythonで体験する(集計→分析→示唆)

ここからは道場パートです。
“実務の流れそのまま”でやります。

  • Step1:集計(表にする)
  • Step2:分析(差分・変化率)
  • Step3:原因カテゴリ特定(結論)
  • Step4:示唆(だから何)
  • Step5:次に見る(検証)

今回の仮想データ

monthcategorysales
先月弁当1200000
先月飲料800000
先月雑誌200000
今月弁当1000000
今月飲料790000
今月雑誌220000

Step1:集計(カテゴリ別×月の表を作る)

import pandas as pd

data = [
    {"month": "先月", "category": "弁当", "sales": 1200000},
    {"month": "先月", "category": "飲料", "sales": 800000},
    {"month": "先月", "category": "雑誌", "sales": 200000},
    {"month": "今月", "category": "弁当", "sales": 1000000},
    {"month": "今月", "category": "飲料", "sales": 790000},
    {"month": "今月", "category": "雑誌", "sales": 220000},
]

df = pd.DataFrame(data)

# 集計:カテゴリ別×月の売上表
pivot = df.pivot_table(index="category", columns="month", values="sales", aggfunc="sum")
pivot

出力イメージ(集計表)

category先月今月
弁当12000001000000
飲料800000790000
雑誌200000220000

ここまでが 集計です。
“整理”はできました。でも、まだ意思決定はできません。


Step2:分析(差分・変化率を出す)

result = pivot.copy()

# 差分(今月−先月)
result["差分"] = result["今月"] - result["先月"]

# 変化率(差分÷先月)
result["変化率"] = result["差分"] / result["先月"]

# 見やすくする(%表示用)
result

出力イメージ(分析表)

category先月今月差分変化率
弁当12000001000000-200000-0.1667
飲料800000790000-10000-0.0125
雑誌200000220000+20000+0.10

この表になると、次が言えます。

  • 一番効いているのは弁当(-20万、-16.7%)
  • 飲料はほぼ横ばい
  • 雑誌は伸びている

Step3:原因カテゴリを特定する(結論を一文にする)

全体差分を出して、寄与(影響度)を見ます。

total_diff = result["差分"].sum()
contribution = result["差分"] / total_diff

total_diff, contribution

全体差分は -190,000円
寄与で見ると、弁当がほとんどを占めます。

結論(例)

全体売上は先月比-19万円。主因は弁当で、売上減の中心になっている。

この“原因カテゴリの特定”ができると、調査の優先順位が決まります。


Step4:「だから何が言えるか」(示唆=仮説を立てる)

ここが、集計と分析の最大の分かれ目です。
数字から言えることを、仮説として書きます。

弁当が落ちたときに疑うのは、だいたいこの4つです。

  • 客数が減った(来店が減った)
  • 客単価が下がった(買い物が小さくなった)
  • 欠品が増えた(売りたくても売れない)
  • 商品構成が外れた(新商品が弱い、定番が減った)

示唆(例)

弁当だけが大きく落ちているため、全体トレンドというより「弁当カテゴリ内の問題」が起きている可能性が高い。欠品や商品入替(新商品/定番)の影響が疑わしい。

ここで重要なのは、断定しないことです。
分析は当て物ではなく、検証のための仮説づくりです。


Step5:「次に何を見るか」まで書いて初めて分析(検証設計)

「分析の完成条件」チェックリスト図。「差分と変化率の確認」「原因カテゴリの特定」「仮説の記述」「次に見るデータの明記」の5項目が並んでおり、これら全てを満たして初めて「分析が完了した」と言えることを示す。

最後に、次の一手(次のデータ)を決めます。
これがないと「ふーん」で終わります。

弁当を深掘りするなら、次に見る候補はこのあたりです。

  • 弁当の商品別売上(新商品/定番/季節)
  • 値引き率・粗利(割引が増えた?利益は?)
  • 欠品回数・発注数(売れ筋が切れてない?)
  • 客数と客単価(来店が減ったのか、弁当を選ばなくなったのか)
  • 曜日別(週末だけ落ちた、雨の日だけ落ちた)

次に見る(例)

次の確認は「弁当の商品別売上」と「欠品回数」。ここで“定番欠品”が見えれば発注改善へ、見えなければ“新商品不振”仮説で商品構成を見直す。

ここまで書けたら、もう立派に分析です。


6 現場テンプレ|分析コメントの型

会議やレポートで、そのまま使える形にします。

6-1 3行テンプレ(最短で通す)

データ分析結果をシンプルに伝える「3行テンプレ」のカード画像。「1. 事実」「2. 仮説」「3. 打ち手」のフレームワークで構成されており、クイックな報告やSNS投稿にそのまま転用できるデザイン。
  1. 何が起きたか:全体売上は先月比◯円(◯%)
  2. 原因は何か:主因は◯◯カテゴリで、全体差分の大半を占める
  3. 次に何を見るか:◯◯を△△(内訳)で分解し、□□(要因)を確認する

6-2 5行テンプレ(提案まで入れる)

データ分析を深掘りして伝える「5行テンプレ」のカード画像。「全体・内訳・主因・背景・次回」の5ステップで構成。数値を報告するだけでなく、ユーザー心理の変化や次回の調査方針まで言語化し、定例会議や詳細レポートに活用できるフレームワークを紹介。
  • 事象(全体差分)
  • 原因カテゴリ(寄与)
  • 仮説(なぜ)
  • 次に見る指標(検証)
  • 暫定打ち手(次の一手)

7 よくある落とし穴(分析した“つもり”)

  • 「弁当が落ちたので改善が必要」だけで終わる(抽象的で動けない)
  • 金額だけ見て、変化率を見ない(影響の大きさを誤る)
  • 原因カテゴリを絞らず、全部調べようとして疲れる(工数が爆発)
  • 結論と仮説が混ざる(断定しすぎる/弱すぎる)

理解度チェック(実務版・3問)

問1:上司への口頭報告(原因カテゴリ特定+一言で結論)

あなたはコンビニ本部の週次ミーティングで、店長からこう聞かれました。

「今週、売上が落ちたって聞いた。結局どれが原因?」

週次のカテゴリ別売上(前年差ではなく先週比)は以下です。

  • 全体:-190,000円
  • 弁当:-200,000円
  • 飲料:-10,000円
  • 雑誌:+20,000円

質問(実務で求められる回答)

  1. 主因カテゴリはどれですか?
  2. 上司に30秒で伝えるなら、どう説明しますか?(2〜3文)

模範解答の方向性(例)

  • 主因は弁当。全体の減少(-19万)のほぼ全てが弁当(-20万)で説明でき、雑誌の増(+2万)が一部相殺している。
  • まず優先して深掘りすべきは弁当で、飲料は影響が小さい。

問2:カテゴリ規模が違うときの優先順位判断(変化率の使いどころ)

同じ店舗で、月次で下記の変化が出ました。

カテゴリ先月今月差分
弁当1,200,0001,120,000-80,000
雑誌200,000160,000-40,000

店長がこう言いました。

「弁当の方が減額が大きいから、弁当だけ見ればいいよね?」

質問(実務で求められる判断)

  1. この判断は妥当ですか?理由を説明してください(変化率を使うこと)
  2. 優先して確認すべきカテゴリを“どちらか一つ”選ぶならどちらですか?(理由つき)

模範解答の方向性(例)

  • 金額だけで決めるのは危険。雑誌は-40,000円でも母数が小さいので変化率が大きい可能性がある。
  • 変化率で見ると、弁当は約-6.7%、雑誌は-20%。「異常度」は雑誌の方が高く、原因究明の優先順位が逆転し得る。

問3:次に見るべきデータ設計(“確認項目”を具体的に出す)

問1で「弁当が主因」と分かりました。上司から追加でこう指示されました。

「じゃあ、明日の午前中までに“なぜ弁当が落ちたか”を当たり付けたい。何を見ればいい?」

ただし制約があります。

  • 見られるデータは、POSから出せる範囲(在庫・販売・値引き程度)
  • 新しい調査やアンケートは不可
  • 明日午前中まで(=深掘りは最大2つに絞る)

質問(実務で求められる回答)
弁当減少の原因を切り分けるために、次に見るデータ(切り口)を2つ挙げてください。
それぞれについて「何が分かるか」も1行で書いてください。

模範解答の方向性(例)

  • 弁当の商品別売上(SKU別、定番/新商品):特定商品の落ち込みか、カテゴリ全体の落ち込みかを切り分けられる。
  • 欠品回数(品切れ時間)または発注数・入荷数:売りたくても売れない“機会損失”が起きていないか確認できる。
    (代替案:値引き率→需要の弱さ/廃棄圧、曜日別→週末だけ落ちた等)

まとめ|分析は「だから何」と「次に何を見るか」まで

  • 集計は数字をまとめること(大事だが、意思決定には不足しがち)
  • 分析は差分・変化率・寄与で原因を絞り、仮説と検証計画まで作ること
  • 「だから何が言えるか」「次に何を見るか」まで書いて初めて分析

次回予告(第3回)

原因カテゴリが「弁当」と分かったあと、次にやるのは **分解(ドリルダウン)**です。
「商品別」「曜日別」「値引き」「欠品」「客数×客単価」など、現場で使う切り口を“型”として整理します。


← 前の記事 次の記事 →