「集計」と「分析」は何が違う?お弁当売上の例で理解する|データ分析道場 第2回
「先月より売上が落ちました」
ここまでは言えるのに、上司にこう返されて固まったことはありませんか?
- 「で、原因は?」
- 「何をすれば戻るの?」
- 「次に何を見ればいい?」
この“詰まる感じ”の正体は、集計はできても分析になっていないことが多いからです。
この記事では、コンビニの「弁当・飲料・雑誌」を例にして、
集計と分析の違いをストーリーと仮想データ+Pythonで体感します。
1 この記事のゴール
この記事を読み終えると、次のことができるようになります。
- 集計=「数字をまとめる」
- 分析=「数字に意味をつけて、次の行動を決める」
そして、会議で使える形で
- 「だから何が言えるか」
- 「次に何を見るか」
まで言えるようになります。
2 結論|「集計」と「分析」の違いは“次の意思決定”まで行けるか

2-1 集計とは(数字を並べる)
集計は、ざっくり言うと 数字の整理です。
- 合計
- 平均
- 件数
- カテゴリ別にまとめる
- 月別に表にする
例:
「先月と今月のカテゴリ別売上を表にしました」
これは正しいし大切です。
ただし、ここで止まると“分析”ではありません。
2-2 分析とは(意味づけして、次の一手を決める)
分析は、集計結果に対して次の流れで進めます。
- 差分を見る(何が変わった?)
- 原因を絞る(どれが効いてる?)
- 仮説を立てる(なぜ起きた?)
- 次に見るデータを決める(どう確かめる?)
- 打ち手につなぐ(何をする?)
つまり、分析は「数字」ではなく、意思決定がゴールです。
覚えやすい一言
- 集計:数字をまとめる
- 分析:数字に意味をつけて次の行動を決める
3 ストーリーで体感|上司と分析者の会話(弁当・飲料・雑誌)

ここからは、コンビニ店長(上司)と分析担当(あなた)の会話です。
同じデータでも、答え方で評価が変わります。
登場人物
- 上司:忙しい。結論と次のアクションが欲しい
- 分析者:数字を扱う。説明責任も担う
3-1 会話①:集計だけの回答(会議が止まる例)
分析者:「今月は先月より売上が落ちました。弁当が下がっています。」
上司:「どれくらい落ちたの?」
分析者:「弁当が…下がってます。」
上司:「他は?弁当が原因って言えるの?なぜ?対策は?」
分析者:「……(言えない)」
この状態は、“事実の報告”で止まっているだけです。
集計はできているけど、意思決定につながっていません。
3-2 会話②:分析的な回答(意思決定が進む例)
分析者:「全体売上は先月比で-19万円です。
内訳を見ると、弁当が-20万円で、減少のほとんどを占めます。飲料は-1万円、雑誌は+2万円です。」
上司:「つまり原因は弁当?」
分析者:「はい、まず“原因カテゴリは弁当”と言えます。
次に、弁当を商品別(新商品/定番)、値引き率、欠品で分けて、何が動いたか確認します。
仮説は『定番の欠品が増えた』か『新商品の当たり外れ』です。欠品ログと商品別売上を見に行きます。」
これが“分析”です。
原因の特定→仮説→次に見るものまで言えているので、会議が前に進みます。
4 集計だけの回答 vs 分析的な回答(同じデータで差が出る)
ここで、同じデータを2種類のアウトプットにします。
4-1 集計アウトプット(表にしただけ)
- 先月:弁当 120万、飲料 80万、雑誌 20万
- 今月:弁当 100万、飲料 79万、雑誌 22万
ここまでだと「へぇ」で終わります。
上司が欲しいのは次です。
4-2 分析アウトプット(差分・変化率・寄与まで)
- 差分(今月−先月)
- 弁当:-20万
- 飲料:-1万
- 雑誌:+2万
- 合計:-19万
- 変化率(差分÷先月)
- 弁当:-16.7%
- 飲料:-1.25%
- 雑誌:+10%
- 寄与(影響度)
- 全体-19万のうち、弁当-20万がほぼ全部
- 雑誌が+2万で少し“穴埋め”している
ここまで言えると、次の判断ができます。
- まずは弁当を深掘りすべき
- 飲料や雑誌に時間を使いすぎると効率が悪い
4-3 線引き:どこまでやって分析?
- 原因カテゴリ特定:分析の入口
- 「だから何が言えるか」「次に何を見るか」まで書いて初めて分析として成立
5 仮想データ+Pythonで体験する(集計→分析→示唆)
ここからは道場パートです。
“実務の流れそのまま”でやります。
- Step1:集計(表にする)
- Step2:分析(差分・変化率)
- Step3:原因カテゴリ特定(結論)
- Step4:示唆(だから何)
- Step5:次に見る(検証)
今回の仮想データ
| month | category | sales |
|---|---|---|
| 先月 | 弁当 | 1200000 |
| 先月 | 飲料 | 800000 |
| 先月 | 雑誌 | 200000 |
| 今月 | 弁当 | 1000000 |
| 今月 | 飲料 | 790000 |
| 今月 | 雑誌 | 220000 |
Step1:集計(カテゴリ別×月の表を作る)
import pandas as pd
data = [
{"month": "先月", "category": "弁当", "sales": 1200000},
{"month": "先月", "category": "飲料", "sales": 800000},
{"month": "先月", "category": "雑誌", "sales": 200000},
{"month": "今月", "category": "弁当", "sales": 1000000},
{"month": "今月", "category": "飲料", "sales": 790000},
{"month": "今月", "category": "雑誌", "sales": 220000},
]
df = pd.DataFrame(data)
# 集計:カテゴリ別×月の売上表
pivot = df.pivot_table(index="category", columns="month", values="sales", aggfunc="sum")
pivot
出力イメージ(集計表)
| category | 先月 | 今月 |
|---|---|---|
| 弁当 | 1200000 | 1000000 |
| 飲料 | 800000 | 790000 |
| 雑誌 | 200000 | 220000 |
ここまでが 集計です。
“整理”はできました。でも、まだ意思決定はできません。
Step2:分析(差分・変化率を出す)
result = pivot.copy()
# 差分(今月−先月)
result["差分"] = result["今月"] - result["先月"]
# 変化率(差分÷先月)
result["変化率"] = result["差分"] / result["先月"]
# 見やすくする(%表示用)
result
出力イメージ(分析表)
| category | 先月 | 今月 | 差分 | 変化率 |
|---|---|---|---|---|
| 弁当 | 1200000 | 1000000 | -200000 | -0.1667 |
| 飲料 | 800000 | 790000 | -10000 | -0.0125 |
| 雑誌 | 200000 | 220000 | +20000 | +0.10 |
この表になると、次が言えます。
- 一番効いているのは弁当(-20万、-16.7%)
- 飲料はほぼ横ばい
- 雑誌は伸びている
Step3:原因カテゴリを特定する(結論を一文にする)
全体差分を出して、寄与(影響度)を見ます。
total_diff = result["差分"].sum()
contribution = result["差分"] / total_diff
total_diff, contribution
全体差分は -190,000円。
寄与で見ると、弁当がほとんどを占めます。
結論(例)
全体売上は先月比-19万円。主因は弁当で、売上減の中心になっている。
この“原因カテゴリの特定”ができると、調査の優先順位が決まります。
Step4:「だから何が言えるか」(示唆=仮説を立てる)
ここが、集計と分析の最大の分かれ目です。
数字から言えることを、仮説として書きます。
弁当が落ちたときに疑うのは、だいたいこの4つです。
- 客数が減った(来店が減った)
- 客単価が下がった(買い物が小さくなった)
- 欠品が増えた(売りたくても売れない)
- 商品構成が外れた(新商品が弱い、定番が減った)
示唆(例)
弁当だけが大きく落ちているため、全体トレンドというより「弁当カテゴリ内の問題」が起きている可能性が高い。欠品や商品入替(新商品/定番)の影響が疑わしい。
ここで重要なのは、断定しないことです。
分析は当て物ではなく、検証のための仮説づくりです。
Step5:「次に何を見るか」まで書いて初めて分析(検証設計)

最後に、次の一手(次のデータ)を決めます。
これがないと「ふーん」で終わります。
弁当を深掘りするなら、次に見る候補はこのあたりです。
- 弁当の商品別売上(新商品/定番/季節)
- 値引き率・粗利(割引が増えた?利益は?)
- 欠品回数・発注数(売れ筋が切れてない?)
- 客数と客単価(来店が減ったのか、弁当を選ばなくなったのか)
- 曜日別(週末だけ落ちた、雨の日だけ落ちた)
次に見る(例)
次の確認は「弁当の商品別売上」と「欠品回数」。ここで“定番欠品”が見えれば発注改善へ、見えなければ“新商品不振”仮説で商品構成を見直す。
ここまで書けたら、もう立派に分析です。
6 現場テンプレ|分析コメントの型
会議やレポートで、そのまま使える形にします。
6-1 3行テンプレ(最短で通す)

- 何が起きたか:全体売上は先月比◯円(◯%)
- 原因は何か:主因は◯◯カテゴリで、全体差分の大半を占める
- 次に何を見るか:◯◯を△△(内訳)で分解し、□□(要因)を確認する
6-2 5行テンプレ(提案まで入れる)

- 事象(全体差分)
- 原因カテゴリ(寄与)
- 仮説(なぜ)
- 次に見る指標(検証)
- 暫定打ち手(次の一手)
7 よくある落とし穴(分析した“つもり”)
- 「弁当が落ちたので改善が必要」だけで終わる(抽象的で動けない)
- 金額だけ見て、変化率を見ない(影響の大きさを誤る)
- 原因カテゴリを絞らず、全部調べようとして疲れる(工数が爆発)
- 結論と仮説が混ざる(断定しすぎる/弱すぎる)
理解度チェック(実務版・3問)
問1:上司への口頭報告(原因カテゴリ特定+一言で結論)
あなたはコンビニ本部の週次ミーティングで、店長からこう聞かれました。
「今週、売上が落ちたって聞いた。結局どれが原因?」
週次のカテゴリ別売上(前年差ではなく先週比)は以下です。
- 全体:-190,000円
- 弁当:-200,000円
- 飲料:-10,000円
- 雑誌:+20,000円
質問(実務で求められる回答)
- 主因カテゴリはどれですか?
- 上司に30秒で伝えるなら、どう説明しますか?(2〜3文)
模範解答の方向性(例)
- 主因は弁当。全体の減少(-19万)のほぼ全てが弁当(-20万)で説明でき、雑誌の増(+2万)が一部相殺している。
- まず優先して深掘りすべきは弁当で、飲料は影響が小さい。
問2:カテゴリ規模が違うときの優先順位判断(変化率の使いどころ)
同じ店舗で、月次で下記の変化が出ました。
| カテゴリ | 先月 | 今月 | 差分 |
|---|---|---|---|
| 弁当 | 1,200,000 | 1,120,000 | -80,000 |
| 雑誌 | 200,000 | 160,000 | -40,000 |
店長がこう言いました。
「弁当の方が減額が大きいから、弁当だけ見ればいいよね?」
質問(実務で求められる判断)
- この判断は妥当ですか?理由を説明してください(変化率を使うこと)
- 優先して確認すべきカテゴリを“どちらか一つ”選ぶならどちらですか?(理由つき)
模範解答の方向性(例)
- 金額だけで決めるのは危険。雑誌は-40,000円でも母数が小さいので変化率が大きい可能性がある。
- 変化率で見ると、弁当は約-6.7%、雑誌は-20%。「異常度」は雑誌の方が高く、原因究明の優先順位が逆転し得る。
問3:次に見るべきデータ設計(“確認項目”を具体的に出す)
問1で「弁当が主因」と分かりました。上司から追加でこう指示されました。
「じゃあ、明日の午前中までに“なぜ弁当が落ちたか”を当たり付けたい。何を見ればいい?」
ただし制約があります。
- 見られるデータは、POSから出せる範囲(在庫・販売・値引き程度)
- 新しい調査やアンケートは不可
- 明日午前中まで(=深掘りは最大2つに絞る)
質問(実務で求められる回答)
弁当減少の原因を切り分けるために、次に見るデータ(切り口)を2つ挙げてください。
それぞれについて「何が分かるか」も1行で書いてください。
模範解答の方向性(例)
- ① 弁当の商品別売上(SKU別、定番/新商品):特定商品の落ち込みか、カテゴリ全体の落ち込みかを切り分けられる。
- ② 欠品回数(品切れ時間)または発注数・入荷数:売りたくても売れない“機会損失”が起きていないか確認できる。
(代替案:値引き率→需要の弱さ/廃棄圧、曜日別→週末だけ落ちた等)
まとめ|分析は「だから何」と「次に何を見るか」まで
- 集計は数字をまとめること(大事だが、意思決定には不足しがち)
- 分析は差分・変化率・寄与で原因を絞り、仮説と検証計画まで作ること
- 「だから何が言えるか」「次に何を見るか」まで書いて初めて分析
次回予告(第3回)
原因カテゴリが「弁当」と分かったあと、次にやるのは **分解(ドリルダウン)**です。
「商品別」「曜日別」「値引き」「欠品」「客数×客単価」など、現場で使う切り口を“型”として整理します。