業界の最新動向をチェック
エリアマーケティングラボ
ノウハウ
売上予測に必要なデータとは? 店舗開発で押さえるべきデータ一覧 売上予測はデータで決まる
2026/04/17
AIやエクセルを用いた予測手法は別コラムで解説しましたが、手法がどれほど高度でも、入力データの質が低ければ結果は信頼できません。分析には「GIGO(ゴミを入れればゴミが出る)」という言葉がある通り、売上予測の精度はモデル選び以上に「どのデータを使うか」に大きく依存します。
本コラムでは、予測の基盤となる「内部データ」とGIS等を活用した「外部データ」の整理術、およびこれらを統合して「経験や勘」から脱却するための具体策を解説します。戦略的な店舗開発の第一歩として、ぜひお役立てください。
目次
モデルよりもデータが重要な理由
店舗開発における売上予測の目的は、単に数値を当てることではなく、投資判断における「確信」を得ることにあります。
高精度な予測モデルを構築するためには、アルゴリズムの選定以上に、「売上がなぜ変動するのか」を説明できるデータを適切に収集・加工することが重要です。
例えば、ある店舗の売上が好調な理由が、「近隣に大型マンションが建設されたため」なのか、「競合店が撤退したため」なのか、あるいは「店長の接客力が高いため」なのかによって、意味合いは大きく異なります。
これらの要因をデータとして分解し、AIや統計モデルに正しく学習させなければ、新規出店の売上を予測することはできません。
予測精度が上がらない主な原因は、モデルの問題よりも、「需要を適切に表現できるデータが不足している」点にあるケースが多いのです。
必須データ(内部データ)
まず整理すべきは、自社が保有する「内部データ」です。これらは予測モデルにおける「目的変数(予測対象)」および、店舗ごとの特性を表す「説明変数」として重要な役割を果たします。
売上・客数・客単価
予測の基盤となるのは、既存店の実績データです。
● POSデータ:日次・時間帯別の売上、客数、客単価
● カテゴリー別売上:飲食店であればランチ・ディナー別、小売店であれば主要カテゴリー別の売上構成
● トレンド情報:開業からの経過月数や直近の売上推移
特に重要なのが「時間帯別データ」です。例えばオフィス街の店舗では、日次合計だけでは昼間に集中する需要を把握できず、適切な店舗規模の判断を誤る可能性があります。
店舗属性(面積・業態など)
同じ立地条件でも、店舗の仕様によって売上は大きく変わります。これらを「店舗属性データ」として整理します。
● 物理的特性:売場面積、間口の広さ、看板の視認性、駐車場台数
● 運営特性:営業時間、定休日、デリバリー対応の有無、イートイン席数
● 周辺環境(定性):道路の入りやすさ、信号の有無など
これらは単なる数値として扱うだけでなく、「席あたり売上」などの効率指標に変換することで、モデル精度の向上につながる場合があります。
外部データ(商圏データ/ GEO DATA)
自社データだけでは、「なぜその立地で売れるのか」という外部要因を説明できません。そこで、GIS(地理情報システム)を活用し、外部データ(GEO DATA)を統合することが重要になります。
夜間人口・昼間人口・商業人口など
商圏のポテンシャルを把握する基本データです。
夜間人口:居住者数、年齢構成、世帯構成
昼間人口:通勤・通学による滞在者数(オフィス街・学生街で重要)
商業人口:いわゆる買い物人口
将来推計人口:5〜10年後の成長性や衰退リスクの把握
競合店舗情報
売上は商圏内の需要の取り合いによって決まります。競合を考慮しない予測は、過大評価になりやすい傾向があります。
● 競合の位置・規模:店舗数、距離、売場面積
● ハフモデル:距離と店舗規模から来店確率(吸引力)を算出
ハフモデルを活用することで、単なる人口ではなく、より実態に近い需要を捉えることができます。
人流データ
近年、予測精度を大きく向上させているのが、人流データです。
● 動態分析:通行量や駅利用者数の変化
● 属性分析:来訪者の居住地や勤務地
● 鮮度:リアルタイムに近いデータ更新
人流データを組み込むことで、従来の統計データのみの場合と比べ、予測精度が大きく改善されるケースも多くあります。
データの組み合わせ方
収集した内部・外部データは、「店舗ID」をキーにして統合し、1つのデータセットとして整理することで分析可能になります。
多変量分析の考え方
売上(y)を複数の要因(x₁, x₂, …)で説明する構造を構築します。
例えばコンビニの売上を予測する場合、「周辺人口」「競合数」「立地条件」「人流」などを組み合わせ、それぞれの影響度を算出します。
GISとの連携
これらのデータを手作業で収集・加工するのは現実的ではありません。
MarketAnalyzer® 5やTHE NOVELのようなGISを活用すれば、任意の地点を指定するだけで、必要な商圏データを一括取得し、分析に適した形式に加工することが可能になります。
よくある課題と対策
データ活用の現場では、「不完全なデータ」を前提に進める必要があります。
データが揃わない
「既存店データが分散している」「競合情報が不明」といった状況は珍しくありません。
対策としては、すべてのデータを最初から揃えようとせず、「店舗ID・住所・売上」の最低限の項目から始め、段階的にデータを拡張していく方法が有効です。
不足データは推計や現地調査で補完します。
精度が出ない理由
データが揃っていても精度が出ない場合、以下の要因が考えられます。
● データが古い(市場変化を反映できていない)
● サンプルが偏っている(異なる業態・立地を混在させている)
● 外れ値を処理していない(一時的な売上増減が影響)
店舗特性ごとに分類(クラスター化)し、適切なデータセットで分析することが重要です。
まとめ
売上予測の精度は、「どのモデルを使うか」よりも「どのデータを使うか」に大きく依存します。
● 内部データで店舗の実力を把握する
● 外部データで立地のポテンシャルを測定する
● GISでこれらを統合し、相関の高い要因を特定する
「経験や勘」に依存した出店判断から脱却する第一歩は、自社にとっての「売上を左右するデータ一覧」を整理することです。
■ 次に読むべき記事
データをフル活用し、高精度な予測を実現する手法として注目されているのがAIです。
→「 売上予測×AIで出店判断はどう変わる? 店舗開発の精度を高める最新手法」を読む
■ 関連記事
・売上予測における回帰分析の使い方
・売上予測はエクセルでどこまでできる?
監修者プロフィール
市川 史祥
技研商事インターナショナル株式会社
執行役員CMO シニアコンサルタント 市川 史祥
一般社団法人LBMA Japan 理事
ロケーションプライバシーコンサルタント
流通経済大学客員講師/共栄大学客員講師
統計士/医療経営士/介護福祉経営士
Google AI Essentials/Google Prompt Essentials

1972年東京生まれ。早稲田大学政治経済学部卒業。不動産業、出版社を経て2002年より技研商事インターナショナルに所属。 小売・飲食・メーカー・サービス業などのクライアントへGIS(地図情報システム)の運用支援・エリアマーケティング支援を行っている。わかりやすいセミナーが定評。年間講演実績90回以上。
電話によるお問い合わせ先:03-5362-3955(受付時間/9:30~18:00 ※土日祝祭日を除く)
Webによるお問い合わせ先:https://www.giken.co.jp/contact/
人気のコラム

カテゴリー名
商勢圏(しょうせいけん)とは?店舗の枠を超えた「広域エリア支配」の考え方
- サービス
- MarketAnalyzer® 5
- 出店計画
- 店舗マーケティング
- 基礎知識
- 競合分析
2026/00/00

カテゴリー名
関係人口とは?その分析例と創出の戦略
- ニーズ
- MarketAnalyzer® Satellite
- 活用事例
- お役立ち情報
- インバウンド
- イベント分析
2026/00/00

カテゴリー名
【業界別】需要予測の実務事例|小売・飲食・製造で何が違うのか
- サービス・ニーズ
- KDDI Location Analyzer
- ジオターゲティング広告
- 屋外広告
- 商圏分析
- オルタナティブデータ
2026/00/00




