業界の最新動向をチェック

エリアマーケティングラボ

ノウハウ

売上予測に必要なデータとは? 店舗開発で押さえるべきデータ一覧 売上予測はデータで決まる

2026/04/17

コラムカバー

AIやエクセルを用いた予測手法は別コラムで解説しましたが、手法がどれほど高度でも、入力データの質が低ければ結果は信頼できません。分析には「GIGO(ゴミを入れればゴミが出る)」という言葉がある通り、売上予測の精度はモデル選び以上に「どのデータを使うか」に大きく依存します

本コラムでは、予測の基盤となる「内部データ」とGIS等を活用した「外部データ」の整理術、およびこれらを統合して「経験や勘」から脱却するための具体策を解説します。戦略的な店舗開発の第一歩として、ぜひお役立てください。

「売上予測」徹底解説シリーズ(全5回)


モデルよりもデータが重要な理由

店舗開発における売上予測の目的は、単に数値を当てることではなく、投資判断における「確信」を得ることにあります。

高精度な予測モデルを構築するためには、アルゴリズムの選定以上に、「売上がなぜ変動するのか」を説明できるデータを適切に収集・加工することが重要です。

データの重要性イメージ

例えば、ある店舗の売上が好調な理由が、「近隣に大型マンションが建設されたため」なのか、「競合店が撤退したため」なのか、あるいは「店長の接客力が高いため」なのかによって、意味合いは大きく異なります。

これらの要因をデータとして分解し、AIや統計モデルに正しく学習させなければ、新規出店の売上を予測することはできません。 予測精度が上がらない主な原因は、モデルの問題よりも、「需要を適切に表現できるデータが不足している」点にあるケースが多いのです。




必須データ(内部データ)

まず整理すべきは、自社が保有する「内部データ」です。これらは予測モデルにおける「目的変数(予測対象)」および、店舗ごとの特性を表す「説明変数」として重要な役割を果たします。

内部データイメージ

売上・客数・客単価

予測の基盤となるのは、既存店の実績データです。

● POSデータ:日次・時間帯別の売上、客数、客単価
● カテゴリー別売上:飲食店であればランチ・ディナー別、小売店であれば主要カテゴリー別の売上構成
● トレンド情報:開業からの経過月数や直近の売上推移

特に重要なのが「時間帯別データ」です。例えばオフィス街の店舗では、日次合計だけでは昼間に集中する需要を把握できず、適切な店舗規模の判断を誤る可能性があります。


店舗属性(面積・業態など)

同じ立地条件でも、店舗の仕様によって売上は大きく変わります。これらを「店舗属性データ」として整理します。

● 物理的特性:売場面積、間口の広さ、看板の視認性、駐車場台数
● 運営特性:営業時間、定休日、デリバリー対応の有無、イートイン席数
● 周辺環境(定性):道路の入りやすさ、信号の有無など

これらは単なる数値として扱うだけでなく、「席あたり売上」などの効率指標に変換することで、モデル精度の向上につながる場合があります




外部データ(商圏データ/ GEO DATA)

自社データだけでは、「なぜその立地で売れるのか」という外部要因を説明できません。そこで、GIS(地理情報システム)を活用し、外部データ(GEO DATA)を統合することが重要になります。

外部データイメージ

夜間人口・昼間人口・商業人口など

商圏のポテンシャルを把握する基本データです。

夜間人口:居住者数、年齢構成、世帯構成
昼間人口:通勤・通学による滞在者数(オフィス街・学生街で重要)
商業人口:いわゆる買い物人口
将来推計人口:5〜10年後の成長性や衰退リスクの把握


競合店舗情報

売上は商圏内の需要の取り合いによって決まります。競合を考慮しない予測は、過大評価になりやすい傾向があります。

● 競合の位置・規模:店舗数、距離、売場面積
● ハフモデル:距離と店舗規模から来店確率(吸引力)を算出

ハフモデルを活用することで、単なる人口ではなく、より実態に近い需要を捉えることができます。


人流データ

近年、予測精度を大きく向上させているのが、人流データです。

● 動態分析:通行量や駅利用者数の変化
● 属性分析:来訪者の居住地や勤務地
● 鮮度:リアルタイムに近いデータ更新

人流データを組み込むことで、従来の統計データのみの場合と比べ、予測精度が大きく改善されるケースも多くあります。




データの組み合わせ方

収集した内部・外部データは、「店舗ID」をキーにして統合し、1つのデータセットとして整理することで分析可能になります。

データ組み合わせイメージ

多変量分析の考え方

売上(y)を複数の要因(x₁, x₂, …)で説明する構造を構築します。

y = ax₁ + bx₂ + cx₃ + … + 定数

例えばコンビニの売上を予測する場合、「周辺人口」「競合数」「立地条件」「人流」などを組み合わせ、それぞれの影響度を算出します。



GISとの連携

これらのデータを手作業で収集・加工するのは現実的ではありません。
MarketAnalyzer® 5THE NOVELのようなGISを活用すれば、任意の地点を指定するだけで、必要な商圏データを一括取得し、分析に適した形式に加工することが可能になります。




よくある課題と対策

データ活用の現場では、「不完全なデータ」を前提に進める必要があります。

課題と対策イメージ

データが揃わない

「既存店データが分散している」「競合情報が不明」といった状況は珍しくありません。

対策としては、すべてのデータを最初から揃えようとせず、「店舗ID・住所・売上」の最低限の項目から始め、段階的にデータを拡張していく方法が有効です。 不足データは推計や現地調査で補完します。


精度が出ない理由

データが揃っていても精度が出ない場合、以下の要因が考えられます。

● データが古い(市場変化を反映できていない)
● サンプルが偏っている(異なる業態・立地を混在させている)
● 外れ値を処理していない(一時的な売上増減が影響)

店舗特性ごとに分類(クラスター化)し、適切なデータセットで分析することが重要です。




まとめ

まとめイメージ

売上予測の精度は、「どのモデルを使うか」よりも「どのデータを使うか」に大きく依存します。

● 内部データで店舗の実力を把握する
● 外部データで立地のポテンシャルを測定する
● GISでこれらを統合し、相関の高い要因を特定する


「経験や勘」に依存した出店判断から脱却する第一歩は、自社にとっての「売上を左右するデータ一覧」を整理することです。



■ 次に読むべき記事
データをフル活用し、高精度な予測を実現する手法として注目されているのがAIです。
「 売上予測×AIで出店判断はどう変わる? 店舗開発の精度を高める最新手法」を読む

■ 関連記事
・売上予測における回帰分析の使い方
・売上予測はエクセルでどこまでできる?







監修者プロフィール

市川 史祥

技研商事インターナショナル株式会社
執行役員CMO シニアコンサルタント 市川 史祥

一般社団法人LBMA Japan 理事
ロケーションプライバシーコンサルタント
流通経済大学客員講師/共栄大学客員講師
統計士/医療経営士/介護福祉経営士
Google AI Essentials/Google Prompt Essentials

市川 史祥

1972年東京生まれ。早稲田大学政治経済学部卒業。不動産業、出版社を経て2002年より技研商事インターナショナルに所属。 小売・飲食・メーカー・サービス業などのクライアントへGIS(地図情報システム)の運用支援・エリアマーケティング支援を行っている。わかりやすいセミナーが定評。年間講演実績90回以上。

電話によるお問い合わせ先:03-5362-3955(受付時間/9:30~18:00 ※土日祝祭日を除く)
Webによるお問い合わせ先:https://www.giken.co.jp/contact/

人気のコラム

キャンペーン
期間限定無償提供キャンペーン