目的:過去データから、明日の商品数を予測し、仕入れ数を確定したい
曜日や気温によって来る客層が異なるので、その要因によって売り上げ数(ドリンク:スポーツドリンク、コーヒー)が異なるのではないだろうか?だとしたら、その曜日や気温によって、売り上げ数を予測しそこから、仕入れ数を合理的に決定していきたい。
1)要因分析する
曜日、気温、季節、湿度と売り上げ数について
相関分析を実施し、なにが関連があるかをざっと眺める。
■気温-出荷数の散布図
・麦茶/スポーツドリンクは、明らかに気温に対して依存性があり、相関係数も双方0.7以上となっている。
・缶コーヒーは、気温に対しての依存はほとんどなく、相関係数も0.27となっている。
⇒技術的ポイント:散布図の書き方、相関係数の算出方法
■曜日毎のヒストグラムを算出し、曜日ごとの偏りがないかどうかを確認する
・スポーツドリンクが、曜日を問わずになだらかなのに対して、缶コーヒーは、曜日に対しての依存が大きく、特に土日の出荷数が平日より減っていることが確認できる。
2)近似曲線にて、モデル化する
前項にて、麦茶/スポーツドリンクは、明らかに気温に対して依存性があり、相関関係があることが確認できた。
そこで、データ分析ツールを使用し、回帰分析を実施して、線形近似にて予測モデルを実施する
麦茶に関する予測モデルについてデータ分析結果より、回帰モデルを算出する
そもそも回帰分析とは回帰分析は過去のデータから
y = a + bx
という数式を見出す方法。
それぞれの要素は
y:目標とする数値(目標変数)⇒ 売り上げ数
x:説明変数 ⇒ 気温
a:切片 、b:傾き (ここでは、X値1)
とする。
よって麦茶に関する回帰式は
y(売り上げ数)=-12.918+65.077*x(最高気温)
となる。
同様にスポーツドリンクに関しての回帰式は
y(売り上げ数)=-1017.538+151.611*x(最高気温)
となる。
よって、明日10月2日に最高気温が27度と予測されているため、
xに27を代入してみると、下記の結果を得る。
※注意点:
今回の結果はあくまで6月から10月までのデータを用いて、算出した結果であるのでその期間外での予測は難しいと考えられる。
以上
コメント