大資料與商業分析課後感想

之前已有的選址辦法建立在固定的選址相關理論或者專家經驗的基礎上。近年來,隨著大資料技術的不斷髮展和智慧城市研究的不斷深入,我們手上可以利用的資料不斷增多,包括地鐵、計程車、交通設施、人流量組成的地理時空大資料、基於使用者的長期位置和POI(興趣點,Point of Interest)相關資料、地區發展繁榮程度,競爭店鋪分佈情況等等。

大資料與商業分析課後感想

在家電產品門店選址的模型研究中,抽出的特徵數量並不是特別多,而且在人口因素,交通設施和競爭強度方面抽象出的特徵都十分具有代表性,特徵之間關聯度較低,相比較而言,在其他影響因素下我們選取POI特徵中,各POI之間關聯度較強,且以往的研究成果表面,人口數量與結構,消費者交通狀況以及商業氛圍對於家電產品門店選址問題影響較大,我們針對其他因素中的所有POI進行特徵選擇,以減少冗餘特徵,提高模型預測準確率。

目前主要的演算法有以下三種:

一、GBRT:gradient bossting regression tree,梯度迴歸樹演算法;

二、SVM:support vector machine,支援向量機演算法;

三、RFC:random forest classifier,隨機森林分類器演算法。

通過以上三種機器學習演算法對候選區域進行分類預測,並採用多種評估指標組成相對全面的評估方案。根據實踐經驗,RFC演算法最適合應用於選址模型,目前廣泛用於連鎖品牌店鋪的選址。

目前,針對店鋪選址的大資料應用研究相對來說還是較少的,其原因在於實際的應用中涉及到的影響因素過多,包括區域的商業氛圍,政府政策等等,且對於不同商品和服務型別的門店,影響其選址的決定因素也不盡相同。近年來隨著大資料技術的不斷髮展和智慧城市建設的推進,我們可以利用的資料越來越多,地鐵、計程車等相關交通資料,這些資料動態的反應了研究區域的人流情況與繁盛程度,同時結合地區交通設施分佈情況,競爭店鋪分佈情況,針對這些影響提取多個特徵,並對抽象特徵進行選取標籤,再分別利用機器學習演算法對研究物件進預測。

在案例研究中主要從商家盈利角度對店鋪選址問題進行了研究,沒有加入房屋租金、盈利資料等因素,在未來的研究中可以考慮不同角度和更多因素。