大数据与商业分析课后感想

之前已有的选址办法建立在固定的选址相关理论或者专家经验的基础上。近年来,随着大数据技术的不断发展和智慧城市研究的不断深入,我们手上可以利用的数据不断增多,包括地铁、出租车、交通设施、人流量组成的地理时空大数据、基于用户的长期位置和POI(兴趣点,Point of Interest)相关数据、地区发展繁荣程度,竞争店铺分布情况等等。

大数据与商业分析课后感想

在家电产品门店选址的模型研究中,抽出的特征数量并不是特别多,而且在人口因素,交通设施和竞争强度方面抽象出的特征都十分具有代表性,特征之间关联度较低,相比较而言,在其他影响因素下我们选取POI特征中,各POI之间关联度较强,且以往的研究成果表面,人口数量与结构,消费者交通状况以及商业氛围对于家电产品门店选址问题影响较大,我们针对其他因素中的所有POI进行特征选择,以减少冗余特征,提高模型预测准确率。

目前主要的算法有以下三种:

一、GBRT:gradient bossting regression tree,梯度回归树算法;

二、SVM:support vector machine,支持向量机算法;

三、RFC:random forest classifier,随机森林分类器算法。

通过以上三种机器学习算法对候选区域进行分类预测,并采用多种评估指标组成相对全面的评估方案。根据实践经验,RFC算法最适合应用于选址模型,目前广泛用于连锁品牌店铺的选址。

目前,针对店铺选址的大数据应用研究相对来说还是较少的,其原因在于实际的应用中涉及到的影响因素过多,包括区域的商业氛围,政府政策等等,且对于不同商品和服务类型的门店,影响其选址的决定因素也不尽相同。近年来随着大数据技术的不断发展和智慧城市建设的推进,我们可以利用的数据越来越多,地铁、出租车等相关交通数据,这些数据动态的反应了研究区域的人流情况与繁盛程度,同时结合地区交通设施分布情况,竞争店铺分布情况,针对这些影响提取多个特征,并对抽象特征进行选取标签,再分别利用机器学习算法对研究对象进预测。

在案例研究中主要从商家盈利角度对店铺选址问题进行了研究,没有加入房屋租金、盈利数据等因素,在未来的研究中可以考虑不同角度和更多因素。