作者:数字商圈 技术部

数据支持:黄浦数字商圈公司、Talkingdata


今年的外滩,没有灯光,也没有焰火。

而魔都著名的南京路步行街——也就是南京东路——的许多商家,则趁机喊出了元旦三天乐,新年不打烊的口号。

 

沉迷于网络剁手行动的学姐对此感到很诧异:这种活动会有人去吗?现在大家都在网购,谁还会新年大半夜去逛南京路啊?

 

正好我最近和黄浦区的某数据公司合作了一个研究,其中一些内容恰好可以回答这个问题。

 

新年逛南京路的都是什么人呢?

 

首先,我们初步地将“新年界定为20151231-201613日这四天,然从该数据合作机构调取了这四天南京东路步行街东西两个入口的人流统计数据样本。

可以看到,在这四天被统计的88个小时中(第一天从8点开始统计),步行街出入口逐小时的出现人数变化如下图所示:


商街大数据

 

从方向来看,从东入口(人民广场地铁站区域)进入南京路的游客比从西路口(南京东路地铁站区域)要多,而二者的人流变化则在时间上则呈现相同的趋势。

 

从时间和人数来看,南京路的游客在新年第一天的11日达到了顶峰,而随着游客兴趣逐日消减,13日的人数最少。

 

从具体时间上来看,除了1231日的高峰出现在晚上8点(大约是下班以后去逛街的吧)以外,元旦3天的客流最高峰都非常精准地出现在下午2点。

 

我们首先回答一个问题:这些来逛南京东路的,都是哪里人呢?

 

看到这里,也许你会说,这个问题还用数据来看吗?当然都是外地游客啦,阿拉上海人哪里会去南京路步行街?

 

呵呵,是吗?数据并不这么看。

 

我们将这88个小时的逛街客统计起来,通过第三方数据供应商查询了他们过去半年夜间最高频出现的地点,并将其所在省份定义为逛街客的居住来源地。最后筛选出了大约5w组样本,统计画出下图:


商街大数据

 

可以看到,新年四天期间,在我们统计到的样本中,南京东路上的外地游客只占4成而已。其他的6成,还是常住在本地的上海人(按照统计局口径,常住在上海半年以上的我们就可以定义为上海人)。

 

看来南京东路对上海人还是有很强的吸引力嘛。

 

不仅如此,假如聚焦跨年夜(我们将这一概念定为2015123118:00-2016115:59)的话,我们甚至可以从下图中看到更精准的现象:


商街大数据

 

我们把统计精度细化到每小时,可以看到:

 

在跨年前的傍晚时分,上海人的比例还维持在67%左右的正常水平,只有一个百分点的上下波动,但一旦接近午夜零点,上海人的比例便开始上升,在凌晨1点左右时达到了一个74%的小高峰后,之后略有回落,但在凌晨5点时则飙升至84%

 

因此,从数据上可以看到:虽然游客众多,但南京东路毫无疑问还是属于上海人的,并且而这一归属感在2016年的新年深夜中显得尤为稳定。

 

那么,在夜幕越来越深的步行街,外地游客已经大部分退散,仍在狂欢的那些人都是住在魔都哪里呢?看下图便知:


商街大数据

 

上图中颜色深浅代表样本分布的密度。总体而言,更多的仍是浦西的人前来跨年,其中老城区和虹桥地区的样本最多最密集;而浦东地区则相对较少,样本分布也更稀疏。但值得注意的是,尽管如此,居住在临港和金山的人也会不远万里地前来市中心跨年,这种不远万里的精神是不是非常值得钦佩呢?

 

再确定了南京东路跨年逛街人的地域来源之后,我们不妨来回答第二个问题:

 

这些新年还坚持来逛南京路的,是男还是女呢?

 

看到这里,也许你又会说,这个问题还用大数据来看吗?逛街的当然都是女生啊。

 

呵呵,是吗?数据也并不这么看。

 

与地域研究方法同样地,我们将筛选出的5w组样本统计起来,通过第三方大数据机构查询了他们的性别标签特征,可以得到下图:


商街大数据

 

没错,从我们的数据来看,游客中男女各占一半,真是相当的和谐!

 

这是不是意味着,逛街的都是情侣呢?这可识别不出来,万一人家是男男、女女之间的真爱呢?

 

但我们可以统计出他们的年龄分布,如下图:


商街大数据

 

可以看到,在被统计的样本当中,有处于26-35岁的年龄区间,排在第二第三位的36-45岁组和19-25岁组加起来也不过34%而已。果然,轻熟女/男才是逛南京东路的主力人群呀!

 

那么,具体到跨年夜呢?

 

筛选计算一下,即可得到下图:


商街大数据

 

可以看到,在跨年夜时,男女比例在前半场还保持着相对的稳定;但从22点开始,女性比例开始锐减,一直减至跨年后的凌晨3点,男性比例竟然达到了64%

 

毫无疑问,男女生在逛街持久力方面呈现出了明显的差异,貌似女生的夜间战斗力还是有限啊。

 

那么在年龄上呢?是年轻人更能逛吗?

 

从之前的分析中我们已经清楚,南京东路是轻熟女()的天下,由于不同年龄人口基数差异较大,各个时段的游客年龄的横向分布是几乎没有区别度的。因此,我们采用了各个年龄段人口数量与自己比较的方法来衡量,例如:

26-35岁游客在22点的分布比例=26-35岁游客在22点出现的人数/26-35岁游客在跨年夜出现的总人数。

 

由此,我们计算出不同时段不同年龄的逛街客的『浓度』。可见下图:


商街大数据

 

可以清楚地看到:

55岁以下的游客(包括了学生组、轻熟组以及中年组)在时间上的分布规律是类似的,从晚上89点开始,其『浓度』随时间逐渐降低。

55岁以上的游客(中老年组)的『浓度』则并不完全随着时间呈现线性规律,而是在0点时刻,出现了一个明显的高峰。

 

咦,跨年那一刻,中老年组逆袭了?

 

我们好奇地把这个组别的样本抽出单独统计了一下,发现了一个更有趣的现象:在0点的这一时刻,中老年组别的男女性别的比例仅为1:3

 

女性数量远超男性数量!也就是说,新年零点不仅是老年人的逆袭时刻,更是大妈们的逆袭时刻!

 

做完本次研究的最后结论,我不得不承认这个研究的最大的价值是发现了这样一个似乎显而易见但的确颠扑不破的真理,那就是:

 

永远不要低估大妈们逛街的战斗力。尤其是上海大妈。


数据来源说明:

数字商圈运营有限公司  大数据技术部 Van


商街大数据