王兴说过,我们已经进入到互联网的下半场。在上半场,也就是早期的互联网时代,你永远不知道在对面坐的是什么样的人。那个年代大部分人还是 QQ 的早期用户。
在下半场,互联网公司已经不新鲜了,大部分公司已经互联网化。他们已经在用网络进行产品宣传,使用电商销售自己的商品。这两年引领下半场发展的是那些在讲 “大数据”“赋能”的企业,他们有数据,有用户。
通过大数据告诉政府该如何智慧地管理交通,做城市规划。
通过消费数据分析,告诉企业该在什么时间生产什么产品,以最大化地满足用户的需求。
通过生活大数据告诉我们餐饮企业,甚至房地产企业该如何选址。
如果说互联网的上半场是粗狂运营,因为有流量红利不需要考虑细节。那么在下半场,精细化运营将是长久的主题。有数据,有数据分析能力才能让用户得到更好的体验。
所以,用户是根本,也是数据分析的出发点。假如你进入到一家卖羊肉串的餐饮公司,老板说现在竞争越来越激烈,要想做得好就要明白顾客喜欢什么。于是上班第一天,老板问你:“你能不能分析下用户数据,给咱们公司的业务做个赋能啊?”听到这,你会怎么想?你说:“老板啊,咱们是卖羊肉串的,做数据挖掘没用啊。”估计老板听后,晚上就把你给开了。那该怎么办呢?如果你感觉一头懵,没关系,我们今天就来讲讲怎么一步步分析用户数据。
用户画像的准则
首先就是将自己企业的用户画像做个白描,告诉他这些用户“都是谁”“从哪来”“要去哪”。你可以这么和老板说:“老板啊,用户画像建模是个系统的工程,我们要解决三个问题。
第一呢,就是用户从哪里来,这里我们需要统一标识用户 ID,方便我们对用户后续行为进行跟踪。我们要了解这些羊肉串的用户从哪里来,也就是所谓的用户来源渠道。他们是为了聚餐,还是自己吃宵夜,这些场景我们都要做统计分析。
第二呢,这些用户是谁?这里指的是 用户生日,职业,性别,年龄,收入等基本信息, 我们需要对这些用户进行标签化,方便我们对用户行为进行理解。
第三呢,就是用户要到哪里去?我们要将这些用户画像与我们的业务相关联,提升我们的转化率,或者降低我们的流失率。
”听到这,老板给你竖起了大拇指,说:“不错,都需要什么资源,随时找我就行。”
刚才说的这三个步骤,下面我一一给你做个梳理。
首先,为什么要设计唯一标识?用户唯一标识是整个用户画像的核心。
我们以一个 App 为例,它把“从用户开始使用 APP 到下单到售后整个所有的用户行为”进行串联,因为一个用户在这个APP中没操作一项,都可能会产生一条单独的数据,所以在后续的分析过程中,需要利用用户的唯一标识去抓数据,统计数据。这样就可以更好地去跟踪和分析一个用户的特征。
设计唯一标识可以从这些项中选择:用户名、注册手机号、联系人手机号、邮箱、设备号、CookieID 等。
其次,给用户打标签。
你可能会想,标签有很多,且不同的产品,标签的选择范围也不同,这么多的标签,怎样划分才能既方便记忆,又能保证用户画像的全面性呢?
这里我总结了八个字,叫“用户消费行为分析”。我们可以从这 4 个维度来进行标签划分。
用户标签:它包括了性别、年龄、地域、收入、学历、职业等。这些包括了用户的基础属性。
消费标签:消费习惯、购买意向、是否对促销敏感。这些统计分析用户的消费习惯。
行为标签:时间段、频次、时长、访问路径。这些是通过分析用户行为,来得到他们使用 App 的习惯。
内容分析:对用户平时浏览的内容,尤其是停留时间长、浏览次数多的内容进行分析,分析出用户对哪些内容感兴趣,比如,金融、娱乐、教育、体育、时尚、科技等。
可以说,用户画像是现实世界中的用户的数学建模,我们正是将海量数据进行标签化,来得到精准的用户画像,从而为企业更精准地解决问题。
最后,当你有了用户画像,可以为企业带来什么业务价值呢?
我们可以从用户生命周期的三个阶段来划分业务价值,包括:拉新、用户粘度和留存:
如何进行拉新,通过更精准的营销获取客户。
用户粘度:个性化推荐,搜索排序,场景运营等。
留存:流失率预测,分析关键节点降低流失率。
如果按照数据流处理的阶段来划分用户画像建模的过程,可以分为数据层、算法层和业务层。你会发现在不同的层,都需要打上不同的标签。
数据层指的是用户消费行为里的标签。我们可以打上“事实标签”,作为数据客观的记录。
算法层指的是透过这些行为算出的用户建模。我们可以打上“模型标签”,作为用户画像的分类标识。
业务层指的是获客、粘客、留客的手段。我们可以打上“预测标签”,作为业务关联的结果。
所以这个标签化的流程,就是通过数据层的“事实标签”,在算法层进行计算,打上“模型标签”的分类结果,最后指导业务层,得出“预测标签”。
美团外卖的用户画像该设计
刚才讲的是用户画像的三个阶段,以及每个阶段的准则。下面,我们来使用这些准则做个练习。
如果你是美团外卖的数据分析师,你该如何制定用户标识 ID,制定用户画像,以及基于用户画像可以做哪些业务关联?
首先,我们先回顾下美团外卖的产品背景。美团已经和大众点评进行了合并,因此在大众点评和美团外卖上都可以进行外卖下单。另外美团外卖针对的是高频 O2O 的场景,美团外卖是美团的核心产品,基本上有一半的市值都是由外卖撑起来的。基于用户画像实施的三个阶段,我们首先需要统一用户的唯一标识,那么究竟哪个字段可以作为用户标识呢?我们先看下美团和大众点评都是通过哪些方式登录的。
我们看到,美团采用的是手机号、微信、微博、美团账号的登录方式。大众点评采用的是手机号、微信、QQ、微博的登录方式。
这里面两个 APP 共同的登录方式都是手机号、微信和微博。那么究竟哪个可以作为用户的唯一标识呢?当然主要是以用户的注册手机号为标准。这样美团和大众点评的账号体系就可以相通。当然,大家知道在集团内部,各部门之间的协作,尤其是用户数据打通是非常困难的,尤其是多条产品线,在数据整合的过程中,会出现各种各样的数据格式问题,数据精度,数据的空值处理等。
所以这里建议,如果希望大数据对各个部门都能赋能,一定要在集团的战略高度上,尽早就在最开始的顶层架构上,将用户标识进行统一,这样在后续过程中才能实现用户数据的打通。然后我们思考下,有了用户,用户画像都可以统计到哪些标签。我们按照“用户消费行为分析”的准则来进行设计。
用户标签:性别、年龄、家乡、居住地、收货地址、婚姻、宝宝信息、通过何种渠道进行的注册。
消费标签:餐饮口味、消费均价、团购等级、预定使用等级、排队使用等级、外卖等级。
行为标签:点外卖时间段、使用频次、平均点餐用时、访问路径。
内容分析:基于用户平时浏览的内容进行统计,包括餐饮口味、优惠敏感度等。
当你有了“用户消费行为分析”的标签之后,你就可以更好地理解业务了。
- 比如一个经常买沙拉的人,一般很少吃夜宵。同样,一个经常吃夜宵的人,吃小龙虾的概率可能远高于其他人。这些结果都是通过数据挖掘中的关联分析得出的。有了这些数据,我们就可以预测用户的行为。
- 比如一个用户购买了“月子餐”后,更有可能购买婴儿水,同样婴儿相关的产品比如婴儿湿巾等的购买概率也会增大。
具体在业务层上,我们都可以基于标签产生哪些业务价值呢?
在拉新上,我们可以找到优势的宣传渠道,如何通过个性化的宣传手段,吸引有潜在需求的用户,并刺激其转化。
在用户粘度上,如何提升用户的单价和消费频次,方法可以包括购买后的个性化推荐、针对优质用户进行优质高价商品的推荐、以及重复购买,比如通过红包、优惠等方式激励对优惠敏感的人群,提升购买频次。
在留存上,预测用户是否可能会从平台上流失。在营销领域,关于用户留存有一个观点——如果将顾客流失率降低 5%,公司利润将提升 25%~85%。可以看出留存率是多么的重要。用户流失可能会包括多种情况,比如用户体验、竞争对手、需求变化等,通过预测用户的流失率可以大幅降低用户留存的运营成本。
锻炼自己的抽象能力,将繁杂的事务简单化上面我们讲到的“用户消费行为标签”都是基于一般情况考虑的,除此之外,用户的行为也会随着营销的节奏产生异常值,比如双十一的时候,如果商家都在促销就会产生突发的大量订单。因此在做用户画像的时候,还要考虑到异常值的处理。总之,数据量是庞大的,会存在各种各样的使用情况。
光是分析 EB 级别的大数据,我们就要花很长的时间。但我们的最终目的不是处理这些数据,而是理解、使用这些数据挖掘的结果。
对数据的标签化能让我们快速理解一个用户,一个商品,乃至一个视频内容的特征,从而方便我们去理解和使用数据。对数据的标签化其实考验的是我们的抽象能力,在日常工作中,我们也要锻炼自己的抽象能力,它可以让我们很快地将一个繁杂的事物简单化,不仅方便理解,还有益后续的使用。
我们今天讲了用户画像的流程,其中很重要的一个步骤就是给用户打标签,那么你不妨想想,如果给羊肉串连锁店进行用户画像分析,都可以从哪些角度进行标签化?最后,我们从现实生活中出发,打开你的手机,翻翻看你的微信通讯录,分析下你的朋友圈,都有哪些用户画像?如果你来给它设计标签,都有哪些种类需要统计呢。为了方便后续使用,你是如何将他们归类分组的?
关于朋友圈的用户画像,我们按照 “用户消费行为习惯” 来设定标签的话,大体可以参考如下:
- 用户标签:用户性别、用户年龄、用户所处位置、用户家乡、用户学历、用户角色、用户来源渠道
- 消费标签:朋友圈广告点击情况、用户参与活动、使用小程序的类型
- 行为标签:朋友圈发布频次、朋友圈可见设置、朋友圈点赞次数、朋友圈评论次数、朋友圈文字浏览次数、朋友圈权限设置
- 内容分析:浏览文字类型、文字转发类型