用户画像简述

2019/07/24 大数据

这里整合网络上关于用户画像的文章,所有引用都在参考文献,如有侵权,联系必删

用户画像的作用与意义

用户画像承载了两个业务目标: 一、如何准确的了解现有用户; 二、如何在茫茫人海中通过广告营销获取类似画像特征的新用户。比如在了解用户的基础上明确产品定位,“投其所好”;获取一个新用户/新订单;售前的精准营销、售中的个性化推荐匹配,以及售后的增值服务等。

用户画像数据定义

用户画像是根据用户社会属性、生活习惯和消费行为等信息/数据而抽象出的一个标签化的用户模型。

核心:贴“标签”

用数据来描述人的行为和特征,用通过对用户信息分析而来的高度精炼的特征标识(标签)从不同的维度来表达一个人,是对现实世界中用户的数学建模,是数据策略的基石。从数据结构角度而言,用户画像是一个(用户,标签列表)二元组

几个关键技术点

IDMapping

将这些原始ID聚集关联到真实用户上,将之和多渠道信息、多渠道的产品打通,这其中横跨了数据治理、数据整合、业务打通等几个难点

简而言之,多平台用户ID关联

打标签

用户标签是表达人的基本属性、行为倾向、兴趣偏好等某一个维度的数据标识,它是一种相关性很强的关键字,可以简洁的描述和分类人群。

标签建模

属性标签

比如自然属性标签里的性别、年龄、星座等,社会属性里的职业、社交、出生地、电话号码等

img

img

属性标签涉及用户隐私,并且存在很多乱填的情况,这块的研究比较多,后续陆续会加入别人的研究成果。

用户画像之用户性别识别

事实标签

比如购买行为、位置包括常驻地出差地等、使用设备、社交属性等,这类一般都可以直接从日志中直接提取,加以简单的聚类算法辅助即可。

营销标签

这块比较偏业务属性了,往往带有明确的业务目标建模而成的,比如LTV用户价值、活跃度、忠诚度、兴趣爱好、白领、高奢、有房一族、购买偏好等。

预测标签

比如之前提到的性别,其实在大部分场景下也属于一个预测标签,一般而言,我们需要一定的数据挖掘算法,集合用户日志提取APP特征、事件特征、浏览内容特征,对非结构化数据来说,通常要经历“分词”、“过滤”和“特征提取”三个步骤。另外一块是数据建模,选用合适的算法训练数据,比如到底是分类还是聚类,朴素贝叶斯,逻辑回归,SVM,神经网络哪一个合适?在模型的优化过程中,调参优化是非常重要的一步,在调参优化过程中我们通常会遇到过拟合,样本不均等情况,从整个业界来看,整体模型也差不太多,能拉开差距的基本还是对数据的理解和数据处理上,再举个例子:咱们要打个大学生标签,那么有哪些思路?基于 LBS 数据?APP 关联数据比如特殊APP/四六级、考研、超级课程表?

标签体系

img

img

按数据的实效性来看,标签可分为

  • 静态属性标签。长期甚至永远都不会发生改变。比如性别,出生日期,这些数据都是既定的事实,几乎不会改变。
  • 动态属性标签。存在有效期,需要定期地更新,保证标签的有效性。比如用户的购买力,用户的活跃情况。

从数据提取维度来看,标签数据又可以分为类型。

  • 事实标签。既定事实,从原始数据中提取。比如通过用户设置获取性别,通过实名认证获取生日,星座等信息。
  • 模型标签。没有对应数据,需要定义规则,建立模型来计算得出标签实例。比如支付偏好度。
  • 预测标签。参考已有事实数据,来预测用户的行为或偏好。比如用户a的历史购物行为与群体A相似,使用协同过滤算法,预测用户a也会喜欢某件物品。 0A2C436A-ADC2-4D59-B3EC-02A69A8E0809.png

数据采集与工程研发

img

img

参考文章

用户画像从入门到挖坑

用户标签实践:如何建立标签体系实现精准营销?

47页PPT,用户画像架构、指标标签、ETL性能及案例一站通

外卖O2O的用户画像实践

用户画像-概述与简介

神策数据杜明翰:打造趁手、好用的标签&用户画像系统

Search

    Table of Contents