张宇:大数据驱动在线用户行为分析与营销


  • 来源:中国客户管理网
  • 时间:2015-12-17
  • 人气:524
  • 分类:大数据 互联网+

        12月10日,以“互联网+时代的数字化转型与服务创新”为主题的第六届中国客户管理大会暨中国客户管理创新论坛在京举行。本次论坛由中国客户管理网携手清华大学创业研究中心、中国互联网金融研究院、清华校友总会互联网和新媒体协会、清华大数据产业联合会、中国客户管理研究院以及金融客咖啡等知名企业联合发起。

        博晓通科技CEO张宇先生发表了《大数据驱动在线用户行为分析与营销》,以下为嘉宾发言实录:

        上午有很多专家都提到社交数据的运用,今天下午我从博晓通专注的领域专门介绍社交数据还可以提供什么价值。之前胡捷教授提到了基于社交数据做量化投资交易,这都是社交数据的应用。今天我分享的内容,首先会讲大数据主要源头,做前期的铺垫。大数据现在有很多种,有很多衍生出来的创业公司基于不同的数据资源在做不同的应用,尤其是今年更多的公司扎根在行业里解决具体的问题。这些数据来源主要是三类,物联网产生的数据跟传感器相关,来自于企业内部的数据,例如ERP等等,互联网上的社交数据、电商数据和新闻等数据,每种数据都有自己的特点和价值,所有这些数据不管价值是什么,最终都需要跟场景结合才有价值,如果只是单纯的从技术上做研究的话,它不跟场景结合最后就没法发挥它应有的价值。

        在这个时代数据量到底有多大、多多,后面有一个数字,到2015年,这是英特尔的一个研究,全球所有连接设备的总量相当于现在全球人口总数的2倍,我家里有三台工作用的电脑、2个平板、4个手机、小米盒子等等,这些都是连接的设备。

        互联网一分钟以内会发生哪些事情?全球整个互联网一分钟内会传输的数据总量是639TB,Facebook可有600万次访问,谷歌200万次搜索,大量搜索日志会被记录下来。YouTube一分钟会上传30小时视频,130万次观看,苹果应用会被下载4.7万次,推特会增加10万条内容,维基百科会新增6个词条。这些平台方便我们的生活,但对于今天在座的很多企业管理者有什么应用的价值?它到底能起什么作用?

        一个企业运作分四个基本环节,对应的数据在企业有四大应用场景,每个场景都有公司会专注地去解决问题,成为市场上的冠军。获取用户这个环节,常见的是市场营销分析领域的应用。二是做产品互动、产品设计,这也是非常常见的,现在工业4.0的技术,我们都把它归到这个环节,产品设计和制造。三是对销售整个环节的分析,具体客户的特点,各个环节怎么转化。四是史总他们公司更擅长更专注的领域,怎么做客户的分析,客户忠诚度和留存的分析。所有这些是大数据在企业用的场景。

        大家一直在抱怨企业没有数据,企业没有合适的人才,没有合适的经验,关于企业没有数据这个问题,我要讲一下企业其实有数据,每天都在产生,但是因为没有有效的筛选机制或技术手段,每天都在丢失,这是目前的主要问题。刚才开始的时候我介绍整个大数据分成三类,物联网数据、互联网数据、企业内部的数据,根据最近的研究结果,全球两千家企业的调研结构,一个领先的企业,现在做分析的数据来源有以下这些,包括电子邮件、日志数据、交易数据、社交数据等。我们专注于做社交媒体数据,因为社交媒体数据是互联网用户产生,主要来自于UGC的内容和用户自己注册的账号信息,这些数据是公开的、零散的,通过技术手段获取的,而且是可以通过云服务的其他模式去处理后,可以给大家共享。企业内部的数据,我自己看到未来的两到三年内很难放到云端做分析,大家有很多顾虑,而且我们也没有好的商业诚信体制,企业的数据像CRM、ERP更多的是私有部署或者其他的处理手段,甚至传统做项目。

        社交数据包含社交媒体、电商,所有这些数据都是在互联网上,它是可见的,它在特定的行业是绝对能产生深远影响的。它每天在源源不断的产生。刚才我们讲互联网数据够多、够大、够全,其实还有个问题现在这些数据都没有被连起来,如果只是单纯站在社交数据或者某一类数据来看问题的时候,视野总是有局限性的,当这些数据跟别的领域相互印证的时候,你就会对自己的判断更加有信心,我们有深刻体会。我们基于社交数据做竞品的分析。最终解决的是精准营销、数据洞察、用户推荐,用户画像。大家可以想象自己在购买一款家电的时候的主要行为,基本是在电商上看一下评价,最关心的就是负评,当你把所有的负评看完以后就决定是否购买哪一款产品。现在很多时候品牌被弱化了,大家到互联网搜一搜,看到新品牌,新产品的评价,看到很多人对它的背书,最后再看它的价格,直接就购买了,品牌留给大家的忠诚度、对质量的背书,逐渐被UGC这些内容在取代。我讲一个真实的故事,国家旅游研究院有一个研究,大家出境游的自助规划周期平均7到60天。而今年春节的时候家里人带着孩子去美国,原定去波士顿,后来因为波士顿大雪,我们时间不够,临时基于美国类似于大众点评、携程的应用,20天只花了两万多人民币(不含购物),既住了洲际酒店,也去了汽车旅馆,当然还有Airbnb这样的新选择,所有这些行程都是提前一天,每天花2个小时基于UGC中的攻略和用户评价决定的。我们在西雅图租了一个车,一直从北向南开,第二天的行程全是从社交数据里拿到的,哪一家酒店的价格更合适,哪一家餐厅在当地的性价比更好,哪一个景区的门票等等。通过这些数据,把以前很难的攻略压缩到7到60天,玩得很好。

        这些由用户产生的内容,在企业里到底有哪些应用场景,本质上作为客户发出的声音,传统做市场调研的公司基本也是专门处理VOC,今天社交数据作为新的数据资产,其实跟右侧这些场景都是息息相关的,做消费者研究和竞品研究,做行业趋势的预测,做品牌传播。很多人把我们公司当成一家舆情公司,我们不是舆情公司。虽然处理的都是互联网数据,互联网数据最早用在品牌传播分析上,做危机的预防,对行业的知识体系要求得比较少,只要知道危机怎么去预警、怎么去判断、怎么去干预就行了,比较容易形成成功案例,一直有这样的业务存在。舆情也是大数据应用。而社交数据有电商,有社交媒体,具体如微博、微信的公众号,朋友圈是拿不到的,还有贴吧这样的垂直论坛,新型的社交应用。某些特定的行业垂直论坛是有生命力的,比如在汽车领域,根据对真实车主的走访,75%的车主在购车前几个月内就会在垂直的这些论坛里去看,一直到什么时候会退出,也是有规律的,二保结束以后大部分会离开这些社群。从产生购车意图到二保结束期间,基本的用户产品评价、服务评价、常规保养内容和费用有了掌握就不活跃了,下次换车需求重新产生了,再次活跃。母婴也是这样,旅游因为朋友圈现在确实是拿不到,更偏向于在微博这样的平台。电商则对家电的影响特别明显。

        所有这些数据加工就跟工业时代加工矿产是一样的,勘探、采集、提炼、做处理做加工利用这样的过程,对数据来讲也有收集、计算、分析和解读这样一个步骤,包含这些环节,最后能产生的形式,一种是通过自动化分析的工具,最后形成右侧的仪表盘,一种是基于数据分析结果做成报告,这是国内目前的情况。

我们再看一下这种社交数据的处理,第一个环节就是收集,这个具体一些,互联网的一篇内容跟我们企业有什么关系,假如你是奔驰中国的CMO或者市场研究部门的同事,这是奔驰C级车车主的一个内容,把它拿过来做一个例子。这篇文章,左侧在讲用户的基本属性,可以把它当成结构化数据,这个人的名字、会员登记、身份、发帖的数量、注册时间、所在地域,这是他自己提及的在浙江温州,他关注的车型,他用的什么设备,其中还有个很重要的就是他的ID,这个社交ID也是跟其他的数据(比如运营商数据)作为打通时候的一个参考。上面是这篇文章的基本数据,在什么网页上,标题、对大家的影响力,有多少次点击,有多少人回帖。最后是对文章内容本身的文本信息,互联网上的多媒体视频、音频、文本,通过自然语言的处理,从这里可以看到他在考虑购买奔驰C的时候曾经还考虑过购买哪几款车型,对现在购买的车几个月以后主要的抱怨点,抱怨所处的故障部件,对自己的情绪表达,这就是从互联网先把海量的信息抓取回来,先把它结构化地做存储,才是下一步分析的基础。不同的厨师能做出不同的风格,即使一碗阳春面大家做出来的味道也不一样,分析师在我看来就是大厨,他更有艺术性,从什么角度入手来解决问题,而系统自动化的处理数据,即对基础素材的清洗切割,包含基本的常规分析和判断用户的情绪。这样的一篇篇文章,都得到了处理,将其中的规律提炼出来,就是社交大数据要做的工作。

        这是一个非常常见的定量分析,对整个文章中经常出现的高频的词进行一些统计,大家经常提及品牌的时候都会提及那些体育运动。前面那些基本工作做完以后再往下延伸的话,基于这些公开的数据,再基于定性,大家在表达这些内容时抱有的动机和目的,最后可以给人物做画像,因为现在市面上消费者画像有很多种方法,有基于移动设备的,有基于运营商数据的,这是基于消费者自己表达的内容做画像,最后可以定义出这个人可能是个中产阶层,是个积极的旅行者。我们每个人在上网的时候给我们的广告推荐都是已经下过单的内容,梅西百货要求用户用自己的社交账号登陆,第一可以运用现有的社交系统登陆系统,第二可以获取这些人的社交状态。这些就是把社交数据和电商平台的其他数据做结合的一些运用。

        这是一个案例,核心是一个比较有名的车企要做自己用户的画像,我们基于社交数据能给他什么?所有汽车论坛里的活跃用户,我们再跟电信运营商的数据做匹配,匹配上10%,给这些用户添加新维度的标签,他在线上是什么样的人,有什么特点,他在线下基于运营商的数据他们是什么人,有什么样的特点。

        关于营销与大数据的关系,互联网营销大概由这些模式构成,最主流的在我看来就是搜索广告,尤其像谷歌这样的平台,搜索广告在右边,对你来讲是没干扰的,当你自己有需求的时候才会进一步获取相关详细的信息,在我看来这是拉式的营销,当我需要的时候它才存在。但是我们每天接到的都是打进来的电话,短信,问我们要不要理财要不要贷款,都是推式的,即使原有的老客户转化率有20%高,但对那80%怎么办,接到这样的信息就是骚扰。国外内容营销的市场份额统计跟搜索广告在整体的盘子上不相上下,这是谷歌自己做的分析。内容营销更多的是拉式,通过口碑,通过大家的关系链在社交媒体上做扩散,我看到一篇好的文章,我会把它分享出去。在互联网上,上半年我分享最多的就是怎么给自己的女儿用爸爸旧的衬衣做一个裙子。河北有一个天路,号称中国66号公路,这就是微博时代大家用口碑推起来的新景点。微信朋友圈里有个古北水镇,是最近一年火起来的北京周边景区。所有这些营销方式都和内容有关,通过大家的在线评价、大家关注什么做更多的分析,才能创造有效的内容。

        大家基于社交数据分析的一个逻辑,在消费者产生内容里他提到了哪些品牌,提到了哪些产品,甚至哪些场景下他使用。他表达的情绪是喜欢还是厌恶还是保持中立,最后他注册的个人资料,这些经过加工和筛选之后可以知道大家在一个品牌上深入讨论的内容和角度是什么,他对一个品牌的态度是什么,这些人具有什么特点,他这样的人群在整个社交媒体上是什么状态。传统的社会学做一个社区、一个工厂,做几十人的访问,当时的实验做比较有局限性,但自从有了社交媒体以后很多社会学的研究都放到互联网上。这是我们做的事件传播扩散的一部分,如果用时间去复盘就可以发现当时这个新闻事件是怎么扩散的,早期的这些点对这个事件起到了什么作用,进而可以决定下次遇到这些节点的时候应该怎么处理,以前做的最早的分析,微博本来有很高的价值,当时我们做一个金融圈的内容为什么会传到文化圈,中间的关键人物是谁,把这两个圈的人连起来,这些人都是关键节点,通过他把两个圈子连接起来。这个例子是在社交媒体上所有提及华为手机的人他们都共同关注谁,这是我们当时做的一个实验,其中第一个关注的是华为官方,这个很正常,第二个是余承东先生,第三是雷军。你把这个筛选出来之后,你说找雷军给华为手机做一个代言不现实,第4个是周鸿祎,这也不现实,但往下走有安卓论坛,他们就可以有合作,这些就是意见领袖,他们是所有提及这个品牌的人共同关心的人,他们可以去做品牌扩散,也可以做竞品的拦截。

        这个是数据和内容营销有什么关系,我们自己总结了一些方法,我们会跟广告公司合作,通过数据分析,谁是你的目标人群,企业最常见的问题是品牌对外讲的内容不是用户关心的,做一个真实的例子,还是某车企的B型号车,对外讲的都是德国工艺,讲了很多这样的宣传,实际用户不讨论这些内容,是其他一些场景,这个讨论工艺的现象在A级车上很典型,是因为市场经理是做A级车很成功,后来负责B级车,他把旧有的思路带过来,其实你讲的东西是用户在互联网上不关心的。基于数据来做判断,哪些是专家,哪些是活跃用户,把这些用户请到一个QQ群、微信群里来,这个QQ群有我的产品经理加网络搜集的粉丝,再加上我的运维人员,大家可以就一个场景持续讨论,并改善产品,一些家电企业已经开始用了。

        社交媒体效果的衡量。刚才中午的时候在请教唐兴通老师,如何选择大号合作,合作一次五万、十万,更贵的三十万,影响人是谁,是我真实的那些用户吗?现在我们也在想有没有其他手段来丰富这些指标体系,如果大家有兴趣的话我愿意跟大家做更多的讨论,不同的社交媒体平台都有不同的数据特点,论坛博客、微博微信指标都是不一样的,当你想看社交媒体和电商表现的时候,你就要把所有这些数据都进行统一的处理和归类。讲述互动,不同的平台互动也代表不同的意思。

        社交媒体在我看来是一个很有意思的数据资产,因为人的应用它才持续不断的产生,但是它跟其他数据的结合,可以发挥它更大的价值。今天讲的是客户关系管理,未来企业真正的CRM应该结合所有这些数据,门店的数据、电商的数据、社交媒体用户账号所获得的信息,它的移动设备的信息,所有这些才是完整的用户360度的维度。

        企业有这样的数据资源对它进行处理的时候,它应该有这么多步骤,但是真正有价值的步骤不在于绿色部分,而在于蓝色部分,蓝色部分代表非技术团队对整个商业场景应该怎么把握思考的,虽然只占20%的时间,但有80%的价值。绿色部分,传统的情况下会占数据分析师80%的时间,但只有20%的价值,因为它是基础性工作。博晓通科技就是要把关于这部分的社交数据的分析自动化。

        我们是国内一家专注互联网数据和数据分析的公司,我们的口号是客户直接用这个平台,更重要的是今天面向在座的很多企业,我们把这个能力分享给很多合作伙伴,你们了解行业,擅长把握客户的需求,我们能提供数据,能提供技术分析工具,通过合作来做出新的数据应用。我的分享就到这里,谢谢大家!

        主持人:感谢张总,张总刚刚谈到的话题有非常多的地方启发了我,社交本身的核心是客户,用户,用户行为、用户声音,这些构成了社交平台,有非常多的数据在里边,博晓通科技就在一个专注于这个领域的公司,张总做得非常专业、非常专注,我自己也非常希望大家找机会跟张总合作,再次用掌声感谢张总的分享。


[上一篇] 周蕊:客户忠诚能力指标框架暨中国忠诚计划星级评价

[下一篇] 杨军:大数据驱动的医疗供应链与智能药房应用