跳过导航栏

主页 > 评论专区 > 新晋分析师 >

2017-10-12 11:36

随着有效的数据内容逐渐成为高价值的信息资产,数据分析师的岗位变得炙手可热。旅游企业开始意识到数据分析与日俱增的重要性,他们在问:我的企业该怎么获得这些技能?空降一个技术团队?高薪去挖技术牛人?……

而在 最新一期的旅讯开放日活动>> 中,蚂蜂窝旅行网技术总监韩鑫提到,蚂蜂窝有 270 个人在做各种各样的数据分析——当然这其中真正有数据分析师头衔的只有一个人。

如何做到“全民皆兵”?韩鑫分享了他亲历的数据体系搭建之路——作为创业公司,该如何一步步建立数据体系;如何找到数据困境的切入点;如何避开官僚化的坑;又怎么利用自动化测试和搭建专属平台达到“以一敌十”。

演讲者|韩鑫
蚂蜂窝旅行网 技术总监 

不是为了用户画像,也不是为了个性化推荐

为什么要建数据体系?天下武功唯快不破,有些公司比较热衷于用户画像,或者说对话推荐,还有从今年开始特别火的机器学习、人工智能。毫无疑问这些东西很重要,但对于创业公司来讲,这些都只是应用。

真正要做什么?不是为了用户画像,也不是为了个性化推荐,更不是为了人工智能。

到底为了什么?其实就一个字“快”,快意味着效率和少走弯路和及时发现问题,让产品通过数据找到优势和不足,去改进;能够快速在有限人力情况下产生效果,能够去评估接下来将会发生的问题,做未雨绸缪的打算。这些才是数据体系要做的东西。

先从数据团队切入,还是先从数据意识切入

刚开始创业公司“一穷二白”,没有自己专门的数据研发团队;没有团队,就没有办法快速输出数据;无法输出数据就没有办法使用数据,数据意识一时难以得到成长。紧接着会导致数据需求没有提到点子上,或者压根没有需求,就算有发现也没有人可以做,业务都做不完,哪儿有时间做数据?

面对这种恶性循环的困境,切入点在哪里?

建一个数据团队,把研发弄起来先满足大家需求,对于创业公司这是否是一个可行之道?如果不差钱,这个公司倒可以一试,但实际风险和成本非常高。数据团队和机器设备的成本都很高,而且刚进来的数据团队对现有业务不是很清楚,这也会过多地消耗沟通成本,所产生的价值短期内并不能呈现。

有没有更好的办法?有,从数据意识上切入!当企业连团队都没有,报表都出不来,怎么开始培养数据意识?我建议四步走:借外力,凝基因,立项目,建团队。充分借助外力,不用我们自己从头开始搭建底层基础设施,也不用组建技术的数据团队,能直接把数据先用起来。

也许这样不能保证所有的数据需求都可以满足,但是先用起来是最关键的。在使用当中慢慢产生数据的意识,慢慢形成自己公司的数据基因;在这个过程当中开始提出一些到位的数据需求,建立临时的数据项目,再慢慢发展变成独立的数据团队。所以,这是一个风险比较低,而且容易一步一步往下演变的方式。

数据驱动得是全公司所有人的事

有了数据团队,紧接着会面临一个问题——数据团队的官僚化。我们经常看到一个典型的结构或者流程是:产品、运营小伙伴提出需求,找数据团队去碰。在这个过程中,数据团队要了解需求,了解如何跟业务对接;然后沟通确定整个技术方案,确定时间再开始做——开发、测试、上线,还有后期的维护。

这是一个非常传统和典型的方式。这样的方式注定会导致——官僚化。因为它是一个非常中心化的、中央集权的数据团队控制所有需求:先做什么、后做什么,控制排期,控制所有的数据研发资源,控制最终成果的产出等等。 

官僚化不是指团队官僚化,而是这种流程官僚化。我相信很多人一定会有同感:为什么我的需求一个月后排期,别人的需求一个星期之后就开始排期,是不是对我们不重视?我一个月之后要上一个活动,排期排到两三个月之后,我等你做出来我的需求都没有了,还做什么?或者是,做一个项目数据团队要两三个月,但是我的目标是 1 个月内完成,怎么办?拉团队里两个人去学大数据相关技术,自己去弄吧。以上这些例子,都是非常典型的现象。

这种官僚化如何去解决呢?

首先,要明确数据驱动不是数据团队驱动。有很多人没有想清楚,一旦发现公司数据驱动能力比较弱,立即建一个数据团队把所有数据相关的事都包揽——控制了所有的资源,所有的排期,所有的输出——这注定了官僚化。

实际上,数据驱动是全公司所有人的事。我们可以去建立公司内部的数据平台,让所有的小伙伴:分析师、产品、运营、编辑、客服,以及业务线的研发都可以在数据平台上工作。一定要让他们有能力自己产生结果,这样一来,遇到需求他们可以自己去优先解决,而不用排队等着数据团队资源。

数据团队同时有数据咨询的角色,这是一种分布式的思路;像现在行业大多都是按小团队快速迭代,而不是按照职能划分。一个小团队有产品、技术、设计,开干后能够快速迭代自己的数据需求。

除了让数据平台产品化,还能如何做到数据分析的全民皆兵? | 5月开放日笔记

但这里要注意一点,数据团队不是把资源放手,让每个人去学各种数据技术。到底怎么放?放的是数据和能力,要把数据能力封装起来,对外可以让其他小伙伴使用,他们只需了解基本概念就可以了。

输出数据的关键能力,让每个小伙伴都能折腾

数据建设有哪些关键的点?我总结为:原料、消化和成果。这三块要变成能力输出出去,让每个小伙伴都能折腾。

除了让数据平台产品化,还能如何做到数据分析的全民皆兵? | 5月开放日笔记

比如原料,很重要的就是数量能力和种类能力。如果作为某一个产品线的小团队,需要上报数据,每天几百万上千的数据,上报全新的数据需要多久?在蚂蜂窝,需要十几分钟。相比之下,有的公司因为没有把这个能力封装出去,报一个新的数据结构得反复确认,可能花一两周时间才可以。

至于数据处理,包括实时可以做什么、算什么,离线算什么,效果如何等。另外,还要有管理的能力,包括原数据的管理,运算处理的规则和运算服务的管理,权限的管理。真正把数据管起来才能把充分组织起来,而不是一团乱。这之后还要洞察,最典型的观察是数据可视化。

数据算好,但不能高效的使用,那数据就是躺在机器上的一堆数字而已,并不产生价值。

所以接下来就是成果。怎么把数据应用到每一个小伙伴日常工作分析当中?如何快速的去应用到线上的产品当中去?其中一个特别关键的点,就是质量。创业公司常见的数据质量问题,就是因为产品迭代所产生的,这几乎无法避免。怎么解决?

对于产品和迭代产生的问题,做自动化测试。把上报标准定死了,一旦产品迭代之后,如果有错误直接一跑发现报错了,代表就有问题了,这个版本立马修,没有等上线就把错误杜绝了。在错误数据上线之前杜绝掉,从根本上解决掉产品迭代所来的数据质量问题。从成本来讲,自动化测试不需要多,很多创业公司甚至一两个测试就可以搞定,往往比雇数据开发工程师去做数据开发报警等等成本要小得多。

以一敌十的个性化专属后台

如何做到以一敌十。我直接举例子,蚂蜂窝一个无线产品经理在一两年前,用了两天时间,自己做了一个 App 无线部的数据后台。里面涉及十几个一级频道的分析,右边是二级频道,三级频道,每个节点都是数据报表,涉及十几张数据报表,90% 的数据报表都在这两天里面直接搞定了,而且没有用一个研发人员,自己搞定了。

除了让数据平台产品化,还能如何做到数据分析的全民皆兵? | 5月开放日笔记

以前做这样的后台沟通需求都要至少两天,包括到底要什么报表,字段到底怎么弄,逻辑怎么算等等。而且之前我们要排期,一个月之后活动要两三个月之后才开始做,导致活动结束了,数据都看不到。

而现在每一个部门,每一个团队,每一个人都可以建立自己专属的数据后台,甚至为几天、一周的活动做一个数据后台都可以。因为可能花半天时间就能直接使用,活动结束就可以抛弃掉。

第二个案例,关于实时统计。右边的界面是:打开蚂蜂窝,当前有多少人正在旅行,旅行的用户中都在关注什么——哪些美食、哪些景点和购物场所,并且有实时更新。像这样的实时统计我们只需要 5 分钟可以搞定,不需要写代码。

除了让数据平台产品化,还能如何做到数据分析的全民皆兵? | 5月开放日笔记

第三个例子,这是一个典型的数据查询后台,一堆参数变量。以前很多公司要开发具体需求来做报道系统。而蚂蜂窝的后台不需要研发人员介入, 5 分钟之内就可以把查询变成一个后台,可以分发给所有相关小伙伴,其实这个后台还可以直接做 API,不需要写代码也可以做数据查询 API,可以获取所有结果做相应的个性化推送。

除了让数据平台产品化,还能如何做到数据分析的全民皆兵? | 5月开放日笔记

搭建数据体系最关键是把数据处理能力、原料消化能力和最终上线产生的成果输出能力产品化,让每个人都可以参与其中。不断使用数据,不断做各种符合业务需求的数据产品,形成良好的循环,最终达到——让数据融入每个人的血液,每个人有权利接触到数据、使用数据、创造数据,把数据应用到工作的每一天,每一个产品运营的活动上去。

*本文节选自本周三在上海举办的旅讯开放日,点击查看视频回顾>>

想参加我们的活动?

接下来我们将于 6 月 22 日(周四)在 杭州 举办以收益管理为主题的开放日活动,立即报名>>

除了让数据平台产品化,还能如何做到数据分析的全民皆兵? | 5月开放日笔记

编辑:智通财富网

上一篇:穆迪:中国保险行业的偿付能力充足率趋势不一 下一篇:MBA校友时雪松:我与金融圈的一次亲密接触

焦点排行

新闻排行

点击排行
新闻图片
分享排行

视频排行

  1. IPO传来大利空!中小创熊途漫漫
  2. 5.31晚评黄金,原油操作建议谨防黑
  3. 外资抄底或成红六月信号 把握机会
  4. 金针探底释放两大信号 行情或是冰
  5. 变盘警报响彻市场 逢低抄底两大板
  6. 跳空高开 筑底过程进三退二
  7. 市场未脱离震荡主题 继续等待
  8. A股出现部分底部特征 等待最后一跌
  9. 横盘震荡成新常态 高抛低吸波段为