• 产品与服务矩阵
  • 资源中心
  • 关于我们

易观A10 | 郭炜:智能时代 分析场景的扩展、回归与变革

易观 2017-10-28 8477
智能时代 分析场景的扩展、回归与变革

20171027-28,易A10大数据用峰会在北京成功举行,峰会以数以致用 源力为主题。到国内互网行业领袖大咖,以及来互网、传统、媒体及域在内的3000多位与会者,共同数字源力数据价得到充分放和利用。

 

28日上午举行的用户视图论坛上,易CTO做了题为《智能代的大数据用分析》的演。郭提到,易从用搜索、用公开的互网行和物施采集的数据中,分析人的情感、喜好和个性化需求,而提供更加精准的服。以下讲实录

各位来宾,各位伙伴们,大家早上好,我是易观的CTO郭炜。

我今天给大家分享的主题是智能时代的用户分析场景的扩展、回归与变革。大家进门看到了易观的展示大屏,其实在这个大屏上体现了今天所演讲的主题,分析场景的扩展、回归与变革。怎么回事?一步一步来讲。

 

先说场景扩展。做大数据用户分析第一感觉想到一件事,就是千人千面。的确,在大数据环境里面,针对每一个用户自己的用户行为,用户标签都可以通过数据挖掘和算法,给每个人打上特殊的标签,像易观给用户打上8600个标签,根据这些标签做相关的推荐或者做相关猜你喜欢,根据现在的情况推荐一些想要的东西。现在想到大数据,想到用户标签,想到用户分析第一反应,这是分析的扩展。

当然,除了背后这些标签的拓展,同时也有大数据可视化也有一些新的图形出现,比如右侧上面图,叫南丁格尔玫瑰图,还有这些图做了可视化。谈到大数据都说实时,我们在大屏实时跳动的数字其实来自易观SDK,实时采集每天接近亿级别的日活的用户,这些数都是实时计算出来,每秒钟计算超过55万条数据的情况。

其实大家装很多APP的时候,我们能做到秒级别的,把这个人男女性别、偏好几秒钟之内算出来,这不是易观的特性,做数据的公司都可以做到。我们做数据分析的时候,实时性的提升也是一个变化。

数据扩展的背后,其实数据分析场景也在回归。什么是场景的回归?第一个就是查询的回归,大家发现越来越多的需求不仅来自于推荐,越来越多的需求来自于用户的查询。在过去的时候,大家在5-6年前,大家想的数据仓库在做BI,我们要做一些能够让用户直接查询,让用户很快找到一些数据的结果,可能在最近几年大家都在提大数据,我们做用户画像,在做标签喜好的大数据。

第一个是查询在回归。最近这一年,大家发现非常多数据查询引擎在蓬勃发展,很多企业用户的需求,重新回归到用户统计的数据怎么样的,而不是某一个单点用户是怎样的。每一个企业做数据分析的时候,不甘于看到大数据的黑箱子或是看不见摸不见的人工智能的模型,企业还需要看到可视化、可量化的分析结果,这个分析结果是查询时代的回归,画面出的是易观方舟的Ad-Hoc查询的例子,这样的需求每个企业里还有很多。大家看到非常多的企,看到我在自己的用究竟什么子?通哪一个渠道来,是什么的人群?看到些人群,他的活是怎的?留存是如何?客价是如何,背后是都是查询。

面对大量数据统计做抽样,现在大数据环境下要求秒级的反馈。企业有这么多的数据,这么多的用户行为,这么多的用户条件,马上告诉我这个用户群是什么样的,这种Ad-hoc查询,它的数据量是过去传统的存储引擎的10倍、100倍,以及千倍以上。所以,最近数据引擎重新回到投资热点上来。

第二个是SQL时代的回归SQL这么多年,No-SQL曾经火爆过一阵,我们也曾经尝试过用No-SQL全面替代SQL,结果是研发效率下降一半研发人员单价成本上升一倍,并不合适。现在看到所有的数据引擎,向SQL低头,无论是Spark、还是RadisES。因为SQL这么多年,真的是一个非常好的语言,我们经常听到说,我们PHP过时了,我们的JS也过时了,我们的Java过时了,从来没有听说有一个东西把SQL干掉。大数据技术研发以后,我们SQL时代又回来了,我们做数据处理,做研发的时候,还是回到一个刚需。它的研发成本和人力投入是最佳的配置,最近一年我发现SQL正在回归。

第三,图像解析也在回归。为什么?大家看到易观个大屏,第一眼大家看到的西一定是中的用画像,但是大家仔想一想,真正你能理解的数字和意?反而是上面的数字,我看到用画像,的确很尚,但是什么含?人脑会要反应很久才知道他说的是什么事情。

样举个例子,大家在座都读过分析告,易所有的分析告最常用是什么?柱状和折线图什么?是因这样信息繁的社会里面,我理解一个什么西最快,是具体西最快。我分析品里面,有特别让人眼前一亮的形化的景,但是其很多的品里面是回到我柱状、折线图,让我们的用户以最快的时间获得背后这些数字的意义。所以形化的回,代表着不是我看到越花哨的越好,而是过这形真的大家理解形背后数字的意

分析的场景也在变革。在生什么呢?第一个是查询查询革尤特是最近举办的易OLAP,挺令人震撼的,尽管有一个