关于易观第2届算法大赛,8问易观CTO郭炜

A10峰会 2018-10-21 10:47:22   715

易观算法大赛自7月份开展选手报名通道以来,已精心准备了100天,距离最终的冠军之夜只剩下最后的一周,最终决赛将在“数造未来·精益成长”易观A10峰会上如期举行。这场开发者盛会,算法高手们将共同探讨时代浪潮下的数据分析。在比赛进入最后的冲刺阶段,我们有幸采访到易观CTO郭炜,深耕大数据领域18年的资深技术人,这次又为我们带来了哪些新看法?

 

易观CTO郭炜

 

郭炜,易观CTO,全球中小企业创业联合会副会长,中国软件行业协会智能应用服务分会副主任委员,TGO北京分会会长。曾任联想研究院大数据总监,万达电商数据部总经理,并曾在中金、IBM、Teradata公司担任大数据重要岗位,对大数据前沿领域有过卓越贡献。其在2018年提出大数据IOTA架构(Big Data IOTA)、企业“数据河”(Data River)的概念,带领团队打造了秒算数据计算引擎。


以下为采访实录:

 

Q1:您曾在多家企业任职,最终为什么会选择加入易观?

 

郭炜:我在大数据领域内坚持了18年,在这残酷的商业竞争中,易观始终坚持深耕大数据领域,在这点上我非常佩服。在易观CEO于揚先生的邀请下,我加入易观任职CTO,打造易观的技术团队,我相信在大家的共同努力下,易观也会越来越好。

 

Q2:在您看来,易观坚持举办算法大赛的最大价值是什么?

 

郭炜:易观每年组织OLAP算法大赛,不仅是对大家数据上的挑战,也是给行业一个参考标准,让大家知道目前开源生态和商业生态中,最好的选手和公司是什么样子。在比赛中会有很多有意思的黑马出现,像首届OLAP大赛中的开源组第一名 ,就将俄罗斯最先进的数据引擎ClickHouse引进中国。易观和各位开发者共同推进了中国大数据行业的进展。

 

Q3:大数据的算法升级与创新,您觉得会给企业带来什么价值?

 

郭炜:大数据就像是一个连接器,将企业的数字客户直接连接到企业管理层和运营层,通过每一个用户的行为让企业管理者了解到最新动态。同时,通过数据实时分析,计算出每个用户的特征,从而控制风险、提供千人千面的营销,有效提高企业收入和拉新效果,让企业数据驱动实现营销闭环。

 

Q4:本次算法大赛的数据来源是什么?易观在数据分析上,具体是怎么做的?


郭炜:本次大赛的数据是参与体验计划的用户设备数据经过模糊化之后得来的。目前易观用户体验计划SDK覆盖了5.8亿月活用户,数据存储量已超过6.8Pb。在数据分析上,易观自有的算法团队都是来自阿里、百度、百分点、TalkingData等公司的高手,我们也希望在行业内提出一些有意思和挑战性的问题,让大家一起沟通交流。

 

Q5:本次算法大赛的赛题包括漏斗计算和性别年龄预测赛题,您认为这两个赛题的难点分别在哪?


郭炜:本次漏斗题目,在基础漏斗的功能基础上,增加了很多实际业务需求。例如选手们需要考虑到重复事件,漏斗在默认日期分组条件下,能支持按照任意步骤的任意属性进行分组。此外,漏斗计算规则也更加复杂,因为用户的实际行为完全随机,中间会有多条事件符合转换步骤定义,而选手们必须按照约定的通用规则计算最优转化路径。


而对于性别年龄预测赛题,其主要挑战在APP高基数类别特征的处理上。由于样本不平衡的问题导致小样本预测的概率较低,因此在时间表的处理上加深了难度;此外,22分类数量较多,以性别和年龄作为标签,也加深了预测难度。

 

Q6:距易观算法大赛决赛只剩下1周的时间,对参赛选手们您有什么建议(通关秘籍)?


郭炜:最后一周已进入了在线调试阶段,希望选手们再接再厉,在有监督录屏的环境下,扎扎实实做好自己的比赛,最终获得佳绩。对于通关秘诀,其实就是厚积薄发。


Q7:截至目前,算法大赛给您留下了哪些深刻印象?


郭炜:去年OLAP大赛冠军使用的ClickHouse在易观OLAP大赛的推动下一炮打响。坊间打趣道:“易观OLAP大赛一声炮响,送来了喀秋莎数据库(ClickHouse)”。随后易观2月份又组织了MeetUp,俄罗斯ClickHouse创始团队来到北京,大力称赞OLAP大赛和易观对于大数据新技术推广的贡献。通过易观OLAP大赛,让国内大数据开发者和全世界最新最火的技术直接相连,使大数据行业进一步发展。

 

Q8:选手们参加算法大赛将能够获得什么回报?


郭炜:对于开源组,我们准备了10万元现金大奖,同时公布排名情况。商业组也将公布排名,并颁发荣誉证书,打造业内企业的数据硬实力。大赛对学生们来说是一次很好的锻炼机会,未来应聘更易赢得大公司的青睐。同时,所有参赛者都可以参加易观A10峰会技术场全天活动和第二天的国际开源组Meetup活动。这场开发者的行业盛会,绝对精彩无限。


易观算法大赛倒计时最后一周,优秀选手呼之欲出。选手排名将会在10月27日易观A10峰会上重磅揭晓,这场一年一度的大数据盛典,到底谁能成为技术黑马脱颖而出?敬请期待易观A10峰会盛典,届时将为你揭晓谜底!


注:漏斗计算规则赛题服务器由UCloud 赞助,总价值20万人民币,供参赛选手比赛使用。


UCloud,国内领先的云计算服务平台,自主研发并提供计算资源、存储资源、网络资源等企业必需的基础IT架构服务,深入了解互联网、移动互联网、传统企业不同场景下的业务需求,提供全局解决方案。UCloud深耕用户需求,秉持产品快速定制、贴身应需服务的理念,推出适合行业特性的产品与服务。

 

2018易观A10峰会

戳这里,登陆算法大赛官网了解详情~