易观OLAP大赛,为什么巨头云集?

易观 2017-09-15 10:39:40   229

大数据和人工智能主宰的时代,我们的生活、工作和思维都将发生重大变革。而数据和算法,作为推动大数据油轮前进的双引擎,缺一不可,弱任何一方面都不足以驰骋。在我们日渐充盈的海量的数据资源不断积累的过程中,以算法为核心的技术能力能否适时跟上时代需求,成为当下大数据领域不得不面临的现实问题。

针对有序漏斗难题进行行业攻坚的“2017易观OLAP算法大赛,自今年7月开通报名以来,已收到来自国内20多个技术强队和个人报名参加。目前比赛已进入到数据环境测试阶段,为即将在10月跑bench mark(正式测试及案例)做热身。

 

据悉,此次算法大赛的比赛规则是:根据主办方提供的应用转化和OLAP场景,参赛团队给出具体的方案,先利用测试数据集在指定测试集群上运行给出测试结果, 最终易观会用实际测试数据在测试集群上跑整体数据并给出用时排名。

此次算法大赛分为开源组和商业组,参赛选手分别来自国内数据领域的知名企业以及高校团队。开源组有来自小米、美团、热云数据、原速数据、LinkDochuhu、乐享天下、牛办科技、上海睿民以及北京交通大学的数据高手;商业组则包括咪咕音乐、南京帆软软件、北京乐见科技、杭州玳数科技、北京润乾信息、KyligenceAggreDataGbase等企业的技术强队。 

为什么一场算法比赛,会聚集国内如此多的数据高手和企业强队? 

这还得从有序漏斗说起。

移动互联网在中国的发展繁盛,驱动产品迭代和运营的数据和算法成为企业争相掌握的核心,不少公司甚至投入大量的人力和经费,来潜心打造自家移动App “用户行为分析大数据工具。但最终目的基本大同小异,就是及时通过数据分析反馈来更好地优化自家产品,比如查看日活和月活,查看渠道来源,提高留存、转化和活跃度等。 

有序漏斗就是其中的技术门槛。作为大数据产品研发过程的一个核心需求,有序漏斗是帮助运营人员分析一个多步骤过程中每一步的转化与流失情况。计算过程比较复杂,目前行业内解决方案在数据量较大的情况下,往往效率很低。

易观大数据工具研发已有五六年,在这过程中,也产生了诸如易观千帆、易观万像这样重量级的大数据产品。但计算效率仍旧是个问题,特别是面对越来越海量的数据计算需求,为解决这个行业难题,也为了更好地提升产品体验,易观决定将此需求对外公开,通过广发英雄帖,招募国内数据大牛一同攻坚克难破解有序漏斗难题。 

大数据是时代趋势,是整个人类社会发展的进程。经历过互联网和移动互联网阶段的行业竞争和占位比拼。在大数据和人工智能时代,在以算法和数据为双引擎的推进程中,则需要转变思维,正如李彦宏在百度AI开发者大会上提到,“AI时代的开发者们不能再做孤胆英雄,大家要一起共享共赢。大数据倡导共享流动,算法技术也应该提倡交流切磋,共同推进大数据时代引擎的基建完善。

数据和算法不光是双引擎,他们还互相推动进步提升。更优势的算法技术能推动产生更多有价值的数据,而大量的数据也会反归来推动算法的不断提升和成熟。截止2017年第二季度,易观覆盖20.7亿智能终端,监测超过205万款移动应用,数据储存容量5.8PB,每日处理数据242亿条。易观有数据资源,也有大数据算法技术的经验优势,在数据采集、数据存储、实时计算和数据应用等方面都有多年的技术储备。作为活动发起者和主办方,易观愿意拿出数据资源,同时也愿意和行业大牛一起切磋讨论,携手进行行业算法技术的升级试验。

大数据是全社会共同的未来。人工智能和数据算法的进阶不是一家公司的专利和责任,它应该是全行业来共同面对的机遇和挑战。易观呼吁,数据大牛和技术强队应该联合起来,打通现有资源和平台,共同攻破有序漏斗难题,在更高更新的层面展开下一轮的技术领航。