第2届易观算法大赛完美收官,凭什么他蝉联两届算法冠军?

A10峰会 2018-11-02 09:38:47   526

10月26日-27日,以“数造未来 精益成长”为主题的2018易观A10峰会在北京海航大厦如期举行。50+位嘉宾大咖齐聚大会现场,共同探讨和分享在数据驱动下的企业精益成长之道。


厚积薄发,荣耀时刻


本届算法大赛共有700支队伍参加,经过数轮激烈角逐后,来自广州的李本旺团队“housepower”以绝对优势夺得漏斗计算规则赛题开源组冠军,而性别年龄预测赛题开源组冠军由林望黎团队斩获。两组冠军分别揽获5万元现金奖励,成为本次大赛的最终赢家。另有技术专场meetup,来自俄罗斯的ClickHouse技术团队和数据爱好者们汇聚一堂,共同探讨了数据算法的应用发展。


彩蛋——拿奖拿到手软秘籍


赛后,小编有幸采访到漏斗冠军李本旺,上届OLAP算法大赛他凭借其优异表现成为大赛最大黑马,今年再次夺冠。为何他能连续两次斩获冠军头衔?下面就让我们一起来了解一下。(以下为采访实录)


 

Q1:首先恭喜你们获得本次算法大赛的冠军,能否简单介绍下你们团队?


李本旺:我们团队三人,大家都是大数据和AI的爱好者。他们的实力都很棒。


其中宋强是我同学,他毕业于中科院自动化研究所,对推荐系统和图像识别领域尤为擅长,获得过国际多媒体workshop图像识别比赛冠军,国际计算机视觉workshop比赛亚军,我们还一起拿过天池云上智能识别比赛亚军。而张健, 目前是ClickHouse社区比较活跃的贡献者, 对ClickHouse比较熟悉。关于我本人,目前在一家游戏直播公司做高级数据工程师(搬砖)。


Q2:是什么原因让你决定再次来参加易观算法大赛呢?


李本旺:我对ClickHouse数据库非常感兴趣,但去年的ClickHouse meetup没能参加,有点遗憾。得知这个比赛第二天就有meetup,也想见见几位朋友,而且今年的复杂漏斗也是可以基于ClickHouse做定向优化并解决,所以便决定报名参赛。


Q3:能否简要描述下你们团队在比赛时所采用的解题思路及算法亮点?


李本旺:关于解题的方法依旧是基于ClickHouse设计了UDAF函数,和去年思路相差不大。但今年漏斗计算较为复杂。在算法处理过程中,我们选择自定义压缩、自动化调参、提前聚合,充分发挥单节点性能,以及通用规则拦截器等方式。简言之,就是我们特别注重算法细节优化,我们把能想到的细节,每一处都进行了“死磕”。


另外,我们做了一套自动化测试框架,能够自动完成一些参数的评测并选出最佳参数,节省了很多时间。当然,在比赛中我们也有不足之处。我们的算法实现并不是最优秀的,赛后我们和商业组冠军讨论了算法实现上的相关细节,发现我们还有很大的提升空间。


Q4:你认为这次团队夺冠的重要因素是什么?如何评价自己和队友的表现?


李本旺:除了技术上的实力,我认为团队合作更为重要。很感谢我的队友们,我们配合得非常默契,我主要负责算法的技术选型、总体架构以及核心代码的实现,张健负责自定义压缩的细节优化,而宋强负责算法性能调优。正是因为队友们的密切配合,才有了最终夺冠的好成绩。


Q5:连续两届获得算法大赛冠军,能和大家分享下你的感受吗?

 

李本旺:在心态上我会更趋于平淡,希望通过易观算法大赛,让更多人了解并使用ClickHouse这个高性能OLAP数据库。


Q6:ClickHouse这款神级开源软件,目前在中国发展应用如何?


李本旺:ClickHouse在过去一年发展迅速,目前中国用户已成为除俄罗斯本土以外发展最快的用户群。国内的阿里、腾讯、新浪、头条、快手等代表性公司都对ClickHouse这个数据库有所研究。令人非常关注的是,未来在实时分析领域,ClickHouse数据库绝对会成为首选的技术选型。

 

至此,第2届易观算法大赛正式落幕,同时也要感谢Ucloud强大的技术支持。算法大赛是国内(外)科技人才沟通接触的桥梁,不断为行业注入新鲜活力。未来易观将继续坚持以海量场景为基础,探索前沿数据科技,不断推动大数据分析发展。这一次,我们不说再见,只为下一次更好的相聚。同时易观也期待更多高校学子和数据爱好者的加入!

 

戳这里,即刻体验新方舟!