谷歌郭志明:国内大数据行业存在的问题

易观 2016-10-27 15:12:59   29

2016年10月27日,2016易观A10大数据应用峰会暨易观之星颁奖盛典在北京北辰洲际酒店举行。谷歌大中华及韩国区数据洞察与解决方案总经理郭志明发变了“数据营销大变革”的演讲。郭志明以谷歌为例阐述了大数据应用的场景:谷歌照片等众多产品的技术都来自与大数据以及算法的支持。同时他认为目前国内大数据行业存在着三大问题:广告欺诈、数据孤岛、无关信息冗余。

以下是大会演讲整理内容

大家下午好!今天和大家分享数据营销大变革,两部分。第一部分是宏观的趋势,第二部分,刚才有在场朋友问我谷歌在中国有什么业务,第二部分主要回答这个问题。人工智能最近几个月特别火,可能它有不同的词来形容,我们内部叫做机器学习,可能有一些人叫深度学习,其实讲的都是同一件事,怎么让我们机器通过很多数据的学习来产出一些智慧出来,对未来更好的判断。这个画面大家都认识,在3月份的时候谷歌的AlphaGo人工智能和韩国世界围棋大师李世石的比赛,引起了大家对AI的关注。谷歌在AI方面的投入非常大,全球范围内我们利用AI做了很多我们B2C,这里讲一下我们的AI怎么帮助改善消费者生活更好。

我家小孩今年13,我用Google的照片,输入小孩的名字,他可以把他从3岁开始到现在的照片找出来给我看,同样我用iPhone它就不一定了,能够找到他大概八九岁的样子。因为一个小孩的变化很大,你要认出是同一个人,这个背后的逻辑是不容易的。当然,除了看他的样子以外还要看我的其他行为,比如打开那个照片的频繁度等等,他用了很多其他的所谓信号来判定这个人和我的关系,Google照片非常好用。包括今天的新闻,我们会建立一个助手,基本上你让他做什么他就会做什么。这个逻辑首先要知道我要什么,他现在能够猜出来我要什么,他能猜出来其实我需要的是小孩照片,而不是互联网上搜索的东西。这背后都是人工智能来帮忙。比如一个稀罕的疾病,30年经验的医生不一定能看得出来,因为一辈子看病都不一定能看到,比较少有的案例。但如果通过大数据,这个数据放到云里面,全球所有的案例我都能看一遍,他能帮助看到这个疾病的概率,他可以不替代医生,但他可以帮助医生,“这个有没有可能性他患了罕见的病”,所以这个应用非常广泛。

这是全球视频平台,中国品牌怎么成为世界品牌,我作为使用者来使用它,它不断学习我的喜好,我喜欢听歌,他觉得你喜欢听这种的歌,所以我登陆YouTube和你登陆的YouTube是不一样的。还有Gmail,过滤垃圾邮件功能非常方便,另外,我从来不删除邮件,它是没有限量的,我可以随便翻查,我基本上不用急,我需要看哪封邮件很容易就能搜出来。

回到刚才有嘉宾问我的问题,你们在中国有什么业务,刚才我提到的B2C业务在中国使用起来不方便,但出了中国都可以很方便的使用,还有我们全球推广平台,但我接下来谈的部分都是在中国,在中国大陆这边我们能提供哪些业务。首先是营销方面,碰到三个问题:第一个问题是广告欺诈,中国的广告欺诈流量有多少,可能有些人比较乐观的说15%、20%,比较悲观的是80%,我对广告主最近做了一个访问,他们的答案是平均50%,这个不是真实的,但是广告主的印象,我们访问了大概200多位广告主,他们给我们的平均答案,最多是50%。第二个,数据孤岛,听到三家公司的名字BAT,现在的发展趋势是互相连通的可能性越来越难,我们怎么打通数据方面的孤岛。第三个,无关信息,我们做程序化做大数据做了很多年,我们都极力希望给到正确用户正确的时间正确的情景下面看到跟他有关的信息,但往往我们发现可能我看的跟我没关系,我买了包,他继续给我看那些包的广告。我刚订完酒店,他还是老给我看酒店信息,他不知道我进行了交易。所以怎么避免这些情况,当然,对抗广告欺诈方面,我们这边做了很多工作。我们有一个团队,在美国和英国,他们天天做的事情是看我们所有流量里边有哪些是机器过来的,有哪些是有操作嫌疑的,我们这个团队不单是人,还有很多广告政策,还有有关的技术,我们通过技术也可以很好的判定这个是来自于人还是来自于机器的概率有多大,比如你看到一些应用图标,但你的手机上的图标,甚至在你的电脑、电视,你点一下,如果是人点的话,一般通过热点图分析,他点中间点的概率很高,我们看另外一种点击很有趣,如果是这样点的我们判定它不像人,像机器,所以我们觉得它是机器的概率比较高,我们把它的流量自动滤掉,这个标签是无效的展示,当然,中国人有一句话,道高一尺,魔高一丈,广告欺诈手段不断更新,所以我们本身监测技术也是不断的更新中。刚刚提到我们有一些专业团队,他们大部分都是计算机博士,有关的广告政策我们是非常严谨的。去年有一个案例,是我们合作很多年的发布商,一个媒体,我们发现他有很多流量是有问题的,我们和他沟通以后就不联系了,我们损失了千万级美金,但谷歌更重视的是真实,给到我们用户真实的广告和流量,真实的数据。

第二方面,连接数据孤岛。我们发现一个问题,在中国很多第三方监测公司帮助我们监测了广告多少流量多少点击等等,但有另外的公司帮忙监测在网页端APP里面的行为,是割裂的,不串通的。我们有两个工具,一个是帮助客户追踪监测他的广告播放情况,可以帮助我们使用投放,两个用途都可以。有另外一个工具叫GA,我们有两个版本,一个是免费版,一个是收费版,当然更好用了。我们这两个工具一个是广告前端监测,一个是在APP里面做行为分析,我们把它串起来,我们今天见到越来越多人用这两个平台的原因,因为它的数据是打通的。刚才有嘉宾问我Google有什么业务,你听我演讲就知道了。我们在中国有很多的视频流量广告,比如我们最近和有名的直播平台合作,我们和领先的媒体合作等等,他们通过第一方、第二方、第三方流量合作方式,我们在中国的流量几乎所有你能讲到的流量我们都有。另外是搜索,我们是代理百度的,可能很多人不知道。如果你要做百度的话,可以通过Google来做百度的SEM优化,很多人问我有什么好处呢?好处是你可以把数据打通,很多在使用的客户他可以知道我做完之后收集到那些用户信息是用户标签,我就可以在其他Google平台做再营销,这些都是我们在中国做的事情。

当然,我们是打开怀抱做数据这件事,Google作为一个连接器,把BAT的数据尽可能连起来,今天我们也在尝试。比如我们和某个中国领先的快消品客户,把刚才提到的那些网站行为数据,把他的广告投放数据,T公司社交媒体数据,把它放到数据池子里面,让他做打通。这些项目我们在推广,当然,我们还跟很多数据合作伙伴,比如易观,进行合作。这个也是帮助我们把数据连贯起来。另外,把数据连贯起来我们就能对受众进行很好的判断。这张图找一样,他们每天花30分钟浏览时尚网站,如果你看表面数据标签时尚,但再看深一点,左边的人每天花六小时上网,右边花一小时上网,我们要标签哪个是时尚人群?右边的,不是左边的。我们怎么标签呢?观察、训练和优化。观察主要看哪个点击能产生效果,产生转化,训练是我们不断训练模型,来预测哪一些点击最大可能性带来转化的,优化是我们把钱分到那边去,这是一个循环。我们现在把那些模型全都自动建立在广告系统里边。所以现在我们发现广告系统越来越智能,我们的同事花在系统的时间也变少了,我们可以做一些更有价值的事情,很多数据算法和模型我就不一一说了。

谢谢大家。