• 产品与服务矩阵
  • 资源中心
  • 关于我们

分析师手记:衣+打造Alpha购,做IoT时代的Google

分析师手记 董旭,蔡利丽 2016-08-15 1726
人工智能是继“互联网+”的下一轮浪潮,技术上的变革推动商业化应用,从B端扩展至C端,最终消费级市场大爆发。同时未来随着大消费时代和消费升级时代的到来,消费者的个性化、碎片化和场景化购物需求也会越来越强烈。衣+找到了一条很好的商业化路径,一开始就搭载上消费级市场这辆快车,结合人工智能和购物,而且是随时随地的购物,所见即可购。

一、访谈企业简介

+成立于20146月。在国际顶级计算机视觉竞赛ImageNet2015中,成绩超过谷歌、斯坦福等,获得五项世界第一。衣+目前和多家顶级企业和机构合作,如和图像和视频内容方合作通过提供边看边买API,图像视频内容分析API,人脸属性识别API方式服务海量用户同时帮助内容方通过电商、广告变现。

二、访谈对象介绍

张默,人工智能计算机视觉搜素引擎“衣+”创始人兼CEO。曾就职于华为、微软、IBM,拥有研发产品渠道管理经验,中国最早期从事3G、云计算、人工智能的算法研发工程师和架构师。Windows Mobile项目组成员,IBM开源联盟负责人,主机Linux大中华区技术销售负责人。

三、易观分析师介绍

董旭,易观分析师顾问群组总经理。

蔡利丽,易观研究中心高级分析师。

四、访谈纪要&分析师评论

1、边看边买是顺势而为,衣+找到了最佳切入点和结合点

l   技术能力和互联网公司变现需求的集中爆发让衣+找到了切入点和结合点

  蔡利丽:

是什么样的机缘让您创办衣+?当时为何选择结合计算机视觉和时尚这个领域?

张默:

我们在2015ImageNet大赛中获得5个单项世界第一,我们团队3个人参加了这个比赛。ImageNet大赛的比赛任务就是在几万种数据中识别出是什么的能力。我们具备这样世界领先的技术能力,这可以说是一个机缘。

另一个机缘就是互联网公司变现需求的激增。互联网公司的变现方式主要有电商、广告和娱乐,我们可以帮助他们解决变现的问题。目前最大的信息载体是图片和视频,每天全世界有上百亿张图片和视频新生成。我们通过引擎,以APISDK的方式,有搜索引擎和推荐引擎,主要是边看边买引擎,对应电商、广告和娱乐。其中优酷和360图搜已经正式上线,基于视频内容的智能识别的广告系统已经应用在用户的新一代广告系统上,另外还有微博、乐视、小牧和华为等更多的客户。看视频和看图片的时候一个是需要实时搜索,另一个是对内容进行处理在恰当的时候推荐给用户,我们的能力是高效地处理海量的图片和视频,包括其名称、属性、起止时间等属性。

我们和优酷对接的自动广告投放系统,是基于视频内容的广告投放和边看边买电商打通。优酷去年的贴片广告收入是80亿,古永锵说要用3年时间基于用户的会员、购买以及内容广告,这块有很大的空间,每年会有十几二十亿收入。这部分是蓝海,对于相当时长的内容过去是无法识别的,只是通过人工运营,乐视和爱奇艺也是这样,我们对接的是商业化团队,变现需求比较大,他们的销售任务也提上日程。

我认为,这个时间点是爆发阶段。现在整个大环境都是在向内容电商和场景化营销转变,不管是网红经济还是阿里在推的都是,电商在变现,我们是做个加速器的作用,我们做了个连接,连接了内容、图片和视频来做商业化变现。

董旭:你们的商品是只链接到阿里系(淘宝+天猫)吗?在和优酷合作的时候,会使用到其他家的商品SKU库吗?商品SKU数据库会实时更新吗?

张默:我们有数亿商品SKU库,除了阿里之外,我们还有自身独有的数据库。实际上是我们与阿里、京东、美丽说、蘑菇街、银泰和一些主流海淘电商的都有合作。阿里给我们非常大的权限,这部分我们还是有很大优势,搜索要求有很大的数据库。我们收录了几十家国际上的,国内的十家,阿里系占了很大一部分。我们的商品SKU库定期在2天左右更新。

l   +可以让每个人每天的购物时间超过12个小时,睁开眼所见即可购

董旭:

公司的盈利模式是什么样的?主要的竞争对手有哪些呢?

张默:

我们的模式是B2B2C模式,我们作为一个开放平台,与其他家不同,我们中间的服务是绝大部分开放出来不卖钱,比如边看边买,都在后续采用分账模式。有一些其他部分可能要收费,像faceu那样的人脸动态贴图,很多直播公司需要。还有AI引擎,目前这块量比较小,是面向未来科技。

我们现在做的一件事,是让人每天购物时间能够达到12个小时,每天睁开眼睛就在看,看电视、看视频、刷朋友圈、刷微博以及走在马路上,都可以变成购物时间,只要你能看到这些介质,就可以实现购物。我们跟电视厂商像乐视和小米都在对接,还有图片社交和手机厂商华为等,移动手机摄像头和pad等,只要能拍就可以买。只要有内容,就可以知道内容是什么。另外还有些互动的东西,比如升级版弹幕,核心就是基于内容和对象的理解。我们现在可以支持400种场景识别,300种物体识别,还有人脸和轮廓识别,例如明星脸,我们现在有600个明星。这些是基本能力。跟其他家不同,我们专注于商品的识别,我们的定位就是帮助互联网公司变现,切入点就是商品,其中又以服饰为最早的切入点,现在有3C数码、日用品、家居用品、车和交通工具等,慢慢扩展,我们从柔性的扩展到刚性的比较容易,人脸就更为容易。目前来说,我们做的最好,不管是算法还是商品库上,在将来相当长的时间,我们都比较有优势。还没有特别的竞争对手。

我们与优酷合作,以人工智能方式在海量视频中实现边看边买,在全球也是第一家。在世博会上被央视国际频道关注,因为我们可以让大众消费者也可以使用,下棋这种是少数人的。我们是用开放产品去换取流量、用户及内容。互联网创业公司比较关注流量、内容和大数据的获取成本,我们现在都是以极地的成本来获取的,所以我现在一点都不怕跟大公司竞争,他们有钱有资源有流量,现在我们慢慢都会有,而且我们是差异化的。像是亚马逊和百度这些公司战略都是为自己服务为自己导流,很难做一个开放平台。

优酷2亿日PV,我们预期超过1亿的视频比较合适,古装目前不做,长远来看,里面出现的各种对象和场景都可以做。360的搜索也是亿级,微博每天大图浏览量是40亿,短视频是4.7亿,乐视TV等,他们的量都挺大。我们采用API云的方式,每天接口调用在大概在千万级,face++和格灵深瞳这些公司他们基本上都是按调用次数收费,我们比较差异化,他们能做我们也能做,我们能拿到大数据,去做更好的AI。行业也不同,他们主要做金融、安防和鉴黄等。

蔡利丽:

你们会运营自己的C端用户吗?

张默:

慢慢我们自己也会形成自己的C端账号体系。有点像百度之前给新浪搜狐提供服务,最后变成自己的品牌和服务,一开始按PV即使用量,后来就做起来自己的用户。我们跟facebook不一样,他们都是注册用户。C端的计划是中期目标,短期内还是做开放平台。我们做的模式很轻,边际成本为0。我认为一个好的商业模式,他的获取成本要很低,比如今日头条和google,他们获取成本就很低,另外他们还做广告。但是像优酷这种总要买版权。我们是商业化效率非常高的公司。这些2B的公司有点像IBM,因为之前我在IBM待过,做一个客户需要很长的周期,需要测试需要招标,招标方面技术只占很小一部分。他们会越做越重。

分析师评论

 

目前国内人工智能可分四个层级来看:

第一层级是底层的解决方案,包括芯片、软件和硬件等,代表企业是地平线机器人Horizon Robotics,该企业由百度深度学习研究院(IDL)余凯博士创立,企业团队成员均是人工智能领域专业人才,凭借技术优势和团队优势,地平线机器人获得两轮融资,未来定位做“机器人时代的Intel”。

第二层级是计算平台,目前国内处于寻找下一个计算平台时期,VR/AR、无人机、无人车和机器人将会取代PC和移动成为新的计算平台,因此人工智能创业企业也在瞄准新的计算平台进行业务布局,地平线机器人的雨果平台就是面向智能驾驶,其先进辅助驾驶系统(ADAS) 可以实时检测行人、车辆和车道线。另一企业格灵深瞳也有专门面向车辆识别的系统,即威目车辆特征识别系统。人工智能创业企业在面向新一代计算平台进行业务布局的同时,面临着GPU耗电量、散热、计算能力和信息传输等挑战。

第三层级是信息载体,如文字、语音、图片和视频等,这些信息产生大数据,大数据是实现人工智能的基础。人工智能创业企业如图普科技、face++、衣图科技、衣+和码隆科技等,都是基于深度学习算法从图片识别/人脸识别切入市场。人工智能离不开大数据,否则就像永远长不大的孩子。底层的技术突破后,面临的是上层的应用。上层应用既有各种各样的入口,更重要的是每个入口所采集和已积累的大数据,如何利用上这些大数据从而实现真正的人工智能是创业企业面临的一大难题。

第四层级是行业应用,如安防、金融、零售、交通、汽车和互联网等行业。大多数人工智能创业企业都做B端的商业化,这与市场的发展现状有关。典型如face++主要做安防、金融和零售领域;格灵深瞳主要做安防、交通/车辆和零售领域;衣+目前也主要是做互联网行业如视频和社交等,但衣+和码隆科技这两家企业有面向电商的C端产品,未来随着市场的成熟也会大力拓展。

总体来看,目前国内人工智能创业企业都走深度垂直路线,在自身切入领域深耕,呈现“百花开放”的格局,整个市场目前处于良性竞争状态。人工智能创业企业一开始都走商业化而非概念化的路径,盈利摆在第一位,不走烧钱以及大手笔公关的路线,这是比较理性的也会相对持久。目前大多数企业都瞄准B端市场,从B端走向C端需要一定的时间,未来的爆发肯定是在C端。

2、做IoT时代的Google,衣+打造alpha

蔡利丽:

公司未来发展规划是怎样的?

张默:

我们打算用1-3年的时间做到无所不能,即我们可以让它做广告,也可以让它炒股票等,这是纵向发展;后面3-10年时间做到无所不在,这是横向发展,可以在嵌入式设备上应用,比如ARVR、无人车和机器人等,这块我们在技术上会有突破,我们提出三值神经网络,这将是一个巨大的应用,现在嵌入式设备都很难用到深入学习,因为需要很大量计算能力和散热、电量消耗等,这些无法支撑在这些小的可穿戴设备上,车还可以,但是机器人不行,这样就会变成云机器人,没网没电就挂了,而且还需要传输,视频图片传输等都需要相应的时间,所以现在所有的公司都在关注怎么移植到嵌入式设备中来。之前我们的所有的深度学习神经网络都是浮点型的,前不久Yoshua Bengio提出的二值神经网络,试图去解决在嵌入式设备中的问题,但是精度下降的非常厉害,模型是压缩了,但是用起来非常不好。我们的博士提出了三值神经网络,精度可以保持不变,但是模型压缩到原来的1/16,这是一个数量级上的飞跃,可以用在眼镜里,原来一个GPU耗电量可能3分钟就把一个iPhone的电量耗尽了,但是模型小了,他就可以让很多使用场景成为可能。

我是非常欣赏alphabetGoogle创始人在2002年说做人工智能,大家理解不了,他做搜索引擎,完成商业闭环,形成数据正反馈,enble一个更好的AI,需要很多大数据,不断去迭代,有很好AI之后,可以做很多事情,比如alphagoalpha医疗,写歌写诗、搜索等等。可以理解alphabet是一个三维,而现在这些都是二维。我们做的边看边买就是alpha购,架构和原理是一样的。Google没有做这个,我们在中国市场是第一家。

董旭:

能否用一句话来概括衣+未来做一件什么事情?实现目标的难点在哪?

张默:

答:我们做IOT时代的Google。最大的难点在C端产品的把握,因为PC时代是单一入口,就是搜索和网页。而现在入口越来越碎片化,在这样的趋势下,如何把所有入口统一起来很难。我们有做AR购物,淘宝buy+做的是VR购物,我们觉得AR与现实更贴近些。目前是移动、PCTV,接下来会是VR AR和直播,我们都会跟这些入口结合。另外还有无人机和机器人,因为机器人需要探测前面的障碍物,需要知道是什么并且进行交互。

董旭:

随着需要在不同的设备上实现以及横向累计各种不同行业的客户资源,你们是否需要投入大量的资本和精力,这个模式怎么去优化?

张默:

其实是不需要大量投入的,肯定也不是线性增长的。因为服务器和计算资源只要是有定量的就可以支持很多家。另外我们每个行业做一家典型案例,然后快速复制。一开始对接新行业case的时候可能需要人,后期运营就不需要。开发测试需要有人对接,运行以后处于运营状态,只要监控不要出现异常即可。

分析师评论

人工智能主要有以下4个发展趋势:

一是技术/算法上的突破。未来几年人工智能在技术和算法上一定会有新的突破,不管是三值神经网络的出现还是其他算法的改进,都将给整个行业带来新的变革。

二是行业应用的拓展。目前主要行业在安防、零售、金融、交通、汽车和互联网行业,未来几年其他行业如教育、酒店、医疗等行业都会出现大量新应用。

三是C端产品的持续创新。目前C端产品较少,仅有的几款产品也仅仅定位于show case。未来随着市场发展的成熟和需求不断创新,C端产品会持续出现并创新。

四是从“弱”人工智能到“强”人工智能的发展。“弱”人工智能仅仅处于感知、交互和识别的阶段,未来“强”人工智能实现理解和决策的功能。

寻找变量

张默:

我认为,人工智能到了爆发期,现在国家也特别扶持的,上升到国家战略层面。前几年很多大公司比如苹果、谷歌和亚马逊都在做这件事情。国内起步比较晚,都开始宣布布局,比如滴滴和猎豹,很多大公司都开始关注这个领域。但是技术上会有新变革,比如三值神经网络,虽然目前处于早期,但是这是很大的一个变量。

而购物的发展趋势,我认为是碎片化、场景化、个性化和人性化。我们未来会实现随时随地买,不一定要打开APP或者等到双十一,而且交互更贴近人的表达方式,可以带一个隐形眼镜,看到一个东西,马上可以看到很多同款并买。现在也是从屌丝经济发展到小资经济,需要满足消费者的自我主张,每个人都去寻找跟自己匹配的东西。

分析师评论

人工智能是继“互联网+”的下一轮浪潮,技术上的变革推动商业化应用,从B端扩展至C端,最终消费级市场大爆发。同时未来随着大消费时代和消费升级时代的到来,消费者的个性化、碎片化和场景化购物需求也会越来越强烈。衣+找到了一条很好的商业化路径,一开始就搭载上消费级市场这辆快车,结合人工智能和购物,而且是随时随地的购物,所见即可购。