专栏观察

智能音箱零成本升级背后,阿里AI战略的平台化野心

 中国版“ECHO”,非天猫精灵莫属,上市9个月,销量就达到了200万;亚马逊完成这个销量,花了一年多。

 
现在,借助更聪明的大脑AliGenie2.0交互系统,这只”猫”拥有了视觉能力———只要把智能手机,和天猫精灵连接起来,它就能给小朋友讲故事,还能识别4万多个药盒,帮助眼神不好的老年人安全用药。

 
This is a modal window.The media playback was aborted due to a corruption problem or because the media used features your browser did not support.
出人意料的是,打造了首款中文爆款音箱、惹得跟风者如同潮涌一般入场后,在声势浩大的春季发布会上,阿里并没有如期待般发布新硬件产品,而是把重心放在了系统进化上。
 
200万台,AI大生态入场券
 
作为国内第一款销量达到百万级别的智能音箱,天猫精灵成为了中国智能音箱的分水岭,以此为节点,智能音箱在中国,终于从碎品化的产品,进化出了规模化的行业雏形。
 
ECHO的火爆,让软、硬公司们,纷纷涌入智能音箱的竞技场。入场者汹汹,但站稳者寥寥,在阿里入场之前,国内并没有一款爆品音箱。
 
根据权威调研机构GfK去年10月公布的《中国智能音箱市场分析》报告,2015年中国智能音箱零售量只有1万台,2016年增至6万台,2017年前8个月累计销售额也不过10万台。而早在2016年,亚马逊Echo的销量就超过了650万台。
5f3dd18452711d26afed8337ef619292.jpg
 
其实,从未做过硬件的阿里,最早切入智能音箱领域,走得也是合作路线,但并未取得成功。
 
“挽起袖子,弄脏双手”,亲自下场后,天猫精灵产品经理释空“才知道里面到底有多少坑”,才真正搞明白,到底系统和硬件该如何配合。
 
为了调试麦克风的消噪和敏感度,他和团队在深圳泡了七天。连续两天24小时通宵后,释空的听力出现了短期的应急性受损,“不能跟我说话,(听起来都是)高分贝噪音”。
 
两年多的纠结、辛苦和煎熬,让天猫精灵X1得到了德国红点大奖,还让很多名人对其一见钟情,比如香港特首、墨西哥总统等等。
 
其市场表现同样不俗,上线4个月,天猫精灵X1销量过百万;上线9个月,销量过200万。
 
这个销售进度,也让阿里巴巴人工智能实验室负责人浅雪颇为自豪,“去年天猫精灵双11百万销量,证明了中国智能音箱不是伪命题。200万台销量,证明了中国智能音箱市场比美国更大、发展速度更快。这就是中国人工智能的加速度。”
 
可以说,天猫精灵的入场,承担了市场启蒙和用户教育的作用,改变了中国智能音箱高度分散的市场格局。
 
而高达百万级别的销量,初具规模的用户市场,才能吸引更多的开发者和创业者入场;一个与C端用户能够贴身互动的大平台大生态,才能鸣锣开局。
 
目前,天猫精灵已经吸引了6500名开发者,上线了356款技能,搭建了整个中文市场里面最大的智能音箱技能市场。
 
开发者的入场,反过来又推动了智能音箱产品和可用性和完整度,反过来又提升了智能音箱的用户接受度和忠诚度。类比美国智能音箱30%的家庭保有量,中国智能音箱市场空间依然很大,处于大爆发前夜。
 
外壳千变,核心在“智能”
 
始于智能音箱,却不止于智能音箱。
 
当别的互联网公司都在做系统(dueros、腾讯云小微)的时候,阿里做了一个硬件天猫精灵。在历经煎熬,销量突破200万、烧热了整个智能音箱市场,勾得互联网公司纷纷入场时,阿里为何掉转枪头,将战略重心放在系统升级上?
 
对于阿里来说,在人工智能和人机交互领域的布局,不仅在千变万化的终端产品上,还在于天猫精灵等智能终端的大脑里——AliGenie交互系统。
 
内在系统的先进与否,决定了智能硬件产品好坏的关键。
 
风投公司Loup Ventures曾测试过苹果智能音箱HomePod的交互能力,发现HomePod的正确回应率仅有52.3%,低于Google Home81%的正确查询率,也低于亚马逊的Alexa和微软的Cortana————显然,仅有硬件设计和制造能力远远不够,这正是AliGenie之于阿里的重要性。
 
相比于以“听”、“说”为主要交互方式的AliGenie1.0,AliGenie2.0引入了视觉能力,能够进行视觉认知、多模态交互、情景感知,模拟人与人之间的交流方式。
58fa4fe01169f1378acfa0317b432537.jpg
 
从听觉拓展到视觉,AliGenie2.0时代的天猫精灵,作为国内首款“看得见”的智能音箱,再次重新定义了中国智能音箱行业。
 
AliGenie 2.0的视觉能力,首先落地在天猫精灵X1上。“精灵火眼”功能,可以识别117套图书、4万个药盒,未来还将推出“万物识别”、“人脸识别”等功能。
 
浅雪认为,未来的人工智能产品,还要具备情感交互能力,和人类越来越接近。
 
因此,精灵火眼搭载了一套丰富拟人的表情系统,这只萌眼大猫,会随着场景的变化,和人类做出互动,呼应喜怒哀乐的情绪。摸它的鼻子,它会有点不高兴;摸它的嘴巴,它会有点诧异;摸它的头,它就咯咯咯笑起来了。
 
而反过来说,天猫精灵高达200万的销量,也给AliGenie2.0提供了一个最佳的人机交互训练场,数量繁多的交互行为,丰富多元的使用场景,可以帮助它快速积累、纠错、学习与成长,加速AliGenie2.0的进化过程。
 
这正是阿里把战略重点后移到交互系统的最好时机————当初阿里亲自下场做硬件,是因为市场上缺乏可以一款足以支撑AI大生态的规模化的智能音箱,再先进的交互系统也无法落地,也没办法在多场景应用中实现进化。
 
如今,天猫精灵X1的200万销量,已经搭建了落地应用的基础。推动系统进化,顺其自然就成为了优先项,上位成为阿里人工智能新的战略重点。
 
AliGenie 的平台化初心
 
把战略重点后移到交互系统上,还源于阿里的平台化基因。浅雪说,阿里和智能家居品牌之间,不是竞争关系,而是合作关系。
 
AliGenie就是阿里平台基因的延续,其目前的合作伙伴覆盖航空、养老、儿童教育、酒店、汽车、家电、影音等领域,覆盖近100个品牌。
 
智能终端领域,已经连接了 4500 万家用电器。而到了AliGenie 2.0阶段,和家电行业巨头LG、博世的合作,正在有序推进过程中。
 
互联网汽车行业,AliGenie 已经开始与沃尔沃、宝马、奔驰等进行合作探讨。 
 
合作推进最快的领域,包括儿童教育、游戏、动画、养老等等。
 
比如,“精灵火眼”与国内顶尖的出版社合作,精选了适合3岁到8岁儿童的117套图书,如《小猪佩奇》等热门IP。
 
在22日的发布会上,前来为发布会站台的六位外部嘉宾,全部来自图书出版界,比如北京师范大学音像出版社社长邱恋、浙江少年儿童出版社副总编辑吴颖等等。
9a8a77e23fb30240455ee1f147afa773.jpg
 
“精灵火眼”与阿里健康合作,推出识别药盒的功能,能识别4万种中国常用药,只要扫一扫药盒,就能用语音播报药名、功效、过期日等信息。
 
“未来,我们会将包括视觉认知在内丰富的人机交互能力,输出到更多应用场景当中。”浅雪说,AliGenie要打造赋能行业的开放平台,“我们鼓励欢迎未来做硬件的生产伙伴,用我们这个系统打造一些他要的东西。跟我们合作的智能家居厂商都是快乐的,我们要一块飞起来。”
 
可以说,天猫智能音箱是AliGenie重要的落地场景和应用标杆,而AliGenie才是阿里打造广阔的人机交互平台的基础设施,独乐乐不如众乐乐。
 
不靠硬件赚钱
 
阿里不把战略重点放卖硬件上,还因为阿里压根不准备通过卖硬件赚钱。
 
打造一款能够“看见”的智能音箱,通常的做法是出品一款带屏幕的新款音箱。但阿里却反其道为之,通过手机app为智能音箱赋予“视觉能力”。
 
这种选择,看起来“吃力”又“吃亏”————推出带屏幕音箱,可以给产品定高价。但阿里的方案,却要在现有的智能音箱上,带着镣铐跳舞,低成本实现智能升级,同时还要适配市面上成千上百款智能手机,难度系数颇高。之所以迎难而上,就是为了让用户少花钱,尽量不增加硬件成本。
 
“几乎不用增加任何硬件升级成本,我们做的是普惠科技。”浅雪说。
 
这一做法,非常类似Google Cardboard。 这款谷歌2014年发布的可折叠智能手机头戴式显示器,以透镜、磁铁、魔鬼毡以及橡皮筋组合而成。谷歌并不售卖这款产品,而是在其网站上免费提供零件列表、示意图及组装说明,鼓励用户自找零件自行组装。
 
普惠的路径,也是天猫精灵X1成为爆品的原因之一。去年,当天猫精灵X1上线时,互联网巨头出品的智能音箱价格普遍在千元左右,而天猫精灵X1的价格低至499元。
 
阿里压根不打算从智能影响产品线赚钱,而赚钱也不是浅雪和其团队的KPI,“老板跟我说了,要靠我赚钱连水电费都不够交的,我们人工智能科学家投入成本非常大,核心还是希望改变用户生活、赋能客户。”
 
所以,阿里人工智能实验室把战略核心放在系统升级上,虽在意料之外,却在情理之中。
希望看到您的想法,请您发表评论x