专栏观察

人脸识别C位出道的商汤,又发布了这五大硬核AI!

当下,人工智能已经成为人人口中耳熟能详的热门词汇。但大多数圈外人并不知道,这个诞生于70年前的技术,曾经遭受三起三落,直到深蓝打败国际象棋冠军和近年来阿尔法Go多次打败围棋冠军,借助深度学习,人工智能再次成为行业的宠儿。

实践是检验真理的唯一标准,知行合一才能正确感知并改变世界。在人类探索世界的历程中,互联网的文本超链接世界中,信息与人之间的鸿沟正在被填满,但这只是“小乘”境界;感知更广阔的世界,需要将更多图形、视频富媒体信息进行结构化,并被人类获取,这才是“大乘”境界。

产业升级正在从机器时代进化到机器人时代。谁能让机器拥有人类的识别能力,在无处不在的非结构化的图形视频海洋里,重新构建新的信息结构和秩序,并为人类服务,谁就真正开启了人工智能时代的大门。

【商汤科技超越临界,开启人脸识别落地时代】

每种技术都有临界点,尤其是当技术成熟度超越人类的那一刻,尤为关键。智能手机的黄金十年,始于iPhone4采用的视网膜屏幕有了质的飞跃,细腻的画质超过了人眼所及,更远超纸质媒体,而人工智能的临界点来自于图像识别率不断攀升,并最终超越人类,AI才有了落地的底气。

2014年,全球科技巨头纷纷加入人工智能大战,脸书对外宣称,其人脸识别准确率已经接近人眼识别能力,但最终实现超越临界点的企业,却是来自中国的AI独角兽——商汤科技。

2014年3月,商汤团队发布人脸识别算法,在LFW数据库上准确率达98.52%,在全球首次突破人眼识别能力;随后,2015年,陆续发表的DeepID系列算法,逐步将人脸识别准确率提升至99.55%。如果说苹果开起了智能手机的大门,商汤开启了整个人脸识别行业技术落地的智能时代。

人脸识别是深度学习的热点领域,而将人脸识别不断提升,离不开深度学习三大要素:算法、算力和数据。这也是商汤一直不断积累三项能力。

拓展算法需要不断补充人才,商汤在短短三年聚焦到150多名深度学习博士;算力方面,商汤自建拥有超过14000块GPU的超算中心,搭建亚洲顶级AI超算平台,支持千亿级参数模型;在数据方面,过去数年间,商汤通过与700多家客户和伙伴建立的深度合作,快速解决了针对实际应用场景的算法迭代问题。

 

(商汤深度学习超算集群)

念念不忘,必有回响;锲而不舍,金石可镂。在产学研闭环的不断投入中,商汤科技收获满满。

ECCV与CVPR、ICCV共称为计算机视觉领域三大顶级学术会议,堪比AI圈子的华山论剑。据统计,2018年,CVPR 总共收录979篇论文,来自中国企业和研究机构的论文在100篇左右。商汤科技和联合实验室凭借44篇论文入选的出色成绩,不但刷新了中国企业在全球计算机视觉顶尖会议上的新记录,更在全球范围与谷歌、Facebook等形成鼎力之势。

不可否认,最近几年无论在中国还是在全球,人工智能都取得了爆发式的发展,在中国上百家人工智能公司,如雨后春笋般涌现。他们也学习商汤,参加各种国际顶级会议,发表论文和文章,人工智能百家争鸣,成为中国科技产业的一大亮点。

但这并不意味着所有后来者、追随者都能学到商汤的精髓和初心。商汤的初心是要做真正原创的技术。无论是大赛获奖,还是发表论文,都是商汤原创精神的外在表现和副产品,这些很容易模仿,但商汤的原创精神及内核却很难模仿。

而秉持技术原创精神,意味着商汤一直走在行业前列,一直占领人工智能技术的制高点。只懂得拿来主义的后来者,缺少技术的原创性,往往很难在深度和广度有所突破,更无法从产业界脱颖而出。

【商汤硬核AI,赋能手机及娱乐互联网只是个小目标】

商汤是一家懂得平衡智慧的企业,也是一家兼顾技术研发与产品落地的公司。他们重视研发,拥有强大的研发团队,但却不是一家烧钱的公司。和同行相比,他们的商业模式清晰,研发的各种技术大多能落地,能够实现自负盈亏。就像创始人汤晓鸥所言,“我们的融资不是用来烧的,而是做伟大的事”。

在美国,深耕AI技术的往往是脸书、谷歌、苹果这类资金雄厚的跨国企业,但我更看好商汤模式。现在的商汤更像是早期的百度。早期百度在为各大网站提供搜索引擎技术,用技术赋能互联网,同时在积累自身的品牌和技术实力,这与商汤为产业赋能的思路如出一辙。

只不过,和百度all in AI,从家庭和自动驾驶两个角度切入相比,商汤用技术赋能的范围更为广泛,商汤的AI版图从智能手机到互联网、智慧城市、AR,乃至IT业和更广泛的传统产业。

商汤为很多行内知名企业提供了人工智能服务,也许作为一家ToB的技术公司,很多技术已经广为人知,使用者数以亿计,却很少人知道研发出如此酷炫技术的企业,是耕耘在AI前沿的商汤科技。

我举两个例子:

一个是智能手机领域。数据显示,2018年全球TOP6手机品牌中,国产手机华米OV占据四席。国产手机上日益增多的人工智能黑科技,如人脸解锁、智能美颜、背景虚化、智能相册、3D结构光等技术已经成为国产旗舰手机标配,体验甚至可以比肩三星、苹果等全球品牌,凭借AI黑科技,国产手机在市场上备受关注。

 

为国产手机提供AI支持的,正是默默耕耘在人工智能行业一线的商汤科技。我在之前文章打过一个比喻,如果每一台智能手机都是一个AI终端,那么商汤科技就是为国产手机赋能的“AI水电站”。

另一个领域是网络直播和小视频领域。现在,在网络视频业务方面,商汤是目前亚太区域最大的互联网视频及直播平台技术供应商,服务80%以上的直播和短视频分享平台。

例如,商汤基于人脸关键点检测跟踪技术,为美图、映客直播、新浪微博、FaceU、B612等实现脸部特效、美颜、手势识别、前背景分割等功能,丰富的AR特效成为这些APP拉新和保持持续活跃的重要动力。

很多人抱怨人工智能高冷难以落地,而事实上它就在每个人的手里,每天如影随形。数以亿计的智能手机,以及上面的大部分APP都打上了人工智能的烙印。

不只如此,商汤在智慧城市领域也已有很多落地,比如上海,在去年举世瞩目的首届中国国际进口博览会上,商汤承担了上海国家会展中心及周边区域的视频分析保障任务,为进博会保驾护航。在智能汽车领域,商汤更是与全球著名的汽车公司本田签订长期合作协议,共同深耕自动驾驶技术,加速智能汽车的研发进程。在教育方面,商汤联合华东师范大学慕课中心,发布了全球第一本人工智能教材——《人工智能基础(高中版)》。

过去几年内,商汤在不同领域内同头部企业合作,共同探索人工智能的行业落地。对于商汤而言,服务更广泛领域和行业,更多用户的更深层次需求,以硬核AI技术为核心,拓展不同维度的场景,让AI赋能互联网、赋能IT,甚至赋能整个产业才是商汤的终极理想。

【C位出道2019商汤智能峰会又发布了哪些AI黑科技】

在去年4月25日举办的2018商汤科技人工智能峰会上,商汤以原创AI技术赋能百业,发布了多个新品:增强现实黑科技SenseAR,智慧城市、平安城市解决方案SenseFace3.0和SenseFoundry,以及智能汽车产品驾驶员监控系统SenseDrive DMS等。兼顾理论研究和产品研发的商汤科技是当仁不让的C位出道。

今年5月15日,商汤科技召开主题为“大爱[AI]无疆”的第二届人工智能峰会,现场发布了一系列创新的人工智能产品及解决方案,包括智慧城市、智慧健康、智慧零售、教育及AR五大领域,其中既有智慧城市和AR的升级版,还增加了热点行业的AI解决方案。

 

在视觉深度学习领域,商汤已经遥遥领先,在手机和移动应用领域商汤已经小试牛刀,商汤的产品已经成熟化、规模化,并进入了大规模的行业赋能阶段。商汤在这次峰会发布了11款产品,覆盖5大领域,全面出击线下多个场景。

那么,这次商汤为行业带来了哪些AI黑科技?我们不妨一起看看这次峰会的五大看点。

第一、是智慧城市

未来城市不仅提供生活空间,更应该是一个安全便捷有温度的智慧社区,智慧城市对于智能化的要求不仅仅安全可靠和效率便捷,更要求管理系统能够实现超大规模、多场景无缝覆盖。

比如城市十万路摄像头的数据,再加上行人、车辆、事件等不同维度的数据,对AI平台带来巨大挑战。安全不应留有死角,大规模无缝化管理对于城市智能系统的处理能力、算法成熟度和性价比,都提出更高要求。

如何应对城市规模化管理,商汤很有心得和经验。去年,商汤发布了SenseFoundry方舟城市级视觉开放平台,并率先在人工智能和智慧城市领域提出构建城市的“视觉中枢”,去应对城市规模的智能视频分析和应用挑战。今年发布了一套全场景端边云一体化方案——“AI City端边云一体化方案”,实现大数据闭和各场景打通。

 

升级后的SenseFoundry2.0是打造城市级全场景分析能力的基础。它能更加稳定地支持非结构化特征和结构化信息融合处理和分析,如人脸、行人、车辆、非机动车检测的识别和分析,以及人群分析、道路结构化、遥感解构、事件检测和分析、行为姿态识别分析等,同时,还可应对更大规模、更为复杂的应用场景,为城市级、多源、多态、融合分析提供支持。

如果说,去年是商汤AI能力单点落地的元年,今年必将是AI全场景覆盖、规模化服务于社会重要一年。规模优势无疑是商汤这次智慧城市升级的最大特点。我想,也是有别于对手的最大亮点。

第二、教育领域

电脑和英语要从娃娃抓起,人工智能也应从基础教育开始普及。但人工智能技术过于高冷,很多算法需要扎实的计算机和高等数学功底,同时还要有很强动手编程能力,往往会吓跑不少初学者。如何学、谁来教、如何评价教学效果,都是难解的问题。

商汤创业班底来自是香港中文大学、麻省理工学院、中科大等诸多知名学府,是高校教育的受益者,也就不难理解他们会倾力回报社会,致力于产学研闭环的搭建。2018年,商汤科技联合华东师范大学慕课中心及上海知名的高中优秀教师联合编写了全球首本面向高中生的人工智能教材《人工智能基础(高中版)》;此次峰会商汤更进一步将AI教育往下延伸,发布了《人工智能入门》全国版教材,把人工智能教育降维拓展至初中教育阶段。

 

《人工智能基础》我通读过好几遍,内容丰富,又浅显易懂、很适合做入门级的教材;这次发布的《人工智能入门》一共四本,同样内容翔实而且趣味十足,非常适合青少年等年轻群体学习。

教育的最高境界是寓教于乐,人工智能教育也不例外。这次峰会上,商汤还发布了SenseStudy AI实验平台、SenseRover Pro自动驾驶小车、SenseRover Mini小车等多款产品,极大丰富了教材品类,让学生可以边学边做实验,甚至可以接触到时下相当前沿的自动驾驶技术,亲自训练自动驾驶的小车,激发不少学生的兴趣。

不得不感慨,商汤在人工智能教育的厚积薄发,短短一年多的时间就实现了多维完整的AI基础教育体系的布局,成为行业内不折不扣的先行者。当很多高校把人工智能作为研究生课程时,商汤把人工智能普及到刚刚进入青春期的05后群体,确实值得人们为商汤点个赞。

第三、医疗健康

医疗无小事。要想技术最终惠及患者,从辅助医生工作入手也是方式之一。然而,目前市面上很多AI医疗企业多是聚焦于辅助诊断环节,却忽视了很多与治疗相关的临床需求,很多临床科医生仍旧缺乏治疗规划与实施辅助工具,尤其是对于三维影像后处理功能,除此之外,也面临着数据获取难等问题。

而商汤科技对临床医生的痛点早有关注,在去年的WAIC上,就推出了赋能全院临床诊疗愈全栈操作的SenseCare智慧诊疗平台原型,据我所知,这是业内第一个提出“用AI赋能临床诊疗愈”的企业。本次大会商汤正式推出SenseCare智慧诊疗平台,凭借着领先的深度学习算法与医学影像高级后处理技术,在实现高并发三维渲染能力的基础上,做到了为全院临床科室提供赋能诊疗愈全流程的平台产品。

 

单台SenseCare设备能支持超过160位医生同时进行高质量的三维渲染及交互,让医生通过登录网页,即可在不同的终端使用复杂的三维后处理功能,满足全院级别的应用。与此同时,原始数据仅能在线渲染和浏览,无法进行下载,保障了医疗数据的安全。

根据发布会现场商汤所展示的内容来看,商汤可以针对不同科室的需求和工作流灵活拓展含有丰富AI算法模块的临床应用,目前已经在骨科、呼吸科以及病理诊断等方面实现了AI应用的布局。

第四、智慧零售

用全景视角观察,人们会发现零售行业的信息鸿沟确实真实存在。线上零售商家借助商品全流程的数字化,得以洞察用户需求,增加消费转化率和复购率,让商家更容易量化营销效果,大大提高了营销效率。但线下零售,往往很难收集人、货、场各个维度的数据支撑,更难以驱动精细化运营,而这恰恰是传统零售业的痛点和软肋。

贴心的小型线下实体店,会让会员在踏进商店的那一刻,主动打招呼,报出用户最需要的产品和服务,个性化的服务让顾客感受到宾至如归;但是大型商场里很难提供类似的个性化服务。规模零售,有时反倒限制个性化。

即便借助普通的AI技术,也很难适应线下零售的复杂度和多样化。在实验室场景往往使用高端的专业设备,但真实的线下零售场景,则要考虑运营和成本,很多使用的是普通摄像头,此外实验室环境简单,而线下有镜子、海报、模特,这些都会干扰AI的判断,如何适应不同的商业场景,真正让人工智能技术赋能到线下零售行业成为行业落地的一大难题。

本次峰会上,商汤发布的SenseGo智慧零售视觉平台基于“人脸+人体视觉技术”,借助商汤算法非常强调不同场景的适配能力和升级能力,真正做到了让AI迅速适应不同的商业场景,从而为零售主们提供会员识别、顾客属性分析会员到店提醒等一系列功能,让线下零售企业同样可以享受到数字化营销的红利,大幅提高营销效率。

值得注意的是,商汤AI算法加持的SenseGo门槛很低性价比却很高。即便借助最普通的摄像头,也能感知人、货、场的变化,用较低的成本就能获取细粒度和高精度的数据,比如年龄、性别、位置、停留时间等。之后,这些数据再与客户CRM打通,这样线下零售主们就能针对人群画像进行精准商品推荐和营销活动。

除了信息细粒度高、数据精准,SenseGo给我最深的印象是庞大的容量和超高性价比。官方数据显示SenseGo智慧零售视觉平台可支撑5万日高峰客流,20万平米的大型商场面积,百万级别的动态人脸库容,这相当于40个盒马鲜生或者2000个711便利店,如此规模,几乎覆盖所有类型的商家和场景了,也只有这样,才能真正意义上帮助线下零售主不断提升服务质量,降低运营成本,实现高购买转化率,达到精细运营和精准营销的目标。

 

第五、AR技术

AR技术将虚拟与现实完美结合,创造出别样的交互体验,无论在C端和B端、抑或是在互联网直播里的美体瘦身、美容美颜特效,还是手机上3D AR特效,带给人们无穷快乐。商汤作为国内最早AR技术支持者,SenseAR被不少客户形容“承包了互联网美业”,这话并不夸张。

在本届AI峰会上,商汤科技正式发布了创新产品——SenseAR Avatar整体解决方案。全新的SenseAR Avatar特效引擎能够检测人物的身体形象和穿着风格,通过3D渲染快速生成个性专属的3D虚拟形象,并支持多种风格切换。目前,SenseAR Avatar是市场上首个可以实现照片生成和真人驱动的重磅AR产品。

而全新升级的SenseAR 2.0平台,带来了基于AR眼镜端的SenseAR Glass眼镜平台和基于云端的SenseAR Cloud云平台,具备更多商汤科技领先的AI能力,促进AI与AR更加紧密的结合,赋能包括手机和眼镜在内的更多终端设备在不同场景中的应用落地。还联手全球领先的3D内容创作平台Unity,共同推动AR生态,为文旅、工业、教育等垂直行业客户提供更加专业的支持。看得出,商汤在AR产业的野心确实不小,他们正在通过将领先的人工智能技术赋能到AR产业,最终将改变人与人、人与物、人与信息的沟通和协作方式。

 

【结束语】

产业革命经历蒸汽时代、电力时代、到信息时代,现在正在步入第四次工业革命。人工智能技术被看做是第四次工业革命重要标志,未来AI能力会像电力时代的水电、信息时代的互联网一样,成为人们生活中的基础服务。

商汤无疑是这一场AI革命的弄潮儿,他们不但是全球AI的先行者,而且凭借在图形识别算法上的积累和实践积淀,在互联网的后文本时代建立宽阔的护城河,成为全球不多见的能和谷歌、脸书、苹果同台竞技的中国公司。

在人工智能领域,知行合一仍然适用,正所谓“得知者,得智”。

商汤的英文SenseTime,大部分产品名也以Sense开始,其中寓意不言自明:一切从感知开始。改变世界需要先认识世界。机器也不例外,推动产业从机器被动工作进化到机器人主动学习的时代,感知是第一步。而商汤正因为在感知技术上(人脸识别、图形识别等)不断积累和技术沉淀,并一直走在行业的前列,才得以不断引领人工智能行业的发展。

王冠雄,著名观察家,中国十大自媒体(见各大权威榜单)。主持和参与4次IPO,传统企业“互联网+”转型教练。每日一篇深度文章,发布于微信、微博、搜索引擎,各大门户、科技博客等近30个主流平台,覆盖400万中国核心商业、科技人群。为金融时报、福布斯等世界级媒体撰稿人,观点被媒体广泛转载引用,影响力极大,详情可百度搜狗360。

希望看到您的想法,请您发表评论x