专栏观察

人工智能看图谱曲:下个莫扎特会是一台机器吗?

 

8e6ae0610d86115b3a679cbe7c280023.jpg

 

最近《中国新歌声》开播,然而整个节目几乎没有什么亮点,使得观看过程无聊大于愉悦。作为一个曾经追过《中国好声音》的人,不得不说,即使抛开版权之争导致的问题,这届《中国新歌声》似乎很难抓住观众的耳朵和眼球了。

 

尤其参选的选手选唱曲目简直毫无新意,总是拿着四位导师的作品和一些老歌翻来覆去的唱,观众的耳朵早就听出了茧子。而作为一个科技控,我想,如果在这个时候,有一位选手上来跟大家说,演唱的歌曲作者不是人,而是人工智能的话,一定会让所有人眼前一亮,甚至让这个节目瞬间火爆。

 

这可不仅仅是一个设想。作为人工智能的技术开拓者,百度的人工智能技术正在逐渐实现这个设想:在联手尤伦斯当代艺术中心举办的“AI科技与艺术之夜”的活动中,百度利用人工智能技术,完成了机器读图和音乐再创作,将美国艺术大师罗伯特·劳森伯格的传奇式巨作《四分之一英里画作》的其中两联分别谱成了20余秒的钢琴曲,实现了视觉呈现向听觉表达的转化。

 

人工智能是如何做到看图谱曲的

 

事实上,在目前来说,全球范围内能够实现人工智能自动谱曲的仅有百度和谷歌,而本次百度尝试将图像所体现的情感移情转变为带有声音信息的技术则更为复杂。在给我们带来极大的想象空间的同时,也说明了百度在人工智能技术方面的领先优势。在百度的努力下,也许,下一个莫扎特将会是一台拥有人工智能的机器。

 

据悉,百度用上千台PC服务器和近1000GPU服务器构建了世界上规模最大的深度神经网络,支持万亿参数、千亿样本、千亿特征训练;在算法上百度应用了深度神经网络等分布式算法,支持的功能包括语音识别、图像识别、自然语言处理等等。此次的人工智能看图谱曲,正是通过其全球最大规模的深度神经网络和深度学习算法由机器自主学习实现的。

 

百度神经网络在“看到”图像后,首先会对图像进行分析解读,为图像打上若干具象化的标签,然后通过搜索挖掘相关的音乐信息,对音乐拆分重组,再合成与图片内容相匹配的音乐旋律,最终拼接成完整的曲子。仅仅从过程来说,看图谱曲和这比常规意义上的我们理解的谱曲更加困难,正如同命题作文和自由作文的区别。

 

b9098be2d5bec6a1c0024559b5d0b0d1.jpg

创作是人类作为高级生物的优势之一,写诗画画谱曲对于艺术家来说并不是件难事,但如何让机器像人类一样自主创作,却是人工智能领域的难题之一。而作为国内最具技术基因的互联网巨头,看图谱曲已不是百度第一次尝试让人工智能自主创作。早在2013年,百度就曾使用人工智能技术对用户上传的图片进行深度学习,为用户创作诗歌。把人工智能即使从作诗延伸到看图谱曲,体现了百度在人工智能等前沿技术领域中的领先性和创新精神,也展示出百度在人工智能方面的技术实力。

 

百度在人工智能领域的到底有多强

 

人工智能将会是推动产业革新发展的重要力量,这是所有人的共识。而在国际上,谷歌、微软、Facebook等国际巨头一直都把未来赌在人工智能上。伴随着中外科技巨头争相加大在人工智能领域的投资布局,人工智能技术的大规模商业应用开始初露端倪。如今人工智能技术已被越来越广泛地应用在了互联网服务、智能家居、智能汽车、机器人等众多前沿领域。

 

在百度首席科学家吴恩达看来,百度最核心的人工智能技术包括图像、语音、自然语音理解、机器学习平台和大数据等几个部分。目前百度在这些领域已经拥有较多技术专利,并处于世界领先水平。之所以能够取得这个成果,是因为百度一直以来,都把人工智能当做一个大力投入的方向。

 

全球发达国家都在人工智能领域加快行动,尤其是许多先进的技术公司纷纷布局深度学习、人机交互和图像语言识别等技术。在这一领域,百度早早的就开始谋划布局。例如在2013年就成立了全球首家深度学习研究院,后扩充为百度研究院,下设人工智能实验室、深度学习实验室以及大数据实验室,招募吴恩达等人工智能顶级专家,建成了全球最大的深度神经网络“百度大脑”,同谷歌、微软等企业争夺人工智能技术制高点。

 

近日,《麻省理工科技评论》评选出2016全球了“50家最聪明公司”,百度名列第二。《麻省理工科技评论》如此评价百度: “百度在核心的搜索业务之外,语音识别、人工智能技术领域的积累已经让百度在语音识别上可与真人相媲美,并且百度在硅谷成立自动驾驶研发部门,也是视觉识别、传感器等领域的领先企业。”这证明了百度在人工智能方面的布局成功。

 

在人工智能领域,百度不止想制造下个莫扎特

 

看图谱曲只是百度技术体现的一个例子。实际上,过去的五年是人工智能突飞猛进的阶段,而百度在图像识别技术上已做到了全球领先。目前,百度的Deep Image计算机视觉系统已经能够对图片内容进行识别,在模式识别上取得了重大突破,其中LWF人脸识别精度高达99.86%。而百度自主研发的人工智能机器人“度秘”已经在肯德基的智能点餐、高考的智能信息服务等多种场景中实现了运用。

 

可以这么说,百度的人工智能几乎已经渗透到百度所有的产品线当中,之所以如此,是因为长期以来,百度一直在研发人工智能技术在家居、汽车、无人系统、安防等领域的推广应用,并丰富移动智能终端、可穿戴、虚拟现实等产品的服务及形态,推动人工智能与机器人技术的深度融合。相信在未来,百度人工智能技术将会进行更多领域的尝试,将情感分析和理解的成果应用于产品中,为用户提供个性化和精准化的智能服务,全面提升用户体验。

  

百度总裁张亚勤上月曾表示,去年百度在研发方面投入超过100亿元,而“百度大脑”作为百度在人工智能领域的核心,已孵化出如无人驾驶、智能搜索等创新技术。目前“百度大脑”已具备视、听、说和预测、规划决策以及行动控制的能力,并将被应用到金融、汽车、医疗等领域。他同时表示,“智能交通”将是中国企业弯道超车的好机会。

 

自计算机诞生之日起,人类便不断追寻赋予机器以“生命”。 百度人工智能技术正试图让看似天方夜谭的事情,变成现实。而当不用手便可以操作手机的语音识别等技术慢慢便利了人类生活后,人工智能便被赋予在工业、生活等领域的发展厚望。而如何将这些人工智能应用到各个领域撬动刚需,将会决定人工智能扩展的边界。

 

总之,随着人工智能看图谱曲的技术日趋成熟后,下一个莫扎特真的会是台机器的日子不远了。但即使如此,人工智能的爆发却还远未结束,相信在未来,会有更多的不可思议让我们体验到技术的魅力。

 

 作者:歪道道,互联网与科技圈深度观察者。微信公众号:歪思妙想

 

希望看到您的想法,请您发表评论x