互联网

对话青春的讯飞智能录音笔,却总是词不达意

 

  编辑 | 谢治贤

  出品 | 于见(ID:mpyujian)

  随着智能对话场景的逐渐落地,人们渴望对话,享受着对人工智能呼来唤去的快感,智能音箱、翻译笔、录音笔等智能产品也争相抢占着智能对话场景市场份额。

  前有华为、小米、百度等科技互联网公司布局的智能音箱扮演家居管家,后有搜狗、讯飞推出的智能录音笔充当办公助手。

  就在昨天(9月10日)教师节,科大迅飞在北京召开迅飞智能录音笔SR301新品发布会。

  这款新品录音笔主打青春智能系列,专为学生研发,号称课堂笔记小能手。它的语音转录技术适用于多人之间的远程交互,以及各种复杂的场景。但新产品还在宣传期,许多问题在进入市场前就已经暴露出来。

  一边录音,一边出错

  2019年,是讯飞人工智能应用元年,消费者BG总裁胡宇在会上表示,今年是中国科技大学成立20周年。在这一漫长的过程中,科大讯飞积累了许多关于人工智能的观点想法。人工智能能否从技术转向商品,仍然是一个巨大的挑战。对于人工智能来说,实现语言理解、知识表达和逻辑推理是非常重要的。本次大会的新产品被讯飞认为是其成果的重要展现,希望能给文艺工作者带来一次完美的体验。

  新闻发布会一开始,北京大学光华管理学院的学生们向几位老师献上了祝福之花。之后,国务院参事、国家发改委原副主任徐宪平就人工智能的发展发表了自己的看法。同时,在大屏幕右侧,迅飞录音笔这个人工听证也进行了实时翻译和现场展示。讯飞表现出的听写的识别度和修正错误的能力,企图让大家感受到它的快捷和智能。

  但情况却并不理想,甚至是一边录音,一边出错。这款售价999接近千元的录音机,在比市面上同等功能录音机贵出两倍的情况下,其听写准确度以及纠错能力并不十分出色,远远不能满足观众的期望。

  我们来具体看看讯飞新品录音笔的配置。迅飞智能录音笔SR301是继SR701旗舰版和SR501标准版之后,又一款面向年轻人的新型录音笔。利用语音转录技术提高语音识别率。语音转录技术适用于多人、多复杂场景的远程交互。它可以调整识别文字结果、过滤语气助词、调整词序等,使抄写的结果能够顺利阅读,更接近文字表达的严谨性。

  而根据现场使用情况来看,讯飞录音笔的宣传言过其实。在整场发布会中,讯飞录音笔一直在旁进行录音转写,几乎隔一段时间就会出现漏写、错字的情况。同时,其纠正功能发挥的作用也微乎其微。

  配置方面,迅飞智能录音笔SR301的屏幕尺寸为3英寸,重110g,厚度为12.2mm。对于录音笔来说,它的体积显然比普通的录音笔大得多,几乎接近一部小型手机的大小。同时,由于配备了电子屏幕,所以其续航能力也大打折扣,为10小时的工作续航,比市面上同价位的续航能力低了好几个小时。另外,作为一款青春版的录音笔,售价却高达999元,高出其他国产品牌录音笔两倍的价钱。

  但不得不提的亮点是迅飞智能录音笔SR301采用了1个主麦克风+4个副麦克风阵列的组合,不仅可以满足长达10米的录音需求,还支持中英文同步传译。其中英文的实时翻译功能,迅飞在整个会议过程中也使用了这一技术。透过大屏幕,可以看到客户的演讲同时被翻译成中文和英文。不过,讯飞较为不方便的一点是,没有云端储存功能,导致万一遗失设备或者设备不在身边,那就代表数据的无从获得。

  这次,迅飞还以联合国美、京东、伟仕佳杰、迪信通、小米有品等头部平台的方式进行新产品的联合销售。在发布会现场,科大讯飞与中国联通举行了战略签约仪式,并邀请各领域翘楚就“人工智能与高效学习”主题进行了讨论和交流。

  人工智能场景狭小

  随着人工智能技术的发展,讯飞人工智能录音笔集录音、编辑、同声传译等功能于一体。它为速记、记者和上班族提供了一些解决方案。但是,要真正达到智能录音笔的要求标准,还需要实现更高的翻译精度,拓展更多的应用场景,满足用户在各个场景中的独特需求,从而实现行业的整体变革。

  为了实现多场景应用和产业扩展,录音笔必须具有较强的联接能力和云存储检索能力。为了实现这一点,讯飞录音笔必须依赖于讯飞输入法,同时添加联接和转录的能力。此外,讯飞还必须开发云存储功能,摆脱对物理设备的过度依赖,能够在不使用录音笔的情况下跨地区编辑。

  除了改善客户服务体验外,讯飞还必须改善合作伙伴的服务。讯飞的开放式口碑服务,从技术到服务体系,都需要相关服务品牌的配套,才能吸引更多的合作伙伴。

  据了解,讯飞推出了讯飞身份识别、讯飞语音合成、语音变化等多项人工智能技术,为讯飞语音识别、语音合成、翻译等相关功能提供技术支持。不过,讯飞的核心人工智能能力仍然不足,规模也不大。在人工智能的道路上,讯飞还显得不够成熟,无法升级其智能硬件业务并开发更多新的人工智能产品。

  “未来的人工智能授权必须更重,而不是更轻。它需要对场景进行独特的优化和易化。”人工智能业内人士表示,未来行业可以挖掘出很大一部分空间,是关于人工智能技术在会议等场景中可以提供的服务。

  因此,目前的录音笔涉及到音频的分析、录音和处理这些问题,而如何将这些功能扩展到更广泛的行业和场景,将是讯飞以及广大同行面临的难题。

  AI研究学会专业人士认为,从目前的发展态势来看,国内人工智行业已经达到世界水平,但讯飞智能录音笔背后的语音识别和机器翻译却处于薄弱的人工智能领域。它在特定的场景中与传统行业相结合。很难发挥它的爆炸力。

  作为一款工具产品,录音笔必须在人工智能技术的基础上继续加持,使更多的用户了解未来录音笔的各种功能。讯飞智能硬件产品要想突破技术、产品和产业链,必须依托讯飞开放语音听写服务、AI创新联盟和产业链横广纵向延伸。只有这样,录音笔制造端才能提高整个行业生产质量同时为顾客提供更好的服务,推动行业真正走向录音笔人工智能时代。

  开放服务面对难题

  在此之前,录音笔市场的竞争中同质产品之间一直存在激烈的价格战。这次,讯飞与业界头部平台结成人工智能创新联盟,向合作伙伴开放转写服务,以改变这种局面。从产品价格竞争到产品质量和服务竞争,使盈利模式向“硬件+服务”新模式转变,讯飞录音笔也面临诸多困难。

  事实上,与移动电源、蓝牙耳机等电子产品相比,目前录音笔的市场规模较小,录音笔行业正处于衰弱期,必须加以改变创新。纽曼董事长王洪峰也指出,传统功能单一的低端录音笔的生存空间越来越小。讯飞目前必须不断改进语音转录、翻译和识别服务。只有这样,讯飞才能成为行业价值纵向延伸的代表,为录音笔行业开辟更广阔的天地。

  讯飞录音应该为合作伙伴提供免费听写服务,而不是听写技术,不仅仅是一个开放平台或语音识别应用程序编程接口。讯飞需要将语音听写技术转化为对合作伙伴的完整服务,这样合作才能产生更大的用户价值。

  在讯飞的开放服务上,将与合作伙伴一起开发人工智能记录笔。其必须解决的问题是用户体验的新变化。讯飞需要通过“人工智能+软件服务+硬件”的方式突破行业规模上限,让整个行业从降低成本的竞争转向软件服务与硬件相结合的方式。推动商业模式升级。

  以讯飞的标签产品讯飞输入法为例,讯飞录音可以进一步将其听写服务与讯飞输入法结合起来,这可能是提高用户体验的一个很好的途径。数据显示,讯飞输入法在PC机上拥有着不错的市场份额,手机用户过亿。如果讯飞能进一步开听写服务,就可以为市场上90%以上的录音笔产品提供接入服务,也就是说,所有有需求的用户都可以大大节省录音转换时间。

  同时需要注意的是,讯飞听写服务是基于用户习惯的讯飞输入法。为了降低常用词的误码率,有必要建立一个自动的个性化识别网络。

  据讯飞录音笔此前产品使用的大量用户表示,在录音、抄写过程中,经常出现一些的错字、错句,语法不清,言语不尽如人意的情况。

  讯飞轮值兼消费者BG总裁胡郁表示,为了更好地实现讯飞的语音增强、语音降噪和语音合成技术,他决定逐步将讯飞的录音笔与讯飞输入法、讯飞旗舰软硬件产品相结合。希望未来能够利用人工智能技术推动整个行业在表达和信息获取领域的进步,为同行业企业的用户提供更好的服务体验。

  有分析人士表示,讯飞听写服务需要在记录能力的基础上,实现个性化的听写能力,提高听写的准确性。同时,讯飞参加的行业联盟,对推动录音笔行业收入模式由单一结构向“硬件+服务”转变具有一定的推动作用。但如何改变传统录音笔行业的经营模式,仍将是讯飞急需解决的重大难题。

  具体到录音笔产品上来说,本身语音技术较强的讯飞科技在录音转写技术上并不会落后于人。但对于交互人工智能和全新商业模式上,讯飞仍处于探索阶段。在如今商业交融、跨行合作的大局势下,单是做好某一款产品的某一种属性是已经是远远不够的了,只有掌控全局,延长纵深才能在纷乱的竞争中脱颖而出。

[!--page.stats—]