您的位置:首页 >新车 >

“技术流”的小鹏 终于开始玩声音了

严丝合缝的工业标准让生产效率和品控不断接近极限,同时也将一件件产品卡到了“千人一面”的地步。在充分享受工业化带来的高效便利之后,爱折腾的人类也开始进入下一个层次,想办法给冰冷的机器加入“人格”,并将其称为有温度的产品。

对交流和被理解的渴望也许早就写在了人类的基因里,所以我们会讲述神话,会寄情于物:在描写人类爱上没有实体的人工智能的电影《Her》中,寡姐的声音一度让男主角(以及观众)不能自拔。

“技术流”的小鹏 终于开始玩声音了

而在去年1024智能日发布全场景语音功能之后,小鹏汽车终于开始对声音本身下手了。

“技术流”的小鹏 终于开始玩声音了“你好小P”的新声音

更加精准的识别率、更快的反应速度,以及全场景连续对话、随时打断、双音区控制等,都是在功能性上的提升,其结果就是那个音调棱角分明转折机械感十足的小P能够更加全面和迅速地执行你的指令了——有时甚至快的让你猝不及防。

在堆了一年技术之后,小鹏汽车终于开始注重情感和使用体验,对小P进行了声音上的改造,颇有技术宅男终于觉醒的感觉。

“技术流”的小鹏 终于开始玩声音了

按照官方的说法,小P的新声音与常规的车载语音助手声音有着代际的差别。

“它不仅像人类声音般生动自然、充满生命力,还非常细腻动听,能表达更多人类情绪。这种直击心脏的沉浸感和临场感,让用户一听仿佛就能想象到她皮肤的质感。”

为了更加充分的证明这一点,小鹏还拿出了一些用户的评价。

车主一:就像初恋般的声音。

车主二:很有真实感,她就像就坐在副驾和我说话。

车主三:声音听着很舒服,情绪恰到好处,不会觉得腻。

你看,按照以往的经验,一个技术宅男是不可能这么“肉麻”的。

当你正打算沉浸于这些拥有“皮肤质感”的形容词时,他却又开始给你摆起了数据。

“技术流”的小鹏 终于开始玩声音了

语音质量评测指标MOS(Mean Opinion Score)是一项被国际普遍认可的语音质量评测方法,它可以判断一个机器声音多大程度像真实人声。满分为5分。新声音的MOS语音质量评测得分4.49,小P是目前微软MOS得分最高的车载语音助手。

不得不感叹一个企业的初始基因还真是强大。

情感提升的基础是科技

一切都得益于 “全新一代超大规模在线神经网络引擎+小型离线拼接引擎”的技术组合。

“技术流”的小鹏 终于开始玩声音了

语音合成的方式有很多种,主流方法有1。单元拼接、2。合成器、3。基于深度神经网络合成。不同技术有不同的特点,但总体来说新一代技术会比上一代更加自动化,运算力更强,生成的声音更加逼真。

前两种方法会产生机械的嗡嗡声,或者跳音这种强烈不平衡感,用户能明显感受到:它并不像人。

第三种基于深度神经网络技术合成声音是近些年突破的新技术,该模型通过大量数据和算力打磨后,可以输出无限逼近真人的声音。在这项技术之上,小P新声音在网络良好时支持24K/16Bit的超高清采样,可输出HiFi级高保真音质,这是决定音质好坏最重要的两个指标。

相比之下,旧声音只有16K,与当前市面上大部分车载产品水平相当。新旧声音对比来听,会有非常明显的差距。

在现场,小鹏的工程师自信地说到,谁说丹拿音响只能用来听音乐?

“技术流”的小鹏 终于开始玩声音了“在线+离线”的技术背景

对于整个车载语音行业来讲,小鹏汽车选择“全新一代超大规模在线神经网络引擎+小型离线拼接引擎”的技术组合,是具有重要意义的。因为目前鲜有车企选择在线技术生成声音,这是一个更前瞻也更冒险的技术尝试。

如何理解这个技术组合,需要明确“在线”和“离线”的概念。这里可以参考游戏场景:离线可以理解为本地游戏;在线则是像王者、吃鸡这样需要大量计算的联网游戏。相对应,在线技术的目标是生成更优质的声音,离线技术则是一种兜底策略。

通过在线技术生成声音的业务主要应用在智能音箱领域,汽车领域寥寥无几。原因是音箱的网络稳定性很高,行车场景常有弱网和无网的情况。

“技术流”的小鹏 终于开始玩声音了

针对这些场景小鹏汽车自研了一系列解决网络问题的创新性落地解决方案。例如车机端的多策略融合模式,通过网络、车机负载、播报业务场景策略综合决策;端云融合的多级缓存、在线离线智能拼接,以及智能预加载算法等。根据小鹏汽车实验室数据,全新AI声音已经实现了在线率97%以上。

小鹏的车载语音目标:多快好爽

本次活动中,小鹏汽车还提出了用户视角的车载智能语音系统系统评价标准——“多快好爽”,包括可用语音操作功能数量、语音操作的完成效率、语音播报的舒适程度、语音交互的自由度几个维度。

“技术流”的小鹏 终于开始玩声音了

活动现场,小鹏汽车也组织媒体和车主对这套新的语音系统进行了测试,并取得了不错的成绩。

“技术流”的小鹏 终于开始玩声音了

按照小鹏汽车的规划,未来新声音还有更多的玩法。小P不仅会拥有更多的情绪,像人类一样会欢喜、会忧愁、会羡慕、会热爱,能和人类产生更多情感共鸣。

“技术流”的小鹏 终于开始玩声音了

即使我们曾为当众喊出“嗨Siri“或“你好小爱同学“的场景感到尴尬,但在汽车上,语音交互的的认可度越来越高。车机功能越来越多也越来越不好找,在尝试过寻找深藏与触屏一级又一级菜单中的功能之后,朋友们非常的反馈出奇的一致:智能语音交互必须上车。

功能上的巨大优势业已得到验证,接下来便是情感和体验上的提升:很多人都在做,只是没想到,主打“技术流”的小鹏汽车在却这方面跑到了前头。

(责编:刘博)

郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如作者信息标记有误,请第一时间联系我们修改或删除,多谢。