新闻中心
带你走进苹果AirPods Pro骨传导技术的前世今生
- 分类:行业资讯
- 作者:
- 来源:我爱音频网
- 发布时间:2021-06-25 08:49
- 访问量:
【概要描述】近来骨传导麦克风降噪应用在市场上关注度非常高,不管一线品牌或白牌高仿厂家都趋之若鹜唯恐慢了脚步拖了商机,对于这个从AirPods, AirPods2, AirPods Pro一脉相传的苹果TWS耳机标配技术,笔者在此以个人在骨传导应用领域的一些浅薄经验为基础,与大家一同交流下看法。
带你走进苹果AirPods Pro骨传导技术的前世今生
【概要描述】近来骨传导麦克风降噪应用在市场上关注度非常高,不管一线品牌或白牌高仿厂家都趋之若鹜唯恐慢了脚步拖了商机,对于这个从AirPods, AirPods2, AirPods Pro一脉相传的苹果TWS耳机标配技术,笔者在此以个人在骨传导应用领域的一些浅薄经验为基础,与大家一同交流下看法。
- 分类:行业资讯
- 作者:
- 来源:我爱音频网
- 发布时间:2021-06-25 08:49
- 访问量:
本篇文章为万字特稿,目的在于,为大家分析目前非常受到关注的骨传导的技术,一同探讨骨传导技术的应用及未来发展,建议先点击收藏,仔细阅读学习后,欢迎让更多伙伴一起了解:)
目录
一、骨传导技术基础概览
二、骨传导产品到底应该怎么做?
三、骨传导应用的深度解析
骨传导技术基础概览
近来骨传导麦克风降噪应用在市场上关注度非常高,不管一线品牌或白牌高仿厂家都趋之若鹜唯恐慢了脚步拖了商机,对于这个从AirPods, AirPods2, AirPods Pro一脉相传的苹果TWS耳机标配技术,笔者在此以个人在骨传导应用领域的一些浅薄经验为基础,与大家一同交流下看法。
一、骨传导麦克风可分为两大应用
1、体现在用户身份识别,何时说话,声流控制如骨声纹,传感器VAD
2、体现在用户说话时环境噪声压制如骨传导上行降噪(但必须满足自然界对完整声音定义的物理法则)
二、什么是骨传导上行降噪技术?
1、苹果公司的AirPods采用的是骨传导上行降噪技术,也是目前获得市场海量产品验证过的,成熟度最高的技术指标及当下的技术天花板。
2、当下全球TWS耳机,市场上骨传导上行降噪应用受限于:a.算法技术积累不足(苹果有近10年的技术积累,但眼下的算法公司基本少于1年)b.蓝牙芯片算力-能耗比不足(市场上的TWS耳机芯片与苹果W1,H1芯片仍有功耗差距)c.市场验证不足(苹果有超过7000万套AirPods的海量销售数据验证)d.产品骨导结构设计经验不足e.制造工艺不成熟f.测量技术没有标准,甚至还没总结出合理的测试方法
综上所述,我们客观的认为,若以符合近百年来由传统麦克风电性特征为依托,建构形成的声音结构相关理论做为衡量指标(以AirPods为准),不剑走偏锋,即使有AirPods为设计参考,有意法半导体或声扬电子所提供等同苹果公司所使用的骨传导麦克风,在2~3年之内就算用了“曲率引擎”想方设法弯道超车,骨传导上行降噪的效果只能是无穷接近AirPods,想要超越仍需持续努力。
三、生产设计合理的真无线耳机产品才是正道
苹果的AirPods1、AirPods2、AirPods Pro大家都实际的听过它的骨导麦克风降噪效果了吧,再打上一定折扣,就是一个中短期内能在市场上出现的合理产品,既不可能在卡拉ok里,传出那么清晰的用户声音,也无法在数十公里时速的车窗边把风噪压到自己都不认识,所以目前现实的情况,并不会完全消除噪声那么神奇。
苹果AirPods1、AirPods2及AirPods Pro的主芯片分别是W1,H1。
Apple W1蓝牙芯片,AirPods 1、2均采用这颗芯片。
Apple 343S00290芯片,推测这就是Apple H1。据了解,这颗芯片内部集成了Cypress SoC、Maxim 音频编解码器、Bosch MA280加速度计、ST 三轴加速度计、ST 校准器、TI德州仪器 数据转换器等部件。在蓝牙方面,它支持蓝牙5.0,比上代功耗更低。
苹果H1封装系统(System in Package),最新的AirPods Pro采用这颗芯片。
目前现在市场上已在销售的TWS蓝牙芯片在满足功耗条件下,需要提供W1、H1能够提供的算力,还需要持续努力。
做外销出口或知名客户的厂家,还要时刻留意苹果专利的强大保护力,多验证考虑不会有错,提醒大家,骨传导上行降噪技术应用领域,传感器供应商不侵权,算法公司有机会不侵权,但TWS耳机产品制造及销售公司在苹果专利约束下侵权率非常高。(参考苹果公司专利WO2014051969A1)。
骨传导产品到底应该怎么做?
这个篇章里,我们整理了骨传导麦克风的相关技术,可能的应用领域,未来技术发展路线,可搭配应用的APP,产品规划建议及专利侵权提醒,给TWS耳机产品制造商的老板,销售及市场人员们做参考,从实际应用的角度来看,用户身份识别应用最佳搭配,眼下的最大市场是与本地唤醒词及本地语音UI(本地语音命令),我们在下方举了几个能与骨导麦克风搭配做用户身份识别的代表性产品给大家做例证。
一、用户身份识别(骨声纹,VAD):
1、骨声纹安全应用(支付,安防,智能家居声控)
2、强化本地语音识别抗噪能力及减低误识率
3、辅助空气介质麦克风用户声音上行降噪(确认极近场拾音场景)
4、Always On不间断监听场景下的功耗减省
5、用户说话全局标示”伴声记号”,用于语音助手对话精度提高
6、翻译应用控制声音流向
7、大幅减低各类语音输入应用时外界环境语音造成的误识率
8、可叠加双击、计步、心率辅助及佩戴侦测功能
9、成本=三轴加速度传感器+算法+制造工艺,良率,测试工时设备=USD0.35(单耳)
10、功耗=三轴加速度传感器+算法(不含其他运动算法)<0.45ma
由苹果公司的三代AirPods领军及上方许多重量级用户的产品功能定义来看,都明显的指向TWS耳机在数十年追求音质发展轨迹之外的另一个AI语音智能化应用的全新轨迹”实锤”,后面阿里、百度、腾讯的持续入局跟进,TWS耳机的双轨应用不再有悬念,TWS耳机基本坐实了各类语音智能化应用个人端门户接口设备的角色,而骨声纹识别还有一大块可以向外挖掘延伸的应用:
利用声隔离用户身份识别、声流向控制、伴声记号、通过与有实力手机APP团队合作,用在自动同声传译软件、自动录音机软件、低废字率录音转文字、抗噪语音输入法、微信语音短信息自动收发控制、Office、WPS系列软件语音搭配控制、特定游戏语音控制等等。
这些类型的AI语音控制应用,与带骨声纹TWS耳机相互软硬件捆绑授权搭配,利用内建的加密算法及专利权保护,能建立有效的可收费机制,大家用合理的利润在各自专长领域做可持续的长期发展,以最低成本提供给客户更多更好的体验,共同获取市场。
二、用户说话环境噪声压制(以AirPods为标准):
1、在噪声环境下,有效清晰化用户上传语音
2、在噪声环境下提高云端语音识别精度
3、成本=三轴加速度传感器+算法+制造工艺,良率,测试工时设备=USD1.85(单耳)
4、功耗=三轴加速度传感器+算法<3.0ma
三、苹果耳机产品分析
1、苹果根本不关注音质,那他到底关注什么?
苹果3代的AirPods都有Siri贯穿其中,其中降噪效果、功耗、连接速度、延迟时间逐代增强,但有趣的是所有在音频产业的从业者,时时刻刻叨念的音质,却一直没有特别的优化及改善,苹果的目的何在呢?
我们是这么推论的,在苹果公司AirPods代产品3年的演进史里,音质一直不在苹果的进程安排表上,一直保持规律的平上水准,因为他很清楚,在音质这个领域的积累不足,赢不了索尼、BOSE、AKG、B&O等知名老牌企业。
但是苹果拥有以iPhone为主的各类相关智能终端产品的庞大生态系统,所以苹果主打信息连接速度,人机交互接口,延迟时间与电池寿命,不断的提高”便利性”与”使用体验”,让无线耳机在保有自身的优势外,同时不断靠近有线耳机的特长,借之以贯穿整个苹果生态系统,完全以满足85%用户的需求为目的,不在完全占不到便宜的音质上下功夫堆成本。
而与苹果性质类似的谷歌、微软、亚马逊,我们强烈的认为,不久的将来Siri将会是与触摸屏并列为IOS的2大信息录入工具,而谷歌的Google Assistant之于Chrome、 Android,微软的Cortana之于Office、Windows,亚马逊的Alexa之于Echo智能家居生态系统,谁说耳机就只能在音质上体现价值呢?看起来链接人工智能语音,将成为人机交互接口更能产生庞大的需求!
2、苹果开启山寨保护模式?
苹果IOS13为了特定的优化目的非针对性的,在AirPods的蓝牙软件系统上稍做变更便掀起一阵”腥风血雨”,下一次苹果针对性的加密呢?躲的过去吗?
相信不过度将市场集中在iPhone领域,多方面的功能细分市场尝试储备,往安卓手机分摊风险是绝对必要的,骨声纹用户识别应用增加的成本有限但却能够丰富产品线增加避险路径,给您的客户更多更好的功能选择与体验,加入本地唤醒词语音UI与骨声纹检测(或传感器VAD)功能。
其中骨声纹检测(或传感器VAD)这个功能在通过本文中的验证方法可以得知,AirPods一样有这个功能只是我们不受骨传导上行降噪应用的限制,跟苹果AirPods 7db~9db的效果比起来,我们的30db~40db显得比较突出,但却以最少的副作用及有限的成本真实的解决了实际应用场景上的问题。
四、产品规划建议
很多一、二线TWS耳机品牌厂或ODM厂需要与同行及白牌厂家间做区隔或同样在白牌领域内想脱离无差别饱和竟争,用最少成本做产品区隔的厂家,跟随苹果、谷歌、微软、亚马逊等等,正在发力推动的TWS耳机AI语音控制智能化应用领域是最好的选择,在骨传导上行降噪成熟前,先导入骨声纹检测应用练手,是最稳妥的做法。
在系统性经历过骨声纹检测技术应用的整个过程后,再上一个台阶比较不会感受到那么大的沖击,因为就算要做好骨声纹检测的效果也并不容易的,特别是能满足动静态人体耳廓适配性要求的产品结构设计,就是一个需要深度投入的新研究方向,逐步的积累迭代是掌握商机与控管风险最佳的选择。
而骨声纹检测与骨传导上行降噪是骨传导应用上的2个分支,只是关注的重点及满足的用户体验不同,并不相互沖突,可以同时存在做一个高阶产品,也可以分布在系列产品内,做出明显的性价比区隔,让客户有更多的选择。
五、骨声纹检测(传感器VAD)新版算法技术未来发展路线:
UCOMM宇恒互动的骨声纹检测算法详细介绍
OVVP算法是 Own Voice Vibration Pick-up的简称,是在骨传导用户身份识别领域,市场上通过多个10年专利支撑,市场批量验证,能以最佳性价比,助力TWS耳机发展在人工智能,物联网,智能家居等等不同细分生态系的应用算法。
1、OVVP 2.0版,将从特定窄带声谱面积能量曲线拟合技术进入下一代底噪序列与声谱频域有序叠加变化侦测技术,从低阶低成本的14位加速度传感器挤出更高的灵敏度,让用户拥有更接近传统空气介质麦克风的体验。
2、将OVVP算法嵌入各大知名TWS蓝牙SOC内,已完成高通QCC512x系列,正进行嵌入中的有恒玄BES2300,络达AB1536U,下个计划嵌入的有瑞昱RTL8773B、杰里AC6936D,热烈欢迎原相、紫光展锐及中科蓝讯的合作洽谈。
3、OVVP判断加速算法,将现有算法24ms~300ms延时减至平均15ms~20ms,得到最低声丢失效果,OVVP可直接成为第一阶face0的VAD,后段算法不需Always On大幅节省算法功耗,并有机会附加提供5db~8db唤醒词抗噪及麦克风上行降噪效果。
4、已与特定加速度传感器公司发展出降低50%算法成本的新产品。
5、可在加速度传感器上除了做双击、计步、心率、骨声纹识别之外,再叠加佩戴侦测算法,在现有光学或触摸芯片方案之外,多一个可以降低制造工艺难度及产品不良率的低成本新方案。
6、大幅提高特定本地唤醒词与语音命令在高噪声环境下的辨识率算法技术。
7、有机会通过惯性传感器IMU与双麦射束成形的算法,将语音指向鲁棒性大幅收敛20倍,可以绕过苹果的骨传导上行降噪专利技术,与眼下市场上降噪技术相比又不会产生”声残缺”的副作用。
六、骨声纹应用合作征集:
在翻译、录音机、语音转文字、语音输入、语音助手、微信语音短信息、带同步翻译的通话社交APP(如Skype)、各类Office办公软件、语言学习、可加入声控的游戏等等,智能语音应用领域有成熟APP的团队,共同建立运营机制引介客户,通过TWS耳机内置算法及专利,连结TWS耳机硬件市场,扩张AI智能化语音应用,给客户更好更完善的选择与体验。
七、目前已有骨声纹产品应用案例推荐:
VIVO在2019年9月16日晚上随着 NEX 3 5G手机一起发布的VIVO TWS Earphone,使用了UCOMM 宇恒互动的骨声纹检测算法。
据悉,从2018年11月在VIVO做算法效果演示开始,一直到2019年9月产品发布,经历了11个月的跌宕起伏,VIVO团队在产品研发上进行了巨量的坚持与投入,VIVO TWS Earphone采用高通QCC5126,技术层面来说高通这颗芯片达到了很高的水准。
VIVO TWS Earphone从产品结构为满足调音要求反复推倒修改,PCB反复画板超过几十次,经测试数据表明蓝牙延迟及连接速度具有很大的优势。
VIVO TWS Earphone在骨声纹效果验证上搜集了数千笔数据做分析对比,见微知著,VIVO TWS Earphone在安卓真无线配件领域里性能指标很好,在以低成本为核心诉求的主流发展路线中,是从数据及体验上来看能够拿出来与AirPods相提并论的产品。
通过详细的拆解我们发现,vivo TWS Earphone首发搭载了高通QCC5126旗舰级蓝牙音频SoC,这颗QCC5126是高端的高通QCC5100系列芯片中顶级的型号。
QCC5126芯片支持蓝牙5.0,内置CPU,音频DSP,集成度高,采用低功耗设计;支持最新的高通TWS+技术,支持语音激活功能。
八、侵权提醒
据悉目前市场上存在仿制OVVP算法的情况,UCOMM 宇恒互动深耕摸索验证了近10年的模式,积累下微机电惯性传感器在不同细分产业领域过百的专利,解决长久以来算法供应行业的运营硬伤,行业同仁应共同尊重自主知识产权。
骨传导应用的深度解析
苹果的AirPods产品是现有市场上,骨传导上行降噪的指标性应用。从第一代苹果AirPods2016年9月销售来时,到现在2019年底已累计售出超过7000万套,苹果可以称得上是骨传导上行降噪技术的先行者。
顺着这个思路往下走我们在市场上看到一些骨传导上行降噪的演示可以在极为嘈杂的环境下清晰的将用户的声音上传至对端,这样的应用在战场、工地、外卖、声音嘈杂的公共环境场景实用性极强。
但是这么实用的技术为什么苹果不用或者苹果不会用,我们依据苹果公司2012年的专利推论,苹果公司应该早在2009年就开始开展骨传导上行降噪的应用技术可行性评估及框架验证实验(有另一说是直接购买了特定技术团队),2009年当时全球传感器的应用技术远没有现在那么样的发达成熟,研发过程大量的坑导致进度缓慢也可以理解。
经过了这10年的演化进步及海量市场验证磨合,苹果公司远远的领先了行业,说他做不出这么吸睛的骨传导上行降噪应用效果很难说的通,所以只剩一个选项,就是”他不用”。
其中之一的重要原因是,这样的技术有严重的”声残缺”bug,骨传导上行降噪应用肯定是一个非常有前景的应用,但受限于过去近百年由传统空气介质麦克风电性特征所定义出来的理论,不管您的曲率引擎怎么样的压缩扭曲空间,仍然需要一定的积累与迭代,”事出反常必有妖”,这里通过我们下文的分析推论,告诉您其中一个”妖”为什么就是”声残缺”。
一、先了解基础语音结构
首先,我们先基础了解下语音结构的基本要素”元、辅、清、浊”语音学中,将发音时声带振动的音称为浊音,声带不振动的音称为清音。辅音有清有浊,而多数语言中的元音均为浊音,鼻音、边音、半元音也是浊音。
四十八个国际音标
普通话辅音声母总表
二、看看骨传导麦克风如何把pass变成了a
下方测试用字pass的相关时频域测试用图,引自知乎作者王赞2016年3月26日发表的”不同元音辅音在声音频谱的表现是什么样子?”文内表示:
上面被线段连接的方框,是pass发音/s/的部份是声带不振动的清音,骨传导麦克风不能感测到(其中的爆破音/p/也是清音但不在框内),所以pass /pæs/这个字骨传导麦克风只能感测到a/æ/的声音,而不管任何语系,清音都有很重的占比,pass这个字丢失掉清音就成了a,这是所以单独使用骨传导麦克风会得到严重的”声残缺”的理论依据。
为了修补这个声残缺问题,必须引入传统麦克风的信息,一但使用到传统麦克风,就回到了苹果公司AirPods在软硬件系统上的专利保护技术框架里,而在没有其他能绕过苹果公司软硬件专利技术保护框架,又能通过市场验证的新理论体系形成前,为满足市场庞大需求。只能抄袭模仿苹果软硬件技术条件下,AirPods使用的骨传导上行降噪也就成了同类技术性能指标的天花板,想要避开苹果公司专利还是困难重重。
另外,从上方最后一张pass语音的时频域图,可以看出以作者男声发出的pass完整声能量频率分布可以到达近8khz,这是为什么传统麦克风要完整的取得声音数据都将采样规格定在16khz的原因,意法半导体的骨传导麦克风带宽上限在2.3khz,而声扬电子的骨传导麦克风带宽在8khz。
有个很重要的观念要再强调一次,骨传导麦克风的带宽再宽也取不到清音的声信号,因为感测不到声带通过肌肉、骨骼、皮肤、血液传递过来的振动,而这样的振动是声带运动加速度信息的物理现象表现方式之一。
所以骨传导麦克风为了能感测到”振动”也必须是加速度计的一种,骨传导麦克风除了带宽,还有声频响应平坦度、THD、感度等等,这些规格特性还需要不断的进步与优化,相对于发展了近百年的传统麦克风来说骨传导麦克风还有很长的路要走,但这不能否定骨传导麦克风所能带来的巨大潜力与商业利益。
下图是我们在网络上找了十数种频谱分析仪APP,通过带有骨声纹麦克风的蓝牙演示工程样机反复切换传统麦克风与骨导麦克风抓取到最好的声谱图,可以看到背景还有很多噪声,证明这不是在消声室内做的实验。
手机用的小米8,没有与标准设备做过校正,设备专业度显然不足,仅能做参考用,找到这些免费APP软件及一一试用,并与测试样机相互做试验调参数耗用了极长时间,这些软件虽不专业但可以帮助厂家在前期产品技术评估阶段做验证,避免两眼一抹黑在后面大量的资源投入后争议不断。
传统麦克风 骨传导麦克风5k采样率下时频域声谱对比图,pass /pæs/, 前端的p/p/,短爆音不见了
传统麦克风 骨传导麦克风5k采样率下时频域声谱对比图,pass /pæs/,后端的s/s/,也不见了,不仅如此,a/æ/的声音瞬时能量分布都有相当的变化
在使用骨传导上行降噪技术时,如上图的各种时频声谱对比图(需有更全面系统性的测试用字或测试pattern)及更细致的频谱图,必须由相应算法公司与厂家共同做更全面细致的采集评估,因为骨传导上行降噪的效果调校的好坏,是一个涉及电子硬件、软件、算法、制造工艺、产品结构、人体耳廓搭配及各种完整动静态测试验证所得到的综合性结果,我们预估骨传导上行降噪最大的坎会落在”批量生产”,要让产线做出足够良率及一致性的产品,最突出问题就是”测试的标准与方法”。
三、AirPods内的骨声纹检测(传感器VAD)验证
苹果AirPods 2代内附OVVP骨声纹检测算法(传感器VAD)的验证方法:苹果AirPods 2因为佩戴帧测算法采用了红外测距搭配加速度传感器互相关与曲线拟合算法,对未佩戴帧测的条件严了很多,误动作概率有了很好的优化,但我们仍可以通过简单方法验证其内部OVVP算法的存在,测试方法如下:
1、准备1支iPhone 确认内部IOS版本为:12.3.2或以上
2、准备1对AirPods 2佩戴后,确认可以连接I-Phone可以通话,听音乐
3、确认iPhone内未设置声纹识别保护,若有请确认关闭声纹保护功能
4、说出Hay Siri,观察是否可唤出I-Phone内的Siri语音助手
5、让旁边未佩戴AirPods2的人对着AirPods2 说Hay Siri确认能唤出iPhone内的Siri语音助手
6、准备一片具反射能力的白色胶带,贴住任一支AirPods 2的侦测窗口(如照片1)
7、将另一支未贴胶带的耳机佩戴入耳,通过这支耳机播放音乐,并将音量调到最大声,方便后面的测试
8、拿起已将贴了反射胶带的耳机听看看确认是否有音乐声传出,若有音乐声则表示我们欺骗AirPods 2的方法成功
9、取下佩戴在耳朵上的AirPods 2耳机,贴上反射胶带,直到确认有音乐传出后为止
10、将2支能够持续播放音乐的AirPods2耳机置于一支手机或同一个表面较为坚硬平坦的物体上(如下图照片)
11、手不要碰触放置耳机的平台,试着对播放音乐中的AirPods 2说Hay Siri,调整说Hay Siri的音量(从小音量慢慢加大音量),音量不够时是唤不出Siri的,直到足够大声时才可以唤出手机的Siri。
这个测试已可以让用户感受到与其他没有OVVP算法带语音唤醒词功能的其他耳机有很明显的不一样了,我们测试AirPods传感器VAD+射束成形约有7db~9db的声阻隔效果,这不是苹果公司不如我们而是苹果公司要发挥的主功能是骨传导上行降噪的效果,因此受到较多的限制。
12、用手指指肉约0.3秒一次不断轻敲放置耳机的平台(让平台晃动),同时以低音量对着AirPods 2耳机说出Hay Siri,此时会发现唤出手机Siri所需要的音量比第11项的测试小很多,这是OVVP传感器VAD算法的最明显特征,由此我们证明的AirPods 2内有OVVP算法存在。
四、骨声纹检测,测试技术分享:
在骨声纹检测这块,通过从研发到量产的过程后,总结出一个全新的研发阶段测试方法(尚未实际验证),使用我们提出的测试方法清浊音都能引起模拟声带振动,虽无法像人体真实声带振动般,引发那么多的肌肉群协调运动,但至少可以通过皮肤、微血管、肌肉、软骨等等介质较接近的模拟声带运动后的振动传递的状态。
可以用来做动静态扫频,定频的频响、感度、谐波失真、频谱采集对比,并在较为可控的条件下得到更具参考价值的测试数据,有助于在研发阶段做验证找问题,这个测法虽然是为了解决我们骨声纹检测(用户身份识别)使用,但也可做为带骨传导上行降噪算法产品效果验证的一部份,若大家有兴趣可以与我们联系一同讨论。
骨传导应用测试分为静态与动态2个方面及研发与生产2个阶段,动静态的定义是以用户所处的状态来决定,因为骨传导声应用,对于声带运动所产生的振动信息感测结果的好坏极为敏感,用户静止不动(含小幅运动)与用户不断的运动,将严重考验TWS耳机的结构,配重设计,这是决定能否保持与耳廓的密合度与骨传导应用效果一致性的重要条件。
详细来说就是必须在用户不同的动静态场景下,保证整个导振通路的最低畅通性需求,因为这个导振通路会因为用户运动导致产品松脱位移,进而让骨传导上行降噪的频响、感度等等相关特性发生强烈改变。
另外在TWS耳机内空间非常紧凑,内部扬声器发声时同样会引起与声带振动完全相同的振动产生串扰,还有人体2个耳廓的不对称性所引起的感度失衡,这些都是算法公司所提供算法必须要考虑压制或补偿的。
根据在量产阶段做大量测试数据搜集,制定测试标准时所得到的结果, OVVP骨声纹检测应用只用了100hz~500hz的低频窄带宽条件做判断识别基础,声音不上行外送条件下,用户左右耳廓不对称性所引起的感度不平衡可到8db,多用户耳廓结构一致性所导致的感度差距可以达到25db。
OVVP的应用只要用户说话的音量加大点或感度尽可能无副作用的提升(有不同的应对做法),就可以获得较明显的优化改善,但是对于拿来听的骨传导上行降噪,带宽超过OVVP 4倍。
处理后的声音需上传面对人类耳朵或语音识别引擎的听力(可懂度)考验,频响变化、感度变化、动态范围变化、THD、SNR、Cross talk、声谱结构完整度等等,都能轻易被听或识别出来,难度是数个量级的增长,对于这些已在市场上销售算法,但却只用了不到1年甚至有的只有几个月时间做研发的算法公司来说,真的是让人感到非常的钦佩。
出自我爱音频网,如有侵权,请联系删除!