用于语音活动检测的检测器和方法-复审决定


发明创造名称:用于语音活动检测的检测器和方法
外观设计名称:
决定号:199864
决定日:2020-01-09
委内编号:1F265686
优先权日:2009-10-19;2009-11-19;2010-08-25
申请(专利)号:201510006946.3
申请日:2010-10-18
复审请求人:瑞典爱立信有限公司
无效请求人:
授权公告日:
审定公告日:
专利权人:
主审员:关键
合议组组长:高虹
参审员:张小丽
国际分类号:G10L25/78
外观设计分类号:
法律依据:专利法第22条第3款
决定要点
:如果一项权利要求所请求保护的技术方案与最接近的现有技术相比存在多个区别技术特征,但其他现有技术公开了其中的部分区别技术特征,并给出了将该部分区别技术特征应用于最接近的现有技术的技术启示,其余区别技术特征是本领域技术人员的常用技术手段,则该项权利要求请求保护的技术方案相对于现有技术和本领域常用技术手段的结合不具有突出的实质性特点和显著的进步,不具备创造性。
全文:
本复审请求涉及申请号为201510006946.3,名称为“用于语音活动检测的检测器和方法”的发明专利申请(下称本申请),本申请是申请号为201080047231.8、名称为“用于语音活动检测的检测器和方法”的PCT发明专利申请的分案申请,申请人为瑞典爱立信有限公司。本申请的申请日为2010年10月18日,优先权日为2009年10月19日、2009年11月19日和2010年08月25日,分案申请递交日为2015年01月07日,公开日为2015年04月01日。
经实质审查,国家知识产权局专利实质审查部门以本申请权利要求1-18不符合专利法第22条第3款规定的创造性为由,于2018年08月03日发出驳回决定,驳回了本申请。
驳回决定引用了以下对比文件:
对比文件1:WO2008/143569A1,公开日为2008年11月27日;
对比文件2:US2009/0089053A1,公开日为2009年04月02日。
驳回决定所依据的文本为:分案申请递交日2015年01月07日提交的权利要求第1-18项、说明书第1-11页、说明书附图第1-7页、说明书摘要、摘要附图。
驳回决定所针对的权利要求书如下:
“1. 一种在语音活动检测器VAD(199)中的用于在接收到的输入信号中检测语音活动的方法,包括:
-接收(1101)来自所述VAD的初级语音检测器的、指示由所述初级语音检测器做出的初级语音活动判决的信号,其中,所述初级语音活动判决是所述VAD的中间语音活动判决,
-接收来自至少一个外部VAD的、指示由所述至少一个外部VAD做出的语音活动判决的至少一个信号,
-对从所述初级语音活动检测器和所述至少一个外部VAD接收到的信号中指示的语音活动判决进行组合(1102),以产生修改后的初级语音活动判决,以及
-将修改后的初级语音活动判决发送(1103)至所述VAD的尾响添加单元,所述尾响添加单元被配置为做出所述VAD的最终语音活动判决。
2. 根据权利要求1所述的方法,其中,通过逻辑“与”来组合接收到的信号中的语音活动判决,使得仅在来自初级语音活动检测器的信号和来自至少一个外部VAD的信号都指示语音的情况下,所述VAD的修改后的初级语音活动判决才指示语音。
3. 根据权利要求1所述的方法,其中,通过逻辑“或”来组合接收到的信号中的语音活动判决,使得如果来自初级语音活动检测器的信号和来自至少一个外部VAD的信号中的至少一个信号指示语音,则所述VAD的修改后的初级语音活动判决就指示语音。
4. 根据权利要求1至3中任一项所述的方法,其中,来自至少一个外部VAD的指示来自所述外部VAD的语音活动判决的至少一个信号是最终VAD判决。
5. 根据权利要求1至3中任一项所述的方法,其中,来自至少一个外部VAD的指示来自所述外部VAD的语音活动判决的至少一个信号是初级语音活动判决。
6. 根据权利要求1至5中任一项所述的方法,其中,所述至少一 个外部VAD是单个VAD。
7. 根据权利要求1至5中任一项所述的方法,其中,所述至少一个外部VAD是多个VAD。
8. 根据权利要求1至7中任一项所述的方法,其中,根据输入信号属性来组合语音活动判决。
9. 根据权利要求8所述的方法,其中,所述输入信号属性包括以下至少一项:估计出的信噪比;以及背景特性。
10. 一种被配置为在接收到的输入信号中检测语音活动的语音活动检测器VAD(199),包括:
输入部(502),被配置为接收来自所述VAD的初级语音检测器的、指示由所述初级语音检测器做出的初级语音活动判决的信号(150),其中,所述初级语音活动判决是所述VAD的中间语音活动判决,所述输入部还被配置为接收来自至少一个外部VAD(198)的、指示由所述至少一个外部VAD(198)做出的语音活动判决的至少一个信号(190),
处理器(503),被配置为对从所述初级语音活动检测器和所述至少一个外部VAD接收到的信号(150、190)中指示的语音活动判决进行组合,以产生修改后的初级语音活动判决(155),以及
输出部(505),被配置为将修改后的初级语音活动判决(155)发送至所述VAD(199)的尾响添加单元,所述尾响添加单元被配置为做出所述VAD的最终语音活动判决。
11. 根据权利要求10所述的VAD(199),其中,所述处理器(503)被配置为:通过逻辑“与”来组合接收到的信号中的语音活动判决,使得仅在来自初级语音活动检测器的信号和来自至少一个外部VAD的信号都指示语音的情况下,所述VAD的修改后的初级语音活动判决才指示语音。
12. 根据权利要求10所述的VAD(199),其中,所述处理器(503)被配置为:通过逻辑“或”来组合接收到的信号中的语音活动判决,使得如果来自初级语音活动检测器的信号和来自至少一个外部VAD的信号中的至少一个信号指示语音,则所述VAD的修改后的初级语 音活动判决就指示语音。
13. 根据权利要求10至12中任一项所述的VAD(199),其中,来自至少一个外部VAD的指示来自所述外部VAD的语音活动判决的至少一个信号是最终VAD判决。
14. 根据权利要求10至12中任一项所述的VAD(199),其中,来自至少一个外部VAD的指示来自所述外部VAD的语音活动判决的至少一个信号是初级语音活动判决。
15. 根据权利要求10至14中任一项所述的VAD(199),其中,所述至少一个外部VAD是单个VAD。
16. 根据权利要求10至14中任一项所述的VAD(199),其中,所述至少一个外部VAD是多个VAD。
17. 根据权利要求10至16中任一项所述的VAD(199),其中,根据输入信号属性来组合语音活动判决。
18. 根据权利要求17所述的VAD(199),其中,所述输入信号属性包括以下至少一项:估计出的信噪比;以及背景特性。”
驳回决定具体指出:(1)独立权利要求1所请求保护的技术方案与对比文件1公开的技术内容相比,区别技术特征是:本申请包括至少一个外部VAD,对从所述初级语音活动检测器和所述至少一个外部VAD接收到的信号中指示的语音活动判决进行组合,以产生修改后的初级语音活动判决,而对比文件1中的VAD不是外部的。上述区别技术特征被对比文件2所公开,且所起的作用与其在本申请中所起的作用相同,因此权利要求1相对于对比文件1和对比文件2的结合是显而易见的,不具备专利法第22条第3款规定的创造性。(2)独立权利要求1的从属权利要求2-9的附加技术特征或被对比文件1、对比文件2公开,或属于本领域的常用技术手段,在其引用的权利要求不具备创造性的基础上,权利要求2-9也不具备专利法第22条第3款规定的创造性。(3)独立权利要求10所请求保护的技术方案与对比文件1公开的技术内容相比,区别技术特征是:本申请包括至少一个外部VAD,处理器被配置为对从所述初级语音活动检测器和所述至少一个外部VAD接收到的信号中指示的语音活动判决进行组合,以产生修改后的初级语音活动判决,而对比文件1中的VAD不是外部的。上述区别技术特征被对比文件2所公开,且所起的作用与其在本申请中所起的作用相同,因此权利要求10相对于对比文件1和对比文件2的结合是显而易见的,不具备专利法第22条第3款规定的创造性。(4)独立权利要求10的从属权利要求11-18的附加技术特征或被对比文件1、对比文件2公开,或属于本领域的常用技术手段,在其引用的权利要求不具备创造性的基础上,权利要求11-18也不具备专利法第22条第3款规定的创造性。
申请人(下称复审请求人)对上述驳回决定不服,于2018年11月12日向国家知识产权局提出了复审请求,未修改申请文件,仅陈述了权利要求1-18具有创造性的理由。复审请求人认为:对比文件1仅存在一个VAD,未涉及另一个VAD。对比文件2中VAD仅产生最终判决,权利要求1中初级语音活动检测器的语音判决为过程决策,来自外部的VAD的语音活动判决可以为初级语音判决和/或最终判决。对比文件2中逻辑组合的信号为一个VAD的最终判决和来自外部VAD的最终语音活动判决。逻辑组合所采用的信号不同,产生的信号不同,对比文件2逻辑组合后的决策即为最终决策,而并未涉及将组合后的逻辑信号发送至何处以产生最终判决的技术方案。
经形式审查合格,国家知识产权局于2018年11月20日依法受理了该复审请求,并将其转送至原专利实质审查部门进行前置审查。
原专利实质审查部门在前置审查意见书中坚持驳回决定。
随后,国家知识产权局成立合议组对本案进行审理。
合议组于2019年08月01日向复审请求人发出复审通知书,指出:(1)独立权利要求1所请求保护的技术方案与对比文件1公开的技术内容相比,区别技术特征是:接收至少一个外部VAD的、指示由至少一个外部VAD做出的语音活动判决的至少一个信号,对从所述初级语音活动检测器和所述一个外部VAD接收到的信号中指示的语音活动判决进行组合,以产生修改后的初级语音活动判决,以及将修改后的初级语音活动判决发送至所述VAD的尾响添加单元。上述区别技术特征部分被对比文件2所公开,且所起的作用与其在本申请中所起的作用相同,部分属于本领域的惯用手段,因此权利要求1相对于对比文件1、对比文件2和惯用手段的结合是显而易见的,不具备专利法第22条第3款规定的创造性。(2)独立权利要求1的从属权利要求2-9的附加技术特征或被对比文件2公开,或属于本领域的常用技术手段,当其引用的权利要求不具备创造性时,权利要求2-9也不具备专利法第22条第3款规定的创造性。(3)独立权利要求10所请求保护的技术方案与对比文件1公开的技术内容相比,区别技术特征是:VAD还具有来自至少一个外部VAD的、指示由至少一个外部VAD做出的语音活动判决的至少一个信号;处理器,对从所述初级语音活动检测器和所述一个外部VAD接收到的信号中指示的语音活动判决进行组合,以产生修改后的初级语音活动判决,以及将修改后的初级语音活动判决发送至所述VAD的尾响添加单元。上述区别技术特征部分被对比文件2所公开,且所起的作用与其在本申请中所起的作用相同,部分属于本领域的惯用手段,因此权利要求10相对于对比文件1、对比文件2和惯用手段的结合是显而易见的,不具备专利法第22条第3款规定的创造性。(4)独立权利要求10的从属权利要求11-18的附加技术特征或被对比文件2公开,或属于本领域的常用技术手段,当其引用的权利要求不具备创造性时,权利要求11-18也不具备专利法第22条第3款规定的创造性。(5)针对复审请求人的意见陈述进行回复。
针对上述复审通知书,复审请求人于2019年09月10日提交了意见陈述书和权利要求书的全文修改替换页,修改主要涉及:将权利要求1的特征“接收来自至少一个外部VAD的、指示由所述至少一个外部VAD做出的语音活动判决的至少一个信号”修改为“接收来自至少一个外部VAD的至少一个信号,每个外部VAD指示由相应的外部VAD做出的语音活动判决,每个外部VAD包括与所述VAD的初级语音检测器和尾响添加单元不同的自己的初级语音检测器和尾响添加单元”;在权利要求2-3中补入特征“从所述VAD的初级语音活动检测器和从所述至少一个外部VAD”;将权利要求4的特征“来自至少一个外部VAD的指示来自所述外部VAD的语音活动判决的至少一个信号是最终VAD判决”修改为“来自所述至少一个外部VAD的所述至少一个信号中指示的语音活动判决是最终VAD判决”;将权利要求5的特征“来自至少一个外部VAD的指示来自所述外部VAD的语音活动判决的至少一个信号是初级语音活动判决”修改为“来自所述至少一个外部VAD的所述至少一个信号中指示的语音活动判决是由相应的外部VAD的初级语音检测器做出的初级语音活动判决,该初级语音活动判决是相应的外部VAD的中间语音活动判决”;在权利要求8中补入特征“从所述VAD的初级语音活动检测器和从所述至少一个外部VAD接收到的信号中指示的”;对于权利要求10-14、17,作出和权利要求1-5、8相对应的修改;修改权利要求6-8、15-17的引用关系以克服多引多的缺陷。
复审请求人认为:修改后的权利要求1的技术方案允许多个VAD并行工作,然后将其输出组合,该VAD在其尾响添加单元之前组合来自该VAD的初级语音检测器和外部VAD的语音活动判决。而对比文件1中,由初级语音检测器33b做出的初级语音活动判决(vad_prim_B)并不与由初级语音检测器33a做出的初级语音活动判决(vad_prim_A)相组合,并且由尾响添加块34做出的最终判决“vad_flag”并不依赖于“vad_prim_A”和“vad_prim_B”的组合。因此,即使通过对比文件2的启示,用外部VAD替换第二PVD33b,也无法获得如下技术方案:将初级语音活动判决与由外部VAD做出的语音活动判决组合,然后将其组合结果发送至尾响添加模块以做出最终判决。对比文件2未公开内部和外部各自配备有尾响添加单元,且其仅考虑组合内部VAD和外部VAD的判决结果,而非中间判决,即对比文件2没有公开、启示或者建议本领域技术人员使用内部VAD在尾响处理之前做出的中间判决、而不是使用内部VAD在尾响处理之后做出的最终判决进行组合,本领域技术人员根据对比文件2难以预想到修改后的权利要求1所述的将由一个VAD做出的中间判决与由另一个VAD做出的判决进行组合的方案。
修改后的权利要求书为:
“1. 一种在语音活动检测器VAD(199)中的用于在接收到的输入信号中检测语音活动的方法,包括:
-接收(1101)来自所述VAD的初级语音检测器的、指示由所述初级语音检测器做出的初级语音活动判决的信号,其中,所述初级语音活动判决是所述VAD的中间语音活动判决,
-接收来自至少一个外部VAD的至少一个信号,每个外部VAD指示由相应的外部VAD做出的语音活动判决,每个外部VAD包括与所述VAD的初级语音检测器和尾响添加单元不同的自己的初级语音检测器和尾响添加单元,
-对从所述VAD的初级语音活动检测器和从所述至少一个外部VAD接收到的至少一个信号中指示的语音活动判决进行组合(1102),以产生修改后的初级语音活动判决,以及
-将修改后的初级语音活动判决发送(1103)至所述VAD的尾响添加单元,所述VAD的尾响添加单元被配置为做出所述VAD的最终语音活动判决。
2. 根据权利要求1所述的方法,其中,通过逻辑“与”来组合从所述VAD的初级语音活动检测器和从所述至少一个外部VAD接收到的信号中的语音活动判决,使得仅在来自所述VAD的初级语音活动检测器的信号和来自所述至少一个外部VAD的每个信号都指示语音的情况下,所述VAD的修改后的初级语音活动判决才指示语音。
3. 根据权利要求1所述的方法,其中,通过逻辑“或”来组合从所述VAD的初级语音活动检测器和从所述至少一个外部VAD接收到的信号中的语音活动判决,使得如果来自所述VAD的初级语音活动检测器的信号和来自所述至少一个外部VAD的至少一个信号中的至少一个信号指示语音,则所述VAD的修改后的初级语音活动判决就指示语音。
4. 根据权利要求1至3中任一项所述的方法,其中,来自所述至少一个外部VAD的所述至少一个信号中指示的语音活动判决是最终 VAD判决。
5. 根据权利要求1至3中任一项所述的方法,其中,来自所述至少一个外部VAD的所述至少一个信号中指示的语音活动判决是由相应的外部VAD的初级语音检测器做出的初级语音活动判决,该初级语音活动判决是相应的外部VAD的中间语音活动判决。
6. 根据权利要求1至3中任一项所述的方法,其中,所述至少一个外部VAD是单个VAD。
7. 根据权利要求1至3中任一项所述的方法,其中,所述至少一个外部VAD是多个VAD。
8. 根据权利要求1至3中任一项所述的方法,其中,根据输入信号属性来组合从所述VAD的初级语音活动检测器和从所述至少一个外部VAD接收到的信号中指示的语音活动判决。
9. 根据权利要求8所述的方法,其中,所述输入信号属性包括以下至少一项:估计出的信噪比;以及背景特性。
10. 一种被配置为在接收到的输入信号中检测语音活动的语音活动检测器VAD(199),包括:
输入部(502),被配置为
接收来自所述VAD的初级语音检测器的、指示由所述初级语音检测器做出的初级语音活动判决的信号(150),其中,所述初级语音活动判决是所述VAD的中间语音活动判决,
接收来自至少一个外部VAD(198)的至少一个信号(190),每个外部VAD指示由相应的外部VAD做出的语音活动判决,每个外部VAD包括与所述VAD的初级语音检测器和尾响添加单元不同的自己的初级语音检测器和尾响添加单元,
处理器(503),被配置为对从所述VAD的初级语音活动检测器和从所述至少一个外部VAD接收到的至少一个信号(150、190)中指示的语音活动判决进行组合,以产生修改后的初级语音活动判决(155),以及
输出部(505),被配置为将修改后的初级语音活动判决(155)发送至所述VAD(199)的尾响添加单元,所述VAD的尾响添加单元被 配置为做出所述VAD的最终语音活动判决。
11. 根据权利要求10所述的VAD(199),其中,所述处理器(503)被配置为:通过逻辑“与”来组合从所述VAD的初级语音活动检测器和从所述至少一个外部VAD接收到的信号中的语音活动判决,使得仅在来自所述VAD的初级语音活动检测器的信号和来自所述至少一个外部VAD的每个信号都指示语音的情况下,所述VAD的修改后的初级语音活动判决才指示语音。
12. 根据权利要求10所述的VAD(199),其中,所述处理器(503)被配置为:通过逻辑“或”来组合从所述VAD的初级语音活动检测器和从所述至少一个外部VAD接收到的信号中的语音活动判决,使得如果来自所述VAD的初级语音活动检测器的信号和来自所述至少一个外部VAD的至少一个信号中的至少一个信号指示语音,则所述VAD的修改后的初级语音活动判决就指示语音。
13. 根据权利要求10至12中任一项所述的VAD(199),其中,来自所述至少一个外部VAD的所述至少一个信号中指示的语音活动判决是最终VAD判决。
14. 根据权利要求10至12中任一项所述的VAD(199),其中,来自所述至少一个外部VAD的所述至少一个信号中指示的语音活动判决是由相应的外部VAD的初级语音检测器做出的初级语音活动判决,该初级语音活动判决是相应的外部VAD的中间语音活动判决。
15. 根据权利要求10至12中任一项所述的VAD(199),其中,所述至少一个外部VAD是单个VAD。
16. 根据权利要求10至12中任一项所述的VAD(199),其中,所述至少一个外部VAD是多个VAD。
17. 根据权利要求10至12中任一项所述的VAD(199),其中,根据输入信号属性来组合从所述VAD的初级语音活动检测器和从所述至少一个外部VAD接收到的信号中指示的语音活动判决。
18. 根据权利要求17所述的VAD(199),其中,所述输入信号属性包括以下至少一项:估计出的信噪比;以及背景特性。”
国家知识产权局于2019年10月24日发出合议组成员变更通知书,将原合议组成员:合议组组长高虹、主审员王婷、参审员王馨宁,变更为:合议组组长高虹、主审员关键、参审员张小丽。复审请求人在通知书指定的期限内未提出回避请求。
在上述程序的基础上,合议组认为本案事实已经清楚,可以作出审查决定。
二、决定的理由
、审查文本的认定
复审请求人在2019年09月10日答复复审通知书时提交了权利要求书的全文修改替换页。经审查,所作修改符合专利法第33条的规定。本复审请求审查决定针对的文本是:分案申请递交日2015年01月07日提交的说明书第1-11页、说明书附图第1-7页、说明书摘要、摘要附图;以及2019年09月10日提交的权利要求第1-18项。
、关于专利法第22条第3款
专利法第22条第3款规定:创造性,是指与现有技术相比,该发明具有突出的实质性特点和显著的进步,该实用新型具有实质性特点和进步。
如果一项权利要求所请求保护的技术方案与最接近的现有技术相比存在多个区别技术特征,但其他现有技术公开了其中的部分区别技术特征,并给出了将该部分区别技术特征应用于最接近的现有技术的技术启示,其余区别技术特征是本领域技术人员的常用技术手段,则该项权利要求请求保护的技术方案相对于现有技术和本领域常用技术手段的结合不具有突出的实质性特点和显著的进步,不具备创造性。
1、权利要求1不具备专利法第22条第3款规定的创造性。
独立权利要求1请求保护一种在语音活动检测器VAD中的用于在接收到的输入信号中检测语音活动的方法,对比文件1公开了一种改进的话音活动性检测器,并具体公开了以下技术特征(参见权利要求1、8-10,附图3):一种话音活动性检测器及其方法,该话音活动性检测器包括至少第一主要话音检测器,基于至少第一主要话音检测器生成的主要语音判定“vad-prim-A”来输出表示输入信号中存在语音的语音判定“vad-flag”(相当于接收来自所述VAD的初级语音检测器的、指示由所述初级语音检测器做出的初级语音活动判决的信号,其中,所述初级语音活动判决是所述VAD的中间语音活动判决);和第二主要话音检测器的附加主要语音判定。可以配备有两个主要话音活动性检测器,一个是主动性的,另一个是敏感性的(参见说明书第8页第9-11行);基于至少所述第一主要话音检测器生成主要语音判定,基于第一主要话音检测器与第二主要话音检测器的活动性差异来生成差信号;将主要语音判定发送至拖尾保护增加单元,并由拖尾保护增加单元作出最终语音判决(相当于所述VAD的尾响添加单元被配置为做出所述VAD的最终语音活动判决)。
权利要求1和对比文件1的区别在于:接收来自至少一个外部VAD的至少一个信号,每个外部VAD指示由相应的外部VAD做出的语音活动判决,每个外部VAD包括与所述VAD的初级语音检测器和尾响添加单元不同的自己的初级语音检测器和尾响添加单元,对从所述VAD的初级语音活动检测器和从所述至少一个外部VAD接收到的至少一个信号中指示的语音活动判决进行组合,以产生修改后的初级语音活动判决,以及将修改后的初级语音活动判决发送至所述VAD的尾响添加单元。
基于上述区别技术特征,本申请实际解决的技术问题是如何利用不同VAD的能力,不因每个VAD的限制而受到过多影响。
对比文件2公开了一种多麦克风声音活动检测器,并具体公开了(参见说明书第[112]段):语音编码器内具有内部VAD和外部VAD,通过组合来自使用两个信号的内部VAD与外部VAD的决策,有可能获得更可靠的VAD决策。举例来说,语音编码器600可经配置以执行内部VAD决策与来自VAD模块230的VAD决策的逻辑组合。语音编码器600可对两个信号的逻辑“与”或逻辑“或”进行操作。即对比文件2公开了利用外部VAD决策,并将外部VAD决策与内部VAD决策进行逻辑组合来获得更可靠的VAD决策,上述技术特征在对比文件2中所起的作用与其在本申请中所起的作用相同,都是如何利用不同VAD的能力,不因每个VAD的限制而受到影响。也就是说对比文件2给出了将上述技术特征应用于该对比文件1以解决其技术问题的启示。而对于外部VAD,设置其包括与所述VAD的初级语音检测器和尾响添加单元不同的自己的初级语音检测器和尾响添加单元是根据需要的常规选择,且在将外部VAD与内部VAD进行逻辑组合的过程中,本领域技术人员根据实际需要,具体在尾响添加单元之前进行逻辑组合,再将逻辑组合后的判决发送到尾响添加单元进行尾响添加,是本领域技术人员容易想到的常用技术手段。
由此可知,在对比文件1的基础上结合对比文件2和本领域常用技术手段得出该权利要求所要求保护的技术方案,对本领域的技术人员来说是显而易见的,因此该权利要求所要求保护的技术方案不具有突出的实质性特点和显著的进步,因而不具备专利法第22条第3款规定的创造性。
2、权利要求2和3不具备专利法第22条第3款规定的创造性。
权利要求2和3是权利要求1的从属权利要求,对比文件2还公开了语音编码器可经配置以执行内部VAD和外部VAD决策的逻辑组合,可对两个信号进行逻辑“与”或逻辑“或”(参见说明书第[112]段)。可见,权利要求2和3的附加技术特征已被对比文件2公开,且其在对比文件2中的作用与其在本申请中的作用相同,由此,通过逻辑“与”来组合从所述VAD的初级语音活动检测器和从所述至少一个外部VAD接收到的信号中的语音活动判决,使得仅在来自所述VAD的初级语音活动检测器的信号和来自所述至少一个外部VAD的每个信号都指示语音的情况下,所述VAD的修改后的初级语音活动判决才指示语音;通过逻辑“或”来组合从所述VAD的初级语音活动检测器和从所述至少一个外部VAD接收到的信号中的语音活动判决,使得如果来自所述VAD的初级语音活动检测器的信号和来自所述至少一个外部VAD的至少一个信号中的至少一个信号指示语音,则所述VAD的修改后的初级语音活动判决就指示语音是显而易见的。因而在其引用的权利要求不具备创造性的基础上,权利要求2和3不具备专利法第22条第3款规定的创造性。
3、权利要求4和5不具备专利法第22条第3款规定的创造性。
权利要求4和5是从属权利要求,本领域技术人员在对比文件2的启示下引入外部VAD的语音活动判决,而根据实际需要引入最终VAD判决或者初级语音活动判决是本领域的常用技术手段,即设置来自所述至少一个外部VAD的所述至少一个信号中指示的语音活动判决是最终VAD判决或者来自所述至少一个外部VAD的所述至少一个信号中指示的语音活动判决是由相应的外部VAD的初级语音检测器做出的初级语音活动判决,该初级语音活动判决是相应的外部VAD的中间语音活动判决,这是本领域技术人员根据实际需要而采用的常规手段。因而在其引用的权利要求不具备创造性的基础上,权利要求4和5不具备专利法第22条第3款规定的创造性。
4、权利要求6不具备专利法第22条第3款规定的创造性。
权利要求6是从属权利要求,对比文件2已经公开了至少一个外部VAD是单个VAD(参见说明书第[112]段)。因而在其引用的权利要求不具备创造性的基础上,权利要求6不具备专利法第22条第3款规定的创造性。
5、权利要求7不具备专利法第22条第3款规定的创造性。
权利要求7是从属权利要求,对比文件2已经公开了至少一个外部VAD是单个VAD(参见说明书第[112]段),在此基础上设置多个外部VAD是本领域技术人员根据实际需要的常规选择。因此在其引用的权利要求不具备创造性的基础上,权利要求7不具备专利法第22条第3款规定的创造性。
6、权利要求8不具备专利法第22条第3款规定的创造性。
权利要求8是从属权利要求,本领域技术人员知晓输入信号的信噪比、背景噪声等都会影响判决结果,因此根据输入信号的属性来组合从所述VAD的初级语音活动检测器和从所述至少一个外部VAD接收到的信号中指示的语音活动判决对本领域技术人员来说是容易想到的,这属于本领域的常用技术手段。因而在其引用的权利要求不具备创造性的基础上,权利要求8不具备专利法第22条第3款规定的创造性。
7、权利要求9不具备专利法第22条第3款规定的创造性。
权利要求9是从属权利要求,而对本领域的技术人员来说,语音信号的属性包括估计出的信噪比和背景特性属于本领域的公知常识。因而在其引用的权利要求不具备创造性的基础上,权利要求9不具备专利法第22条第3款规定的创造性。
8、权利要求10不具备专利法第22条第3款规定的创造性。
独立权利要求10请求保护一种被配置为在接收到的输入信号中检测语音活动的语音活动检测器VAD,对比文件1公开了一种话音活动性检测器,并具体公开了以下技术特征(参见权利要求1、8-10,附图3):输入部,该话音活动性检测器包括至少第一主要话音检测器,基于至少第一主要话音检测器生成的主要语音判定“vad-prim-A”来输出表示输入信号中存在语音的语音判定“vad-flag”(相当于接收来自所述VAD的初级语音检测器的、指示由所述初级语音检测器做出的初级语音活动判决的信号,其中,所述初级语音活动判决是所述VAD的中间语音活动判决);和第二主要话音检测器的附加主要语音判定。可以配备有两个主要话音活动性检测器,一个是主动性的,另一个是敏感性的(参见说明书第8页第9-11行);处理部,基于至少所述第一主要话音检测器生成主要语音判定,基于第一主要话音检测器与第二主要话音检测器的活动性差异来生成差信号;将主要语音判定发送至拖尾保护增加单元,并由拖尾保护增加单元作出最终语音判决(相当于输出部,所述VAD的尾响添加单元被配置为做出所述VAD的最终语音活动判决)。
权利要求10和对比文件1的区别在于:VAD还具有接收来自至少一个外部VAD的至少一个信号,每个外部VAD指示由相应的外部VAD做出的语音活动判决,每个外部VAD包括与所述VAD的初级语音检测器和尾响添加单元不同的自己的初级语音检测器和尾响添加单元;处理器,对从所述VAD的初级语音活动检测器和从所述至少一个外部VAD接收到的至少一个信号中指示的语音活动判决进行组合,以产生修改后的初级语音活动判决,以及将修改后的初级语音活动判决发送至所述VAD的尾响添加单元。
基于上述区别技术特征,本申请实际解决的技术问题是如何利用不同VAD的能力,不因每个VAD的限制而受到过多影响。
对比文件2公开了一种多麦克风声音活动检测器,并具体公开了(参见说明书第[112]段):语音编码器内具有内部VAD和外部VAD,通过组合来自使用两个信号的内部VAD与外部VAD的决策,有可能获得更可靠的VAD决策。举例来说,语音编码器600可经配置以执行内部VAD决策与来自VAD模块230的VAD决策的逻辑组合。语音编码器600可对两个信号的逻辑“与”或逻辑“或”进行操作。即对比文件2公开了利用外部VAD决策,并将外部VAD决策与内部VAD决策进行逻辑组合来获得更可靠的VAD决策,上述技术特征在对比文件2中所起的作用与其与在本申请中所起的作用相同,都是如何利用不同VAD的能力,不因每个VAD的限制而受到影响。也就是说对比文件2给出了将上述技术特征应用于该对比文件1以解决其技术问题的启示。而对于外部VAD,设置其包括与所述VAD的初级语音检测器和尾响添加单元不同的自己的初级语音检测器和尾响添加单元是根据需要的常规选择,且在将外部VAD与内部VAD进行逻辑组合的过程中,本领域技术人员根据实际需要,具体在尾响添加单元之前进行逻辑组合,再将逻辑组合后的判决发送到尾响添加单元进行尾响添加,是本领域技术人员容易想到的常用技术手段。
由此可知,在对比文件1的基础上结合对比文件2和本领域常用技术手段得出该权利要求所要求保护的技术方案,对本领域的技术人员来说是显而易见的,因此该权利要求10所要求保护的技术方案不具有突出的实质性特点和显著的进步,因而不具备专利法第22条第3款规定的创造性。
9、权利要求11-18的附加技术特征与权利要求2-9的附加技术特征是一一对应的,基于针对权利要求2-9的附加技术特征评述相同的理由,当其引用的权利要求不具备创造性时,从属权利要求11-18也不具备专利法第22条第3款规定的创造性。
、对复审请求人相关意见的评述
对于复审请求人的意见陈述,合议组认为:首先,对比文件1公开了基于自身的初级语音活动判决与其它VAD信号来进行语音判决的方案,具体来说对比文件1明确记载了可以配备有两个主要话音活动性检测器,一个是主动性的,另一个是敏感性的(参见说明书第8页第9-11行),是工作在不同工作点的两个主要话音活动性检测器。其次,对比文件2公开了外部VAD与内部VAD相互结合可得到更可靠的VAD决策,具体来说是利用外部VAD决策,并将外部VAD决策与内部VAD决策进行逻辑组合来获得更可靠的VAD决策,上述技术特征在对比文件2中所起的作用与其与在本申请中所起的作用相同,都是如何利用不同VAD的能力,不因每个VAD的限制而受到影响。也就是说,对比文件2给出了利用外部VAD与初级VAD相结合产生判决信号的技术启示。本领域技术人员在对比文件2给出的上述启示下,有动机以及能够对对比文件1进行改进,以用外部VAD代替与自身的初级语音活动判决结合的其它VAD,进而解决利用不同VAD的能力,使得最终语音活动判决不因每个VAD的限制而受到影响的技术问题。而对于外部VAD,设置其包括与所述VAD的初级语音检测器和尾响添加单元不同的自己的初级语音检测器和尾响添加单元是根据需要的常规选择,且在将外部VAD与内部VAD进行逻辑组合的过程中,本领域技术人员根据实际需要,具体在尾响添加单元之前进行逻辑组合,再将逻辑组合后的判决发送到尾响添加单元进行尾响添加,是本领域技术人员容易想到的惯用手段。可见,本领域技术人员能够在对比文件1的基础上结合对比文件2和本领域常用技术手段得到权利要求请求保护的技术方案。
综上所述,合议组对复审请求人的意见陈述不予支持。
基于上述事实和理由,合议组作出如下复审请求审查决定。
三、决定
维持国家知识产权局于2018年08月03日对本申请作出的驳回决定。
如对本复审请求审查决定不服,根据专利法第41条第2款的规定,复审请求人可以自收到本决定之日起三个月内向北京知识产权法院起诉。


郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如作者信息标记有误,请第一时间联系我们修改或删除,多谢。

留言与评论(共有 0 条评论)
   
验证码: