发明创造名称:一种语音识别方法及电子设备
外观设计名称:
决定号:200593
决定日:2020-01-14
委内编号:1F266500
优先权日:
申请(专利)号:201210568770.7
申请日:2012-12-24
复审请求人:联想(北京)有限公司
无效请求人:
授权公告日:
审定公告日:
专利权人:
主审员:崔朝利
合议组组长:李玉林
参审员:徐妍妍
国际分类号:G10L15/08
外观设计分类号:
法律依据:专利法第22条第3款
决定要点
:如果一项权利要求请求保护的技术方案相对于作为最接近现有技术的对比文件存在区别技术特征,其中一部分区别技术特征被其他对比文件公开,且其在该其他对比文件中的作用与在本申请中的作用相同,另一部分区别技术特征属于本领域惯用的技术手段,那么该项权利要求的技术方案是显而易见的,不具备创造性。
全文:
本复审请求涉及申请号为201210568770.7、名称为“一种语音识别方法及电子设备”的发明专利申请(下称本申请),申请人为“联想(北京)有限公司”,本申请的申请日为2012年12月24日,公开日为2014年07月02日。
国家知识产权局专利实质审查部门于2018年08月06日以权利要求1-7不具备专利法第22条第3款规定的创造性为由作出驳回决定,驳回了本申请。
驳回决定所依据的文本为:申请日2012年12月24日提交的说明书第1-17页、说明书附图第1-2页、说明书摘要、摘要附图;以及2018年07月09日提交的权利要求第1-14项。
驳回决定引用的对比文件如下:
对比文件1:CN101071564A,公开日为:2007年11月14日;
对比文件2:CN101075434A,公开日为:2007年11月21日。
驳回决定所针对的权利要求书如下:
“1. 一种语音识别方法,其特征在于,应用于至少包括第一识别引擎和第二识别引擎的语音识别系统的电子设备中,所述方法包括:
获取一待识别语音信息;
基于所述待识别语音信息,获得至少包括第一待识别语音单元的至少一个待识别语音单元;
基于所述第一识别引擎和所述第二识别引擎,对所述第一待识别语音单元进行识别,获得第一识别结果;
所述第二识别引擎具体为:
基于预设规则,对所述第一识别引擎中的第一内容进行筛选而得到的包含有第二内容的第一种识别引擎;或
具有与所述第一识别引擎中的所述第一内容不同的第三内容的第二种识别引擎。
2. 如权利要求1所述的方法,其特征在于,当所述第二识别引擎具体为所述第一种识别引擎时,所述基于所述第一识别引擎或所述第二识别引擎,对所述第一待识别语音单元进行识别,获得第一识别结果,具体包括:
基于所述第一种识别引擎,对所述第一待识别语音单元进行识别,获得第二识别结果;
判断所述第二识别结果是否满足第一预设条件;
在所述第二识别结果满足所述第一预设条件时,输出所述第二识别结果作为所述第一识别结果。
3. 如权利要求2所述的方法,其特征在于,在所述判断所述第二识别结果是否满足第一预设条件之后,所述方法还包括:
在所述第二识别结果不满足所述第一预设条件时,基于所述第一识别引擎,对所述第一待识别语音单元进行识别,获得所述第一识别结果;
输出所述第一识别结果。
4. 如权利要求1所述的方法,其特征在于,当所述第二识别引擎具体为所述第一种识别引擎时,所述基于所述第一识别引擎或所述第二识别引擎,对所述第一待识别语音单元进行识别,获得第一识别结果,具体包括:
基于所述第一种识别引擎,对所述第一待识别语音单元进行识别,获得第三识别结果;
基于所述第一识别引擎,对所述第一待识别语音单元进行识别,获得第四识别结果;
判断所述第三识别结果或所述第四识别结果是否满足第二预设条件;
在所述第三识别结果或所述第四识别结果满足所述第二预设条件时,输出所述第三识别结果或所述第四识别结果作为所述第一识别结果。
5. 如权利要求1所述的方法,其特征在于,当所述第二识别引擎具体为所述第二种识别引擎时,所述基于所述第一识别引擎或所述第二识别引擎,对所述第一待识别语音单元进行识别,获得第一识别结果,具体包括:
基于所述第一识别引擎,对所述第一待识别语音单元进行识别,获得第五识别结果;
基于所述第二种识别引擎,对所述第一待识别语音单元进行识别,获得第六识别结果;
判断所述第五识别结果和所述第六识别结果是否满足第三预设条件;
在所述第五识别结果满足所述第三预设条件且所述第六识别结果不满足所述第三预设条件时,输出所述第五识别结果作为所述第一识别结果。
6. 如权利要求5所述的方法,其特征在于,在所述判断所述第五识别结果和所述第六识别结果是否满足第三预设条件之后,所述方法还包括:
在所述第五识别结果不满足所述第三预设条件且所述第六识别结果满足所述第三预设条件时,输出所述第六识别结果作为所述第一识别结果。
7. 如权利要求5所述的方法,其特征在于,在所述判断所述第五识别结果和所述第六识别结果是否满足第三预设条件之后,所述方法还包括:
在所述第五识别结果和所述第六识别结果均满足所述第三预设条件时,输出所述第五识别结果或所述第六识别结果作为所述第一识别结果。
8. 一种电子设备,其特征在于,所述电子设备中至少包括第一识别引擎和第二识别引擎的语音识别系统,所述电子设备包括:
第一获得单元,用于获取一待识别语音信息;
第二获得单元,用于基于所述待识别语音信息,获得至少包括第一待识别语音单元的至少一个待识别语音单元;
识别单元,用于基于所述第一识别引擎和所述第二识别引擎,对所述第一待识别语音单元进行识别,获得第一识别结果;
其中,所述第二识别引擎具体为:
基于预设规则,对所述第一识别引擎中的第一内容进行筛选而得到的包含有第二内容的第一种识别引擎;或
具有与所述第一识别引擎中的所述第一内容不同的第三内容的第二种识别引擎。
9. 如权利要求8所述的电子设备,其特征在于,当所述第二识别引擎具体为所述第一种识别引擎时,所述识别单元具体包括:
第一识别子单元,用于基于所述第一种识别引擎,对所述第一待识别语音单元进行识别,获得第二识别结果;
第一判断子单元,用于判断所述第二识别结果是否满足第一预设条件;
第一输出子单元,用于在所述第二识别结果满足所述第一预设条件时,输出所述第二识别结果作为所述第一识别结果。
10. 如权利要求9所述的电子设备,其特征在于,所述识别单元还包括:
第二识别子单元,用于在所述第二识别结果不满足所述第一预设条件时,基于所述第一识别引擎,对所述第一待识别语音单元进行识别,获得所述第一识别结果;
第二输出子单元,用于输出所述第一识别结果。
11. 如权利要求8所述的电子设备,其特征在于,当所述第二识别引擎具体为所述第一种识别引擎时,所述识别单元具体包括:
第三识别子单元,用于基于所述第一种识别引擎,对所述第一待识别语音单元进行识别,获得第三识别结果;
第四识别子单元,用于基于所述第一识别引擎,对所述第一待识别语音单元进行识别,获得第四识别结果;
第二判断子单元,用于判断所述第三识别结果或所述第四识别结果是否满足第二预设条件;
第三输出子单元,用于在所述第三识别结果或所述第四识别结果满足所述第二预设条件时,输出所述第三识别结果或所述第四识别结果作为所述第一识别结果。
12. 如权利要求8所述的电子设备,其特征在于,当所述第二识别引擎具体为所述第二种识别引擎时,所述识别单元具体包括:
第五识别子单元,用于基于所述第一识别引擎,对所述第一待识别语音单元进行识别,获得第五识别结果;
第六识别子单元,用于基于所述第二种识别引擎,对所述第一待识别语音单元进行识别,获得第六识别结果;
第三判断子单元,用于判断所述第五识别结果和所述第六识别结果是否满足第三预设条件;
第四输出子单元,用于在所述第五识别结果满足所述第三预设条件且所述第六识别结果不满足所述第三预设条件时,输出所述第五识别结果作为所述第一识别结果。
13. 如权利要求12所述的电子设备,其特征在于,所述识别单元还包括:
第五输出子单元,用于在所述第五识别结果不满足所述第三预设条件且所述第六识别结果满足所述第三预设条件时,输出所述第六识别结果作为所述第一识别结果。
14. 如权利要求12所述的电子设备,其特征在于,所述识别单元还包括:
第六输出子单元,用于在所述第五识别结果和所述第六识别结果均满足所述第三预设条件时,输出所述第五识别结果或所述第六识别结果作为所述第一识别结果。”
驳回决定指出:1、权利要求1请求保护一种语音识别方法,权利要求1与对比文件1公开的内容相比,区别技术特征在于:A、所述第二识别引擎包括:基于预设规则,对所述第一识别引擎中的第一内容进行筛选而得到的包含有第二内容的第一种识别引擎;或B、具有与所述第一识别引擎中的所述第一内容不同的第三内容的第二种识别引擎。对于并列技术方案一,该区别技术特征A被对比文件2公开且其在对比文件2中所起的作用与在本发明中为解决其技术问题所起的作用相同,都是用于提高语音的识别速率,即对比文件2给出了将该技术特征应用到对比文件1中的技术启示;对于并列技术方案二,区别技术特征B属于本领域的常规技术手段。权利要求1不具备专利法第22条第3款规定的创造性。2、从属权利要求2-7的附加技术特征,或被对比文件1公开,或属于本领域惯用的技术手段,在其引用的权利要求不具备创造性的情况下,权利要求2-7也不具备专利法第22条第3款规定的创造性。3、在其他说明部分指出:权利要求8请求保护一种电子设备,权利要求8与对比文件1公开的内容相比,区别技术特征在于:A、所述第二识别引擎包括:基于预设规则,对所述第一识别引擎中的第一内容进行筛选而得到的包含有第二内容的第一种识别引擎;或B、具有与所述第一识别引擎中的所述第一内容不同的第三内容的第二种识别引擎。对于并列技术方案一,该区别技术特征A被对比文件2公开且其在对比文件2中所起的作用与在本发明中为解决其技术问题所起的作用相同,都是用于提高语音的识别速率,即对比文件2给出了将该技术特征应用到对比文件1中的技术启示;对于并列技术方案二,区别技术特征B属于本领域的常规技术手段,权利要求8不具备专利法第22条第3款规定的创造性。从属权利要求9-14的附加技术特征,或被对比文件1公开,或属于本领域惯用的技术手段,在其引用的权利要求不具备创造性的情况下,权利要求9-14也不具备专利法第22条第3款规定的创造性。
申请人(下称复审请求人)对上述驳回决定不服,于2018年11月19日向国家知识产权局提出了复审请求,同时修改了权利要求书。修改涉及:依据说明书第11页第2段记载的内容“当然也可以基于第二识别引擎和第一识别引擎同时对所述待识别语音信息中包含有至少一个待识别语音单元进行识别”对权利要求1、8进行修改,限定了基于第一识别引擎和第二识别引擎同时对第一待识别语音单元进行识别。
复审请求人认为:修改后的权利要求1与对比文件1的区别技术特征至少包括:“基于所述第一识别引擎和所述第二识别引擎同时对所述第一待识别语音单元进行识别,获得第一识别结果;所述第二识别引擎具体为:基于预设规则,对所述第一识别引擎中的第一内容进行筛选而得到的包含有第二内容的第一种识别引擎;或具有与所述第一识别引擎中的所述第一内容不同的第三内容的第二种识别引擎。”(1)由于同时执行第二识别引擎和第一识别引擎对所述至少一个待识别语音单元进行匹配,所以第一识别引擎在当第二识别引擎对所述至少一个待识别语音单元匹配不满足语音匹配条件时已经对所述至少一个待识别语音单元进行了匹配,从提高语音识别的效率,实现了节省识别时间的技术效果。对比文件1中是先执行一次语音识别,在未存在满意的识别结果时,再执行一次语音识别。两次语音识别存在明显先后顺序。不同于本申请中基于第一识别引擎和第二识别引擎同时进行语音识别。(2)针对区别“所述第二识别引擎具体为:基于预设规则,对所述第一识别引擎中的第一内容进行筛选而得到的包含有第二内容的第一种识别引擎”。对比文件1公开的是“执行第一遍语音识别,其中使用解码器根据第一组词汇来处理语音,该词汇可以包括在某一语法之内可接受或期望的字。如果语音解码中的置信度不够高,则执行第二遍语音识别,其中使用解码器根据包括不可接受或期望的字的第二组词汇来处理语音”,即对比文件1是基于两组包括不同词汇的组进行两遍语音识别。对比文件2公开的是“使用由语音分析单元转换的特征值,计算与由所述词汇词典管理单元提取的识别目标词的匹配度,根据所述匹配度结果,输出具有最佳匹配分数的词作为识别结果”,即基于从词汇词典中提取的词汇进行语音识别。将对比文件1和对比文件2公开的内容相结合得到的技术方案是:基于从词汇词典中提取的第一词汇组进行第一遍语音识别,基于从词汇词典中提取的第二词汇组进行第二遍语音识别。即两遍语音识别所基于的第一词汇组和第二词汇组都是由词汇词典中提取的。这与本申请中基于第一识别引擎中的第一内容进行语音识别,基于第二识别引擎中的第二内容进行语音识别,第二内容从第一内容中筛选,并不相同。因此,将对比文件1和对比文件2相结合并不能得到本申请修改后的权利要求1的技术方案。
提出复审请求时修改的权利要求书如下:
“1. 一种语音识别方法,其特征在于,应用于至少包括第一识别引擎和第二识别引擎的语音识别系统的电子设备中,所述方法包括:
获取一待识别语音信息;
基于所述待识别语音信息,获得至少包括第一待识别语音单元的至少一个待识别语音单元;
基于所述第一识别引擎和所述第二识别引擎同时对所述第一待识别语音单元进行识别,获得第一识别结果;
其中,所述第二识别引擎具体为:
基于预设规则,对所述第一识别引擎中的第一内容进行筛选而得到的包含有第二内容的第一种识别引擎;或
具有与所述第一识别引擎中的所述第一内容不同的第三内容的第二种识别引擎。
2. 如权利要求1所述的方法,其特征在于,当所述第二识别引擎具体为所述第一种识别引擎时,所述基于所述第一识别引擎或所述第二识别引擎,对所述第一待识别语音单元进行识别,获得第一识别结果,具体包括:
基于所述第一种识别引擎,对所述第一待识别语音单元进行识别,获得第二识别结果;
判断所述第二识别结果是否满足第一预设条件;
在所述第二识别结果满足所述第一预设条件时,输出所述第二识别结果作为所述第一识别结果。
3. 如权利要求2所述的方法,其特征在于,在所述判断所述第二识别结果是否满足第一预设条件之后,所述方法还包括:
在所述第二识别结果不满足所述第一预设条件时,基于所述第一识别引擎,对所述第一待识别语音单元进行识别,获得所述第一识别结果;
输出所述第一识别结果。
4. 如权利要求1所述的方法,其特征在于,当所述第二识别引擎具体为所述第一种识别引擎时,所述基于所述第一识别引擎或所述第二识别引擎,对所述第一待识别语音单元进行识别,获得第一识别结果,具体包括:
基于所述第一种识别引擎,对所述第一待识别语音单元进行识别,获得 第三识别结果;
基于所述第一识别引擎,对所述第一待识别语音单元进行识别,获得第四识别结果;
判断所述第三识别结果或所述第四识别结果是否满足第二预设条件;
在所述第三识别结果或所述第四识别结果满足所述第二预设条件时,输出所述第三识别结果或所述第四识别结果作为所述第一识别结果。
5. 如权利要求1所述的方法,其特征在于,当所述第二识别引擎具体为所述第二种识别引擎时,所述基于所述第一识别引擎或所述第二识别引擎,对所述第一待识别语音单元进行识别,获得第一识别结果,具体包括:
基于所述第一识别引擎,对所述第一待识别语音单元进行识别,获得第五识别结果;
基于所述第二种识别引擎,对所述第一待识别语音单元进行识别,获得第六识别结果;
判断所述第五识别结果和所述第六识别结果是否满足第三预设条件;
在所述第五识别结果满足所述第三预设条件且所述第六识别结果不满足所述第三预设条件时,输出所述第五识别结果作为所述第一识别结果。
6. 如权利要求5所述的方法,其特征在于,在所述判断所述第五识别结果和所述第六识别结果是否满足第三预设条件之后,所述方法还包括:
在所述第五识别结果不满足所述第三预设条件且所述第六识别结果满足所述第三预设条件时,输出所述第六识别结果作为所述第一识别结果。
7. 如权利要求5所述的方法,其特征在于,在所述判断所述第五识别结果和所述第六识别结果是否满足第三预设条件之后,所述方法还包括:
在所述第五识别结果和所述第六识别结果均满足所述第三预设条件时,输出所述第五识别结果或所述第六识别结果作为所述第一识别结果。
8. 一种电子设备,其特征在于,所述电子设备中至少包括第一识别引擎和第二识别引擎的语音识别系统,所述电子设备包括:
第一获得单元,用于获取一待识别语音信息;
第二获得单元,用于基于所述待识别语音信息,获得至少包括第一待识别语音单元的至少一个待识别语音单元;
识别单元,用于基于所述第一识别引擎和所述第二识别引擎同时对所述第一待识别语音单元进行识别,获得第一识别结果;
其中,所述第二识别引擎具体为:
基于预设规则,对所述第一识别引擎中的第一内容进行筛选而得到的包含有第二内容的第一种识别引擎;或
具有与所述第一识别引擎中的所述第一内容不同的第三内容的第二种识别引擎。
9. 如权利要求8所述的电子设备,其特征在于,当所述第二识别引擎具体为所述第一种识别引擎时,所述识别单元具体包括:
第一识别子单元,用于基于所述第一种识别引擎,对所述第一待识别语音单元进行识别,获得第二识别结果;
第一判断子单元,用于判断所述第二识别结果是否满足第一预设条件;
第一输出子单元,用于在所述第二识别结果满足所述第一预设条件时,输出所述第二识别结果作为所述第一识别结果。
10. 如权利要求9所述的电子设备,其特征在于,所述识别单元还包括:
第二识别子单元,用于在所述第二识别结果不满足所述第一预设条件时,基于所述第一识别引擎,对所述第一待识别语音单元进行识别,获得所述第一识别结果;
第二输出子单元,用于输出所述第一识别结果。
11. 如权利要求8所述的电子设备,其特征在于,当所述第二识别引擎具体为所述第一种识别引擎时,所述识别单元具体包括:
第三识别子单元,用于基于所述第一种识别引擎,对所述第一待识别语音单元进行识别,获得第三识别结果;
第四识别子单元,用于基于所述第一识别引擎,对所述第一待识别语音单元进行识别,获得第四识别结果;
第二判断子单元,用于判断所述第三识别结果或所述第四识别结果是否满足第二预设条件;
第三输出子单元,用于在所述第三识别结果或所述第四识别结果满足所述第二预设条件时,输出所述第三识别结果或所述第四识别结果作为所述第 一识别结果。
12. 如权利要求8所述的电子设备,其特征在于,当所述第二识别引擎具体为所述第二种识别引擎时,所述识别单元具体包括:
第五识别子单元,用于基于所述第一识别引擎,对所述第一待识别语音单元进行识别,获得第五识别结果;
第六识别子单元,用于基于所述第二种识别引擎,对所述第一待识别语音单元进行识别,获得第六识别结果;
第三判断子单元,用于判断所述第五识别结果和所述第六识别结果是否满足第三预设条件;
第四输出子单元,用于在所述第五识别结果满足所述第三预设条件且所述第六识别结果不满足所述第三预设条件时,输出所述第五识别结果作为所述第一识别结果。
13. 如权利要求12所述的电子设备,其特征在于,所述识别单元还包括:
第五输出子单元,用于在所述第五识别结果不满足所述第三预设条件且所述第六识别结果满足所述第三预设条件时,输出所述第六识别结果作为所述第一识别结果。
14. 如权利要求12所述的电子设备,其特征在于,所述识别单元还包括:
第六输出子单元,用于在所述第五识别结果和所述第六识别结果均满足所述第三预设条件时,输出所述第五识别结果或所述第六识别结果作为所述第一识别结果。”
经形式审查合格,国家知识产权局于2018年11月23日依法受理了该复审请求,并将其转送至原专利实质审查部门进行前置审查。
原专利实质审查部门在前置审查意见书中坚持驳回决定。
随后,国家知识产权局成立合议组对本案进行审理。
合议组于2019年07月09日向复审请求人发出复审通知书,指出:1、权利请求1要求保护一种语音识别方法,对于并列技术方案之一:“所述第二识别引擎具体为:基于预设规则,对所述第一识别引擎中的第一内容进行筛选而得到的包含有第二内容的第一种识别引擎”,权利要求1要求保护的技术方案与对比文件1相比,区别技术特征是:(a)第一识别引擎和第二识别引擎同时对第一待识别语音单元进行识别;(b)第二识别引擎具体为:基于预设规则,对第一识别引擎中的第一内容进行筛选而得到的包含有第二内容的第一种识别引擎。区别技术特征(a)是本领域惯用的技术手段,对于区别技术特征(b),对比文件2公开了通过筛选通用词汇词典(第一内容)而得到的包含有第二内容的识别引擎,且其在对比文件2中所起的作用与在本发明中为解决其技术问题所起的作用相同,都是用于基于预设规则获得包含筛选后的内容的识别引擎,以提高语音识别的效率,即对比文件2给出了将该技术特征应用到对比文件1中的技术启示,基于该启示,本领域技术人员能够发现采用筛选后的内容形成识别引擎进行语音识别具有高效语音识别的效果,从而在选择多个识别引擎所包括的内容时,能够想到将其中一个识别引擎的内容,设置为根据另一识别引擎的内容进行筛选获得,以提高语音识别的效率。在对比文件1的基础上结合对比文件2以及本领域的惯用手段,得出该权利要求的该并列技术方案,对本技术领域的技术人员来说是显而易见的。对于并列技术方案之二:“所述第二识别引擎具体为:具有与所述第一识别引擎中的所述第一内容不同的第三内容的第二种识别引擎”,权利要求1要求保护的技术方案与对比文件1相比,区别技术特征是:(a)第一识别引擎和第二识别引擎同时对第一待识别语音单元进行识别。基于上述区别技术特征,权利要求1实际所要解决的技术问题是节省语音识别的时间。如前所述,区别技术特征(a)是本领域的惯用手段。在对比文件1的基础上结合本领域的惯用手段,得出该权利要求的该并列技术方案,对本技术领域的技术人员来说是显而易见的。权利要求1不具备专利法第22条第3款规定的创造性。2、从属权利要求2-7的附加技术特征或被对比文件1公开,或属于本领域惯用的技术手段,在其引用的权利要求不具备创造性的情况下,从属权利要求2-7也不具备专利法第22条第3款规定的创造性。3、权利要求8-14请求保护一种电子设备,其功能单元所执行的步骤和权利要求1-7请求保护的一种语音识别方法的步骤对应一致,在权利要求1-7请求保护的语音识别方法不具备创造性的情况下,权利要求8-14请求保护的电子设备也相应的不具备专利法第22条第3款规定的创造性。
复审请求人于2019年08月26日提交了意见陈述书,并修改了申请文件,基于提出复审请求时的权利要求,修改涉及:1、删除权利要求5-7,12-14。2、权利要求1序号未变,原权利要求8变为权利要求5,修改后的权利要求1、5中,“基于所述第一识别引擎和所述第二识别引擎,同时对所述第一待识别语音单元进行识别”修改为“基于所述第一识别引擎和所述第二识别引擎对所述第一待识别语音单元进行识别”,“其中,所述第二识别引擎具体为:基于预设规则,对所述第一识别引擎中的第一内容进行筛选而得到的包含有第二内容的第一种识别引擎;或具有与所述第一识别引擎中的所述第一内容不同的第三内容的第二种识别引擎”修改为“第一识别引擎对应第一识别集合;第二识别引擎对应第二识别集合,第二识别集合属于第一识别集合;所述第二识别集合经过基于用户频繁使用的高频词的筛选规则对所述第一识别集合进行筛选而建立”,增加特征:“其中,包括:以所述第二识别引擎先对所述第一待识别语音单元进行识别;当识别结果不满足语音匹配条件时再用所述第一识别引擎对所述第一待识别语音单元进行识别,获得最终识别结果”、“其中,所述第二识别引擎优先级高于所述第一识别引擎”。3、权利要求4中,删除“当所述第二识别引擎具体为所述第一种识别引擎时”,“所述基于所述第一识别引擎或所述第二识别引擎”修改为“所述基于所述第一识别引擎和所述第二识别引擎”,“基于所述第一种识别引擎” 修改为“基于所述第二识别引擎”。4、增加从属权利要求6,限定的特征为:“第二识别引擎具体为:基于预设规则,对所述第一识别引擎中的第一内容进行筛选而得到的包含有第二内容的第一种识别引擎;或具有与所述第一识别引擎中的所述第一内容不同的第三内容的第二种识别引擎”。5、原权利要求11变为权利要求9,删除特征“当所述第二识别引擎具体为所述第一种识别引擎时”,“用于基于所述第一种识别引擎” 修改为“用于基于所述第二识别引擎”。6、原权利要求9变为权利要求7,原权利要求10变为权利要求8,适应性地调整引用关系。
经修改的权利要求书如下:
“1. 一种语音识别方法,其特征在于,应用于至少包括第一识别引擎和第二识别引擎的语音识别系统的电子设备中,所述方法包括:
获取一待识别语音信息;
基于所述待识别语音信息,获得至少包括第一待识别语音单元的至少一个待识别语音单元;
基于所述第一识别引擎和所述第二识别引擎,对所述第一待识别语音单元进行识别,获得第一识别结果;其中,包括:以所述第二识别引擎先对所述第一待识别语音单元进行识别;当识别结果不满足语音匹配条件时再用所述第一识别引擎对所述第一待识别语音单元进行识别,获得最终识别结果;
其中,所述第二识别引擎优先级高于所述第一识别引擎;
其中,第一识别引擎对应第一识别集合;第二识别引擎对应第二识别集合,第二识别集合属于第一识别集合;所述第二识别集合经过基于用户频繁使用的高频词的筛选规则对所述第一识别集合进行筛选而建立。
2. 如权利要求1所述的方法,其特征在于,当所述第二识别引擎具体为所述第一种识别引擎时,所述基于所述第一识别引擎或所述第二识别引擎,对所述第一待识别语音单元进行识别,获得第一识别结果,具体包括:
基于所述第一种识别引擎,对所述第一待识别语音单元进行识别,获得第二识别结果;
判断所述第二识别结果是否满足第一预设条件;
在所述第二识别结果满足所述第一预设条件时,输出所述第二识别结果作为所述第一识别结果。
3. 如权利要求2所述的方法,其特征在于,在所述判断所述第二识别结果是否满足第一预设条件之后,所述方法还包括:
在所述第二识别结果不满足所述第一预设条件时,基于所述第一识别引擎,对所述第一待识别语音单元进行识别,获得所述第一识别结果;
输出所述第一识别结果。
4. 如权利要求1所述的方法,其特征在于,所述基于所述第一识别引擎和所述第二识别引擎,对所述第一待识别语音单元进行识别,获得第一识别结果,具体包括:
基于所述第二识别引擎,对所述第一待识别语音单元进行识别,获得第三识别结果;
基于所述第一识别引擎,对所述第一待识别语音单元进行识别,获得第四识别结果;
判断所述第三识别结果或所述第四识别结果是否满足第二预设条件;
在所述第三识别结果或所述第四识别结果满足所述第二预设条件时,输出所述第三识别结果或所述第四识别结果作为所述第一识别结果。
5. 一种电子设备,其特征在于,所述电子设备中至少包括第一识别引擎和第二识别引擎的语音识别系统,所述电子设备包括:
第一获得单元,用于获取一待识别语音信息;
第二获得单元,用于基于所述待识别语音信息,获得至少包括第一待识别语音单元的至少一个待识别语音单元;
识别单元,用于基于所述第一识别引擎和所述第二识别引擎,对所述第一待识别语音单元进行识别,获得第一识别结果;其中,包括:以所述第二识别引擎先对所述第一待识别语音单元进行识别;当识别结果不满足语音匹配条件时再用所述第一识别引擎对所述第一待识别语音单元进行识别,获得最终识别结果;
其中,所述第二识别引擎优先级高于所述第一识别引擎;
其中,第一识别引擎对应第一识别集合;第二识别引擎对应第二识别集合,第二识别集合属于第一识别集合;所述第二识别集合经过基于用户频繁使用的高频词的筛选规则对所述第一识别集合进行筛选而建立。
6. 如权利要求5所述的电子设备,其特征在于,所述第二识别引擎具体为:
基于预设规则,对所述第一识别引擎中的第一内容进行筛选而得到的包含有第二内容的第一种识别引擎;或
具有与所述第一识别引擎中的所述第一内容不同的第三内容的第二种识别引擎。
7. 如权利要求5所述的电子设备,其特征在于,当所述第二识别引擎具体为所述第一种识别引擎时,所述识别单元具体包括:
第一识别子单元,用于基于所述第一种识别引擎,对所述第一待识别语音单元进行识别,获得第二识别结果;
第一判断子单元,用于判断所述第二识别结果是否满足第一预设条件;
第一输出子单元,用于在所述第二识别结果满足所述第一预设条件时,输出所述第二识别结果作为所述第一识别结果。
8. 如权利要求7所述的电子设备,其特征在于,所述识别单元还包括:
第二识别子单元,用于在所述第二识别结果不满足所述第一预设条件时,基于所述第一识别引擎,对所述第一待识别语音单元进行识别,获得所述第一识别结果;
第二输出子单元,用于输出所述第一识别结果。
9. 如权利要求7所述的电子设备,其特征在于,所述识别单元具体包括:
第三识别子单元,用于基于所述第二识别引擎,对所述第一待识别语音单元进行识别,获得第三识别结果;
第四识别子单元,用于基于所述第一识别引擎,对所述第一待识别语音单元进行识别,获得第四识别结果;
第二判断子单元,用于判断所述第三识别结果或所述第四识别结果是否满足第二预设条件;
第三输出子单元,用于在所述第三识别结果或所述第四识别结果满足所述第二预设条件时,输出所述第三识别结果或所述第四识别结果作为所述第一识别结果。”
合议组于2019年09月05日向复审请求人发出合议组变成员更通知书,由原合议组成员:合议组组长李玉林、主审员王馨宁、参审员徐妍妍,变更为:合议组组长李玉林、主审员崔朝利、参审员徐妍妍。
在上述程序的基础上,合议组认为本案事实已经清楚,可以作出审查决定。
二、决定的理由
(一)审查文本的认定
复审请求人在2019年08月26日答复复审通知书时提交了权利要求书的全文修改替换页。经查,所做修改符合专利法第33条的规定。本复审请求审查决定针对的文本是:申请日2012年12月24日提交的说明书第1-17页、说明书附图第1-2页、说明书摘要、摘要附图;以及2019年08月26日提交的权利要求第1-9项。
(二)关于创造性
专利法第22条第3款规定:创造性,是指与现有技术相比,该发明具有突出的实质性特点和显著的进步,该实用新型具有实质性特点和进步。
如果一项权利要求请求保护的技术方案相对于作为最接近现有技术的对比文件存在区别技术特征,其中一部分区别技术特征被其他对比文件公开,且其在该被其他对比文件中的作用与在本申请中相同,另一部分区别技术特征属于本领域惯用的技术手段,那么该项权利要求的技术方案是显而易见的,不具备创造性。
1、权利要求1要求保护一种语音识别方法,对比文件1公开了一种语音识别方法,并具体公开了如下技术特征(参见说明书第9页第2段-第11页第3段,第12页第1段-第15页末段、附图3):该语音识别方法应用于ASR系统(即语音识别系统);从用户接收输入语音(对应于待识别语音信息);将用户输入的语音数据段分成重叠语音帧,这些帧对应于声学子字(对应于获得至少包括第一待识别语音单元的至少一个待识别语音单元);将语音帧送入解码器模块识别子字、利用子模型构造字、并借助语言模型构造句子;其中,通过多遍识别技术把词表内语音和词表外语音区别开,以改进字识别(对应于基于所述第一识别引擎和所述第二识别引擎,对所述第一待识别语音单元进行识别,获得第一识别结果):第一遍语音识别(对应于第二识别引擎)使用解码器根据第一词汇来处理语音,第二遍语音识别(对应于第一识别引擎)使用解码器根据第二组词汇来处理语音,第一组词汇包括在某一语法之内可接受或期望的字,第二组词汇包括不可接受或未期望的字(对应于以所述第二识别引擎先对所述第一待识别语音单元进行识别;所述第二识别引擎优先级高于所述第一识别引擎);如果语音解码中的置信度不够高,则执行第二遍语音识别,其中使用解码器根据包括不可接受或未期望的字的第二组词汇来处理语音(对应于当识别结果不满足语音匹配条件时再用所述第一识别引擎对所述第一待识别语音单元进行识别,获得最终识别结果);隐含公开了应用于包括该ASR系统的电子设备(即隐含公开了应用于至少包括第一识别引擎和第二识别引擎的语音识别系统的电子设备中)。
权利要求1要求保护的技术方案与对比文件1相比,区别技术特征是:第一识别引擎对应第一识别集合;第二识别引擎对应第二识别集合,第二识别集合属于第一识别集合;所述第二识别集合经过基于用户频繁使用的高频词的筛选规则对所述第一识别集合进行筛选而建立。基于上述区别技术特征,权利要求1实际所要解决的技术问题是如何提高语音识别的效率。
对于该区别技术特征,对比文件2公开了一种语音识别的方法,具体公开了如下技术内容(参见说明书第2页末段-第3页第2段,第6页第2段):词汇词典管理单元,其用于从词汇词典存储单元中存储的多个词(即第一识别集合)中提取(即筛选)作为识别目标的识别目标词(即第二识别集合);还包括:使用频率管理单元,其用于监测在词汇词典存储单元中存储的多个词中每个词的使用次数,并计算多个词中每个词的使用频率;使用频率存储单元,其用于存储由使用频率管理单元计算的使用频率作为使用频率数据,其中使用频率数据与词汇词典存储单元中存储的多个词中的每个词相对应;和尺度信息管理单元,其用于至少使用使用频率存储单元中存储的使用频率数据,更新尺度信息存储单元中存储的尺度信息,尺度信息管理单元至少使用使用频率数据更新尺度信息(对应于第二识别集合经过基于用户频繁使用的高频词的筛选规则对所述第一识别集合进行筛选而建立)。因此,在基于尺度信息提取识别目标词的情况下,词汇词典管理单元可提取具有高使用频率的词作为识别目标词,并从识别目标中排除具有低使用频率的词。可见,对比文件2公开了上述区别技术特征,且其在对比文件2中所起的作用与在本发明中为解决其技术问题所起的作用相同,都是基于预设规则获得包含筛选后的内容的识别引擎,以提高语音识别的效率,即对比文件2给出了将该技术特征应用到对比文件1中的技术启示,基于该启示本领域技术人员能够基于词汇的使用频率数据筛选出第二识别集合,并采用与之对应的第二识别引擎进行语音识别,具有高效语音识别的效果。
在对比文件1的基础上结合对比文件2得到权利要求1的技术方案,对本领域的技术人员来说是显而易见的,权利要求1请求保护的技术方案不具有突出的实质性特点和显著的进步,不具备专利法第22条第3款规定的创造性。
2、从属权利要求2对权利要求1进行了进一步限定,从属权利要求3对权利要求2进行了进一步限定,从属权利要求4对权利要求1进行了进一步限定,对比文件1进一步公开了如下内容(参见说明书第12页末段、附图3):执行第一遍语音识别(即利用其中一个识别引擎进行识别),如果语音识别结果的置信度高,则设置第一遍结果为识别结果;如果语音解码中的置信度不高(即不满足预设条件),则执行第二遍语音识别(即利用另一个识别引擎进行识别)。即对比文件1公开了在利用两种识别引擎进行识别时,设置预设条件进行识别步骤的跳转和识别结果的选择的技术方案。而具体的先利用哪种引擎进行识别,如何利用预设条件选择识别结果,均为本领域为了使得识别结果达到预设条件所采用的惯用手段。在其引用的权利要求不具备创造性的情况下,上述从属权利要求也不具备专利法第22条第3款规定的创造性。
3、权利要求5,7-9请求保护一种电子设备,其功能单元所执行的步骤和权利要求1-4请求保护的一种语音识别方法的步骤对应一致,在权利要求1-4请求保护的语音识别方法不具备创造性的情况下,权利要求5,7-9请求保护的电子设备也相应的不具备专利法第22条第3款规定的创造性。
4、从属权利要求6对权利要求5进行了进一步限定。对于并列技术方案之一:“所述第二识别引擎具体为: 基于预设规则,对所述第一识别引擎中的第一内容进行筛选而得到的包含有第二内容的第一种识别引擎”,对比文件2公开了一种语音识别的方法,具体公开了如下技术内容(参见说明书第2页末段-第3页第2段,第6页第2段):词汇词典管理单元,其用于从词汇词典存储单元中存储的多个词(即第一内容)中提取(即筛选)作为识别目标的识别目标词(即第二内容);匹配单元(即第二识别引擎),其用于使用由语音分析单元转换的特征值,计算与由词汇词典管理单元提取的识别目标词的匹配度;结果输出单元,其用于根据所述匹配单元计算的匹配度结果,输出具有最佳匹配分数的词作为识别结果(即获得第一识别结果);还包括:使用频率管理单元,其用于监测在词汇词典存储单元中存储的多个词中每个词的使用次数,并计算多个词中每个词的使用频率;使用频率存储单元,其用于存储由使用频率管理单元计算的使用频率作为使用频率数据,其中使用频率数据与词汇词典存储单元中存储的多个词中的每个词相对应;和尺度信息管理单元,其用于至少使用使用频率存储单元中存储的使用频率数据,更新尺度信息存储单元中存储的尺度信息,尺度信息管理单元至少使用使用频率数据更新尺度信息(对应于基于预设规则,对第一内容进行筛选而得到包含有第二内容的第一种识别引擎)。因此,在基于尺度信息提取识别目标词的情况下,词汇词典管理单元可提取具有高使用频率的词作为识别目标词,并从识别目标中排除具有低使用频率的词。可见,对比文件2公开了通过筛选通用词汇词典(第一内容)而得到的包含有第二内容的识别引擎,且其在对比文件2中所起的作用与在本发明中为解决其技术问题所起的作用相同,都是用于基于预设规则获得包含筛选后的内容的识别引擎,以提高语音识别的效率,即对比文件2给出了将该技术特征应用到对比文件1中的技术启示,基于该启示本领域技术人员能够发现采用筛选后的内容形成识别引擎进行语音识别具有高效语音识别的效果,从而在选择多个识别引擎所包括的内容时,能够想到将其中一个识别引擎的内容,设置为根据另一识别引擎的内容进行筛选获得,以提高语音识别的效率。
对于并列技术方案之二:“所述第二识别引擎具体为:具有与所述第一识别引擎中的所述第一内容不同的第三内容的第二种识别引擎”,对比文件1公开(参见说明书第9页第2段-第11页第3段):第一组词汇包括在某一语法之内可接受或期望的字,第二组词汇包括不可接受或未期望的字(对应于第二识别引擎具体为具有与所述第一识别引擎中的所述第一内容不同的第三内容的第二种识别引擎)。可见,该附加技术特征被对比文件1公开了。在其引用的权利要求不具备创造性的情况下,从属权利要求6也不具备专利法第22条第3款规定的创造性。
(三)对复审请求人相关意见的评述
复审请求人认为:本申请中,第二识别引擎优先级高于第一识别引擎,可以先以第二识别引擎对所述待识别语音信息中包含的至少一个待识别语音单元进行识别,当识别结果不满足语音匹配条件时再用第一识别引擎对所述待识别语音信息中包含的至少一个待识别语音单元进行识别。可见,第一识别引擎也是需要进行识别的,尤其是针对第二识别引擎不满足语音匹配条件的情况下。其中,第一识别引擎对应第一识别集合;第二识别引擎对应第二识别集合,第二识别集合属于第一识别集合,即第一识别集合是一个大集合,第二识别集合是取自大集合的一个小集合。基于用户频繁使用的高频词的筛选规则,也就是在利用第一识别引擎和第二识别引擎进行语音识别时,累计第二识别引擎无法识别出,但第一识别引擎能够识别出的语音,即用户频繁使用的高频词,从第一识别集合中将这部分词汇筛选出来补充至第二识别集合中,从而建立/更新第二识别集合。本申请中的第二识别引擎对应的第二识别集合会基于两个识别引擎的识别结果进行调整,这会使得后续的识别效果会越来越好。对比文件1中,第一遍语音识别基于的是词表内的词汇,第二遍语音识别基于的是词表外的词汇。对比文件2是基于从词汇词典中提取的词汇进行语音识别。修改后的权利要求1对本领域的技术人员来说是非显而易见的。
合议组认为:对于第二识别引擎和第一识别引擎的先后识别,对比文件1公开了先利用第二识别引擎进行识别,再利用第一识别引擎进行识别的技术方案。对比文件1中针对不同的词汇识别集合,第一遍语音识别(对应于第二识别引擎)使用解码器根据第一词汇来处理语音,第二遍语音识别(对应于第一识别引擎)使用解码器根据第二组词汇来处理语音;并且对比文件1还公开了执行第二遍识别的条件,即如果语音解码中的置信度不够高(对应于不满足语音匹配条件),则执行第二遍语音识别。可见对比文件1公开了第二识别引擎优先级高于第一识别引擎,根据设定的条件,采用第二识别引擎和第一识别引擎先后进行识别。对于识别引擎对应的识别集合,权利要求1限定了第二识别集合经过基于用户频繁使用的高频词的筛选规则对所述第一识别集合进行筛选而建立。对比文件2通过筛选通用词汇词典(第一识别集合)而得到的包含有第二识别集合的识别引擎,筛选的规则也是基于词汇的使用频率,且其在对比文件2中所起的作用与在本发明中为解决其技术问题所起的作用相同,都是用于基于预设规则获得包含筛选后的内容的识别引擎,以提高语音识别的效率,即对比文件2给出了将该技术特征应用到对比文件1中的技术启示,权利要求1对本领域的技术人员来说是显而易见的,不具备创造性。此外,权利要求6中还限定出另外一种识别引擎对应的识别集合,即第二识别引擎具体为:具有与所述第一识别引擎中的所述第一内容不同的第三内容的第二种识别引擎,对于该技术方案,对比文件1公开了第一组词汇包括在某一语法之内可接受或期望的字,第二组词汇包括不可接受或未期望的字(对应于第二识别引擎具体为:具有与所述第一识别引擎中的所述第一内容不同的第三内容的第二种识别引擎),可见该技术方案的构思被对比文件1公开了。权利要求6所限定出的技术方案也不具备创造性。
综上所述,复审请求人的意见陈述不具有说服力,合议组不予支持。
三、决定
维持国家知识产权局于2018年08月06日对本申请作出的驳回决定。
如对本复审请求审查决定不服,根据专利法第41条第2款的规定,复审请求人可以自收到本决定之日起三个月内向北京知识产权法院起诉。
郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如作者信息标记有误,请第一时间联系我们修改或删除,多谢。