发明创造名称:一种语音搜索方法及装置
外观设计名称:
决定号:183100
决定日:2019-07-05
委内编号:1F260366
优先权日:
申请(专利)号:201510133760.4
申请日:2015-03-25
复审请求人:百度在线网络技术(北京)有限公司
无效请求人:
授权公告日:
审定公告日:
专利权人:
主审员:李劲娴
合议组组长:李燕东
参审员:田志刚
国际分类号:G06F17/30;G10L15/00
外观设计分类号:
法律依据:专利法第22条第3款
决定要点
:如果权利要求保护的技术方案相对于最接近的现有技术存在区别技术特征,但其它现有技术中给出了将上述区别技术特征应用到该最接近的现有技术以解决其技术问题的启示,这种启示会使本领域的技术人员在面对所述技术问题时,有动机改进该最接近的现有技术并获得要求保护的技术方案,则该权利要求的技术方案是显而易见的,不具备创造性。
全文:
本复审请求涉及申请号为201510133760.4,名称为“一种语音搜索方法及装置”的发明专利申请(下称本申请)。本申请的申请人为百度在线网络技术(北京)有限公司,申请日为2015年03月25日,公开日为2015年06月24日。
经实质审查,国家知识产权局原审查部门于2018年05月25日发出驳回决定,驳回了本申请,其理由是:权利要求1-8不具备专利法第22条第3款规定的创造性。
驳回决定引用了如下2篇对比文件:
对比文件1:CN103092887A,公开日为2013年05月28日。
对比文件2:CN102968987A,公开日为2013年03月13日。
其中对比文件1为最接近的现有技术。
驳回决定所依据的文本为:2017年11月20日提交的权利要求第1-8项、申请日2015年03月25日提交的说明书第1-132段、说明书附图图1-2、说明书摘要、摘要附图。
驳回决定所针对的权利要求书如下:
“1. 一种语音搜索方法,其特征在于,所述方法包括:
对输入的语音信号进行语音识别,以获得M个识别结果,M为大于1的整数;
根据所述M个识别结果进行搜索,以获得第一搜索结果;
输出所述第一搜索结果;
所述根据所述M个识别结果进行搜索,以获得第一搜索结果,包括:
从所述M个识别结果中选择N个识别结果,N为大于1且小于或者等于M的整数;
获得与所述N个识别结果中每个所述识别结果相匹配的第二搜索结果;
根据与所述N个识别结果中每个所述识别结果相匹配的第二搜索结果,获得所述第一搜索结果。
2. 根据权利要求1所述的方法,其特征在于,所述从所述M个识别结果中选择N个识别结果,包括:
获得所述M个识别结果中每个所述识别结果的置信度;
获得所述M个识别结果中置信度大于或者等于预设的第一阈值的P个识别结果,P为大于或者等于N且小于或者等于M的整数;
在所述P个识别结果中,去除与其他识别结果之间的差值大于或者等于预设的第二阈值的识别结果,以获得所述N个识别结果。
3. 根据权利要求2所述的方法,其特征在于,所述根据与所述N个识别结果中每个所述识别结果相匹配的第二搜索结果,获得所述第一搜索结果,包括:
获得与所述N个识别结果中每个所述识别结果相匹配的第二搜索结果的初始权重值;
根据所述初始权重值以及每个所述识别结果的置信度,获得与所述N个识别结果中每个所述识别结果相匹配的第二搜索结果的排序权重值;
根据排序权重值由大到小的顺序,对与所述N个识别结果中每个所述识别结果相匹配的第二搜索结果进行排序,以获得排序结果,以作为所述第一搜索结果。
4. 根据权利要求1所述的方法,其特征在于,所述根据与所述N个识别结果中每个所述识别结果相匹配的第二搜索结果,获得所述第一搜索结果,包括:
获得与所述N个识别结果中每个所述识别结果相匹配的第二搜索结果的初始权重值;
根据初始权重值由大到小的顺序,对与所述N个识别结果中每个所述识别结果相匹配的第二搜索结果进行排序,以获得排序结果,以作为所述第一搜索结果。
5. 一种语音搜索装置,其特征在于,所述装置包括:
语音识别模块,用于对输入的语音信号进行语音识别,以获得M个识别结果,M为大于1的整数;
搜索模块,用于根据所述M个识别结果进行搜索,以获得第一搜索结果;
输出模块,用于输出所述第一搜索结果;
所述搜索模块,具体用于:
从所述M个识别结果中选择N个识别结果,N为大于1且小于或者等于M的整数;
获得与所述N个识别结果中每个所述识别结果相匹配的第二搜索结果;
根据与所述N个识别结果中每个所述识别结果相匹配的第二搜索结果,获得所述第一搜索结果。
6. 根据权利要求5所述的装置,其特征在于,所述搜索模块用于从所述M个识别结果中选择N个识别结果时,具体用于:
获得所述M个识别结果中每个所述识别结果的置信度;
获得所述M个识别结果中置信度大于或者等于预设的第一阈值的P个识别结果,P为大于或者等于N且小于或者等于M的整数;
在所述P个识别结果中,去除与其他识别结果之间的差值大于或者等于预设 的第二阈值的识别结果,以获得所述N个识别结果。
7. 根据权利要求6所述的装置,其特征在于,所述搜索模块用于根据与所述N个识别结果中每个所述识别结果相匹配的第二搜索结果,获得所述第一搜索结果时,具体用于:
获得与所述N个识别结果中每个所述识别结果相匹配的第二搜索结果的初始权重值;
根据所述初始权重值以及每个所述识别结果的置信度,获得与所述N个识别结果中每个所述识别结果相匹配的第二搜索结果的排序权重值;
根据排序权重值由大到小的顺序,对与所述N个识别结果中每个所述识别结果相匹配的第二搜索结果进行排序,以获得排序结果,以作为所述第一搜索结果。
8. 根据权利要求5所述的装置,其特征在于,所述搜索模块,具体用于:
获得与所述N个识别结果中每个所述识别结果相匹配的第二搜索结果的初始权重值;
根据初始权重值由大到小的顺序,对与所述N个识别结果中每个所述识别结果相匹配的第二搜索结果进行排序,以获得排序结果,以作为所述第一搜索结果。”
驳回决定的主要理由为:权利要求1相对于对比文件1的区别特征在于:所述根据所述M个识别结果进行搜索,以获得第一搜索结果,包括:从所述M个识别结果中选择N个识别结果,N为大于1且小于或者等于M的整数;获得与所述N个识别结果中每个所述识别结果相匹配的第二搜索结果;根据与所述N个识别结果中每个所述识别结果相匹配的第二搜索结果,获得所述第一搜索结果。基于上述区别特征,权利要求1相对于对比文件1实际解决的技术问题在于:提高结果准确性。对比文件2公开了一种语音识别方法,并公开了特征“从所述M个识别结果中选择N个识别结果,N为大于1且小于或者等于M的整数”。对比文件2中相应技术手段在对比文件2中所起的作用与上述区别特征在该权利要求中为解决提高结果准确性的技术问题所起的作用相同。即对比文件2给出了将上述区别特征用于对比文件1的技术方案,以解决提高结果准确性的技术问题的启示。对比文件1公开了基于多个识别结果搜索,对比文件2给出了筛选识别结果的启示。在对比文件1的基础上结合对比文件2,为了提高结果的准确性,本领域技术人员将容易想到基于筛选后的识别结果搜索的技术内容。因此,在对比文件1的基础上结合对比文件2与本领域公知常识,以得出该权利要求请求保护的技术方案,对本领域技术人员来说是显而易见的。因此,权利要求1不具备专利法第二十二条第三款规定的创造性。从属权利要求2-4的附加技术特征或已被对比文件2公开,或属于本领域的公知常识。因此,在其引用的权利要求不具备创造性的情况下,上述权利要求也不具备专利法第二十二条第三款规定的创造性。权利要求5-8请求保护一种语音搜索装置。权利要求5-8是与方法权利要求1-4对应一致的装置权利要求。基于相似的理由,权利要求5-8不具备专利法第二十二条第三款规定的创造性。
申请人(下称复审请求人)对上述驳回决定不服,于2018年09月10日向国家知识产权局提出了复审请求,同时未修改权利要求书。复审请求人认为:本申请权利要求1与对比文件1相比,至少具有如下区别技术特征:根据所述M个识别结果进行搜索,以获得第一搜索结果;输出所述第一搜索结果;所述根据所述M个识别结果进行搜索,以获得第一搜索结果,包括:从所述M个识别结果中选择N个识别结果,N为大于1且小于或者等于M的整数;获得与所述N个识别结果中每个所述识别结果相匹配的第二搜索结果;根据与所述N个识别结果中每个所述识别结果相匹配的第二搜索结果,获得所述第一搜索结果。对比文件2中同样没有公开上述区别技术特征。
经形式审查合格,国家知识产权局于2018年09月13日依法受理了该复审请求,并将其转送至原审查部门进行前置审查。
原审查部门在前置审查意见书中认为:对比文件1背景技术部分公开了通过语音命令“zhangxin”找到多个联系人,进而得到联系人的电话号码。对比文件2公开了将输入的语音信息的语音特征向量与词库中每个语音特征向量进行相似度比较,提取相似度排名靠前的语音识别结果。对比文件1公开了输入语音命令。但是用户输入语音命令时可能存在发音不准确的问题,这个问题是语音检索领域客观存在的问题。在对比文件1的基础上,当用户语音发音不准确时,输入的语音与词库匹配的结果可能有多个(即M个)。为了提高识别结果的准确性,本领域技术人员有动机借鉴对比文件2公开的技术内容,选择相似度排名靠前的语音识别结果(即从M个结果中选择N个)。进而,对比文件1会基于筛选出的N个结果检索电话号码。此外,对比文件1具体实施方式部分公开的技术方案同样能够评述权利要求1的技术方案。对比文件1说明书第[0043]-[0067]段公开了“电子设备接收语音输入‘呼叫zhangxin’......电子设备对所接收到的语音输入进行识别,并产生相应的识别结果‘呼叫zhangxin’......电子设备在通讯簿中查找到如上所述的具有相同发音‘zhangxin’的'张欣'、'章欣'、'张鑫'的所有电话号码......在用户说出‘‘弓长'张’时,电子设备在与‘zhangxin’匹配的匹配项中继续搜索与‘‘弓长'张’匹配的匹配项,并继而搜索到包含‘张欣'和‘'张鑫'在内的所有电话号码”。上述公开的内容中,基于“张”进一步筛选匹配项,继而根据筛选后的匹配项搜索电话号码,公开了申请人主张的区别“从所述M个识别结果中选择N个识别结果,N为大于1且小于或者等于M的整数;获得与所述N个识别结果中每个所述识别结果相匹配的第二搜索结果”。而且对比文件1进一步分析“张鑫”和“张欣”电话号码的类别特征,在分析前必然“得到”了他们的电话号码。因此,电话号码(搜索结果)是被“输出”了的。因而坚持原驳回决定。
随后,国家知识产权局成立合议组对本案进行审理。
合议组于2019年02月27日向复审请求人发出复审通知书,指出:权利要求1-8不具备专利法第22条第3款规定的创造性。通知书中引用原审查部门在驳回决定中所引用的对比文件1和对比文件2作为对比文件,即:对比文件1:CN103092887A,公开日为2013年05月28日。对比文件2:CN102968987A,公开日为2013年03月13日。其中对比文件1为最接近的现有技术。权利要求1与对比文件1相比,其区别特征在于:根据与所述N个识别结果中每个所述识别结果相匹配的第二搜索结果,获得所述第一搜索结果。输出所述第一搜索结果。基于上述区别特征,该权利要求相对于对比文件1实际解决的技术问题在于:利用语音识别结果作为搜索关键词,从而为用户返回相关但不特定的多个搜索结果。对于本领域技术人员而言,权利要求1和对比文件1所要处理的核心问题均是:在语音识别过程中,存在同音字(词)或者模糊音,导致一组语音输入数据可能对应多个识别结果。权利要求1和对比文件1所采用的技术方案均是返回多个识别结果并基于识别结果进行进一步的处理动作,只是基于其应用场景和目的选择了不同的进一步处理方式。对比文件1的技术应用场景是需要给用户准确匹配的结果,因此采用了通过进一步与用户进行交互,由用户从多个结果中逐步选择正确结果的方式。而权利要求1的技术应用场景是需要利用语音识别结果作为搜索关键词,进行进一步的搜索动作,其目的是给用户返回相关但不特定的多个结果,在此种情况下,不需要在关键词识别阶段就收敛为单一的精确结果。上述对应于不同的应用场景而对搜索结果进行不同处理的方式属于本领域的公知常识。因此,在对比文件1公开的以上内容的基础上,本领域技术人员容易想到在需要利用语音识别结果作为搜索关键词时,可以为用户返回相关但不特定的多个搜索结果。同时,在获得搜索结果以后将其进行输出也是本领域的常用技术手段。因此,在对比文件1的基础上结合本领域公知常识,以得出该权利要求请求保护的技术方案,对本领域技术人员来说是显而易见的。因此,权利要求1不具备专利法第22条第3款规定的创造性。权利要求2-4的附加技术特征或已被对比文件2公开,或属于本领域的常用技术手段。因此,权利要求2-4也不具备专利法第22条第3款规定的创造性。权利要求5-8请求保护一种语音搜索装置。权利要求5-8是与方法权利要求1-4对应一致的装置权利要求。基于相似的理由,权利要求5-8不具备专利法第22条第3款规定的创造性。
复审请求人于2019年03月14日提交了意见陈述书,同时修改了权利要求:将原权利要求2的附加技术特征补入原权利要求1,将原权利要求6的附加技术特征补入原权利要求5,同时相应修改了权利要求的序号和引用关系。复审请求人认为:修改后的权利要求1与对比文件1相比,至少存在以下区别:1)获得所述M个识别结果中每个所述识别结果的置信度;获得所述M个识别结果中置信度大于或者等于预设的第一阈值的P个识别结果,P为大于或者等于N且小于或者等于M的整数;在所述P个识别结果中,去除与其他识别结果之间的差值大于或者等于预设的第二阈值的识别结果,以获得所述N个识别结果。2)根据与所述N个识别结果中每个所述识别结果相匹配的第二搜索结果,获得所述第一搜索结果。合议组认为上述区别技术特征1)已被对比文件2公开,复审请求人对此并不认同。对比文件2中该置信度是语音分类词库中所有词组或字的置信度,该置信度是为了确定语音信息对应的识别结果。而本申请中首先已经利用对比文件2中所述的常规识别方式确定出了M个识别结果,需要利用该M个识别结果的置信度进一步选择出N个识别结果。很显然,对比文件2中的置信度并非识别结果的,而是数据库中所有词组或字的,并且该置信度的作用是获得语音信息对应的初步识别结果的,并非是从初步的识别结果中进一步选择识别结果的。也就是说,无论是置信度本身所属的对象,还是置信度的作用,对比文件2和本申请的权利要求1均完全不同,因此并不能够单凭“置信度”一个词语而将上述区别技术特征强行与对比文件2进行等同。另外,合议组认为去除与其他识别结果之间的差异大于或等于预设的第二阈值的识别结果是为了提高准确性所采用的常规技术手段,申请人对此说法同样无法认同。在本申请的特定技术场景下,利用已经通过置信度选择出的P个识别结果之间置信度的差值进一步选取出N个识别结果,从而在提高搜索结果多样性的同时,尽可能提高搜索结果的准确性和有效性。这是本申请申请日之前并未公开记载和使用过的,合议组在查看了本申请所提供技术方案的前提下得出上述结论未免有“事后诸葛亮”的嫌疑。
答复复审通知书时新修改的权利要求1和4如下:
“1. 一种语音搜索方法,其特征在于,所述方法包括:
对输入的语音信号进行语音识别,以获得M个识别结果,M为大于1的整数;
根据所述M个识别结果进行搜索,以获得第一搜索结果;
输出所述第一搜索结果;
所述根据所述M个识别结果进行搜索,以获得第一搜索结果,包括:
从所述M个识别结果中选择N个识别结果,N为大于1且小于或者等于M的整数;
获得与所述N个识别结果中每个所述识别结果相匹配的第二搜索结果;
根据与所述N个识别结果中每个所述识别结果相匹配的第二搜索结果,获得所述第一搜索结果;
其中,从所述M个识别结果中选择N个识别结果,包括:
获得所述M个识别结果中每个所述识别结果的置信度;
获得所述M个识别结果中置信度大于或者等于预设的第一阈值的P个识别结果,P为大于或者等于N且小于或者等于M的整数;
在所述P个识别结果中,去除与其他识别结果之间的差值大于或者等于预设的第二阈值的识别结果,以获得所述N个识别结果。”
“4. 一种语音搜索装置,其特征在于,所述装置包括:
语音识别模块,用于对输入的语音信号进行语音识别,以获得M个识别结果,M为大于1的整数;
搜索模块,用于根据所述M个识别结果进行搜索,以获得第一搜索结果;
输出模块,用于输出所述第一搜索结果;
所述搜索模块,具体用于:
从所述M个识别结果中选择N个识别结果,N为大于1且小于或者等于M的整数;
获得与所述N个识别结果中每个所述识别结果相匹配的第二搜索结果;
根据与所述N个识别结果中每个所述识别结果相匹配的第二搜索结果,获得所述第一搜索结果;
所述搜索模块从所述M个识别结果中选择N个识别结果时,具体用于:
获得所述M个识别结果中每个所述识别结果的置信度;
获得所述M个识别结果中置信度大于或者等于预设的第一阈值的P个识别结果,P为大于或者等于N且小于或者等于M的整数;
在所述P个识别结果中,去除与其他识别结果之间的差值大于或者等于预设的第二阈值的识别结果,以获得所述N个识别结果。”
在上述程序的基础上,合议组认为本案事实已经清楚,可以作出审查决定。
二、决定的理由
审查文本的认定
复审请求人答复复审通知书时,修改了权利要求书,其修改符合专利法第33条和专利法实施细则第61条第1款的规定。本复审请求审查决定所依据的文本为:2019年03月14日提交的权利要求第1-6项、申请日2015年03月25日提交的说明书第1-132段、说明书附图图1-2、说明书摘要、摘要附图。
2、关于专利法第22条第3款
专利法第22条第3款规定:“创造性,是指与现有技术相比,该发明具有突出的实质性特点和显著的进步,该实用新型具有实质性特点和进步。”
如果要求保护的技术方案相对于最接近的现有技术存在区别技术特征,且其它现有技术中给出了将上述区别技术特征应用到该最接近的现有技术以解决其技术问题的启示,这种启示会使本领域的技术人员在面对所述技术问题时,有动机改进该最接近的现有技术并获得要求保护的技术方案,则该权利要求的技术方案是显而易见的,不具备创造性。
本复审请求审查决定引用的对比文件与驳回决定及复审通知书中所引用的对比文件相同,即:
对比文件1:CN103092887A,公开日为2013年05月28日。
对比文件2:CN102968987A,公开日为2013年03月13日。
其中对比文件1为最接近的现有技术。
2.1、权利要求1要求保护一种语音搜索方法。
对比文件1公开了一种语音信息提供方法,并具体公开了以下技术特征(参见说明书[0039]-[0073]段):电子设备支持语音拨号的功能,在用户说出“呼叫zhangxin”(或“拨打zhangxin的电话”)时,电子设备接收语音输入“呼叫zhangxin”(或“拨打zhangxin的电话”)。然后,电子设备对所接收的语音输入进行识别,并产生相应的识别结果“呼叫zhangxin”。接下来,电子设备在其通讯簿中查找与“zhangxin”匹配的电话号码。例如,电子设备在通讯簿中查找到如上所述的具有相同发音“zhangxin”的“张欣”、“章欣”、“张鑫”(相当于对输入的语音信号进行语音识别,以获得M个识别结果,M为大于1的整数)的所有电话号码,并且每个电话号码对应于一个匹配项。电子设备然后对这些匹配项进行差异性检验,所述差异性检验包括提取所述不同的联系人的标识的文字特征,并且依据所述文字特征生成差异性标签。具体地,可以分析每个匹配项的联系人的标识(“张欣”、“章欣”、“张鑫”)的文字特征,例如弓长“张”、立早“章”,并依据所述文字特征生成差异性标签,例如弓长“张”、立早“章”。然后,电子设备通过语音播报出所生成的差异性标签,例如,弓长“张”还是立早“章”,以供用户的进一步选择。在用户说出“弓长‘张’”时,电子设备接收用户的语音输入,对其进行识别,并相应地生成识别结果“弓长‘张’”。电子设备在与“zhangxin”匹配的匹配项中继续搜索与“弓长‘张’”匹配的匹配项,并继而搜索到包含“张欣”和“张鑫”在内的所有电话号码(相当于从所述M个识别结果中选择N个识别结果,N为大于1且小于或者等于M的整数;获得与所述N个识别结果中每个所述识别结果相匹配的第二搜索结果)。逐级地提取所搜索的匹配项中的最显著差异,并生成相应的差异性标签,通过语音输出所生成的差异性标签以供用户选择。最后,在用户说出“北京联通”时,电子设备接收用户的语音输入,对其进行识别,并相应地生成识别结果“北京联通”,然后开始呼叫“张欣”的“北京联通”“手机”18601234567。另一方面,在用户说出“上海手机”时,电子设备接收用户的语音输入,对其进行识别,并相应地生成识别结果“上海手机”,然后开始呼叫“张欣”的“上海”“手机”13691234567(相当于根据所述M个识别结果进行搜索,以获得第一搜索结果)。
权利要求1与对比文件1相比,其区别特征在于:(1)根据与所述N个识别结果中每个所述识别结果相匹配的第二搜索结果,获得所述第一搜索结果。输出所述第一搜索结果。(2)获得所述M个识别结果中每个所述识别结果的置信度;获得所述M个识别结果中置信度大于或者等于预设的第一阈值的P个识别结果,P为大于或者等于N且小于或者等于M的整数;在所述P个识别结果中,去除与其他识别结果之间的差值大于或者等于预设的第二阈值的识别结果,以获得所述N个识别结果。基于上述区别特征,该权利要求相对于对比文件1实际解决的技术问题在于:对初始语音识别结果进行筛选,利用筛选后的语音识别结果作为搜索关键词,从而为用户返回相关但不特定的多个搜索结果。
针对区别技术特征(1),对于本领域技术人员而言,权利要求1和对比文件1所要处理的核心问题均是:在语音识别过程中,存在同音字(词)或者模糊音,导致一组语音输入数据可能对应多个识别结果。权利要求1和对比文件1所采用的技术方案均是返回多个识别结果并基于识别结果进行进一步的处理动作,只是基于其应用场景和目的选择了不同的进一步处理方式。对比文件1的技术应用场景是需要给用户准确匹配的结果,因此采用了通过进一步与用户进行交互,由用户从多个结果中逐步选择正确结果的方式。而权利要求1的技术应用场景是需要利用语音识别结果作为搜索关键词,进行进一步的搜索动作,其目的是给用户返回相关但不特定的多个结果,在此种情况下,不需要在关键词识别阶段就收敛为单一的精确结果。上述对应于不同的应用场景而对搜索结果进行不同处理的方式属于本领域的公知常识。因此,在对比文件1公开的以上内容的基础上,本领域技术人员容易想到在需要利用语音识别结果作为搜索关键词时,可以为用户返回相关但不特定的多个搜索结果。同时,在获得搜索结果以后将其进行输出也是本领域的常用技术手段。
针对区别技术特征(2),其一部分附加技术特征已被对比文件2公开(参见说明书第42-43段):服务器从用户输入的语音信息中提取语音特征向量,将提取的语音特征向量依次与找到的语音分类词库中的每个语音特征向量进行相似度(相当于置信度)比较,将相似度排名靠前的语音特征向量对应的词组或字作为识别结果;其中,具体提取几个识别结果可以依据需求进行配置;得到的一个以上识别结果依据相似度由高到低进行排序,得到识别结果序列。同时,对于本领域技术人员而言,去除与其他识别结果之间的差值大于或者等于预设的第二阈值的识别结果,从而排除识别群体中差距较大的明显异常的对象,这是为了提高结果准确性而采用的常规技术手段。
因此,在对比文件1的基础上结合对比文件2及本领域公知常识,以得出该权利要求请求保护的技术方案,对本领域技术人员来说是显而易见的。因此,该权利要求不具有突出的实质性特点和显著的进步,不具备专利法第22条第3款规定的创造性。
2.2、权利要求2引用权利要求1。其一部分附加技术特征已被对比文件2公开(参见说明书第42-43段):服务器从用户输入的语音信息中提取语音特征向量,将提取的语音特征向量依次与找到的语音分类词库中的每个语音特征向量进行相似度(相当于置信度)比较,将相似度排名靠前的语音特征向量对应的词组或字作为识别结果;其中,具体提取几个识别结果可以依据需求进行配置;得到的一个以上识别结果依据相似度由高到低进行排序,得到识别结果序列。同时,对于本领域技术人员而言,在提供搜索结果时,考虑搜索结果的匹配程度、点击量、时效性等属性指标(相当于“初始权重值”),这是搜索领域的常规技术手段,属于公知常识。由于置信度与初始权重值均能体现结果的准确程度,为了提供准确的搜索结果,本领域技术人员能够想到综合考虑多种排序因素,同时基于语音识别的置信度与中间搜索结果的权重值进行排序,从而获取最终搜索结果,这也属于本领域的公知常识。因此,在其引用的权利要求不具备创造性的情况下,上述权利要求也不具备专利法第22条第3款规定的创造性。
2.3、权利要求3引用权利要求1。在提供搜索结果时,考虑搜索结果的匹配程度、点击量、时效性等属性指标(相当于“初始权重值”),这是搜索领域的常规技术手段,属于公知常识。因此,在其引用的权利要求不具备创造性的情况下,上述权利要求也不具备专利法第22条第3款规定的创造性。
2.4、权利要求4-6请求保护一种语音搜索装置。权利要求4-6是与方法权利要求1-3对应一致的装置权利要求。参照在前的评述,基于相似的理由,权利要求4-6不具备专利法第22条第3款规定的创造性。
3、 关于复审请求意见的评述
针对复审请求人的意见,合议组认为:
首先,对比文件2中公开了利用语音特征向量与词库中特征向量的相似度进行比较,基于相似度排序获得识别结果的方案,对于本领域技术人员而言,该相似度也直接构成了识别结果的置信度。即对比文件2中的上述操作已经包含了本申请中获取M个识别结果,和基于置信度来处理对比结果的技术思路。进一步的,对比文件2中还提到,具体提取识别结果的数量可以根据需求进行配置,此处也已经涵盖了基于上述操作所获得的搜索结果及其排序,来获得其子集(对应于本申请的P或N个结果)的技术思路。其次,本申请主要涉及数据筛选相关内容,隶属于计算机和数据处理相关领域。在计算机数据筛选和处理中,数据跳变的识别属于本领域的常用技术手段。对于本领域技术人员来说,通过识别数据跳变,作为执行判据,进行诸如无效数据剔除、终止数据采集、起始新的数据段等操作,这是数据识别领域的基础手段,在与本申请领域高度相关的语音处理中常见的应用例子就是识别根据语音采样数据的断点来进行自动断句或断词。本申请所提出的数据差异大于某预设阈值显然属于识别数据跳变的常用方法,属于本领域的常用技术手段。
因此,复审请求人陈述的理由不具有说服力。
三、决定
维持国家知识产权局于2018年05月25日对本申请作出的驳回决定。
如对本复审请求审查决定不服,根据专利法第41条第2款的规定,复审请求人可自收到本决定之日起三个月内向北京知识产权法院起诉。
郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如作者信息标记有误,请第一时间联系我们修改或删除,多谢。