词语识别方法及装置-复审决定


发明创造名称:词语识别方法及装置
外观设计名称:
决定号:187528
决定日:2019-08-20
委内编号:1F266668
优先权日:
申请(专利)号:201210551755.1
申请日:2012-11-29
复审请求人:捷讯平和(北京)科技发展有限公司
无效请求人:
授权公告日:
审定公告日:
专利权人:
主审员:刘莹莹
合议组组长:李燕东
参审员:徐琳
国际分类号:G06K9/20
外观设计分类号:
法律依据:专利法第22条第3款
决定要点
:如果一项权利要求的技术方案与最接近的现有技术相比存在多个区别技术特征,但这些区别技术特征属于本领域的惯用手段,本领域技术人员在该最接近的现有技术的基础上结合上述惯用手段获得权利要求的技术方案是显而易见的,那么该项权利要求所要求保护的技术方案相对于该最接近的现有技术和本领域惯用手段的结合而言不具有突出的实质性特点和显著的进步,因而不具备创造性。
全文:
本复审请求审查决定涉及申请号为201210551755.1,名称为“词语识别方法及装置”的发明专利申请(下称本申请)。本申请的申请人为捷讯平和(北京)科技发展有限公司,申请日为2012年11月29日,公开日为2014年06月11日。
经实质审查,国家知识产权局原审查部门于2018年08月06日以权利要求1-6不具备专利法第22条第3款规定的创造性为由驳回了本申请。驳回决定所依据的文本为:申请日2012年11月29日提交的说明书第1-45段、说明书附图图1-3、说明书摘要和摘要附图,2018年06月28日提交的权利要求第1-6项。
驳回决定引用的对比文件为:
对比文件1:CN1904906 A,公开日:2007年01月31日。
驳回决定的主要理由为:1、权利要求1与对比文件1的区别技术特征为:(1)该权利要求使用分类器识别特征;(2)该权利要求中的分离词语时使用标点符号或空格从名片图像上分离,而对比文件1分离词语时是使用关键字从地址图像上分离。(3)字符特征是该词语的梯度方向直方图。上述区别特征是本领域技术人员的常用技术手段:(1)在使用字符特征进行字符识别时,通常会使用预先训练好的分类器来进行特征判定。(2)在对比文件1公开了对地址进行识别的基础上,本领域技术人员容易想到对其他具有地址信息的对象进行识别,例如名片,此时关键字就相应的根据应用场景的不同而变为名片中的常用分割词,例如标点符号或空格。(3)梯度方向直方图是常见的字符识别时采用的特征。因此,在对比文件1的基础上结合常用技术手段得到权利要求1的技术方案,对本技术领域的技术人员来说是显而易见的,权利要求1不具备创造性。2、权利要求2-3的附加技术特征或被对比文件1公开,或是本领域的常用技术手段,因此,在引用的权利要求不具备创造性的基础上,权利要求2-3也不具备创造性。3、权利要求4-6是分别与权利要求1-3一一对应的装置权利要求,基于对权利要求1-3的评述,权利要求4-6也不具备创造性。
驳回决定所针对的权利要求书如下:
“1. 一种词语识别方法,包括:
使用标点符号或空格来从名片图像上的文本行中分离出词语;
将该词语作为一个整体,提取该词语的字符特征;
使用具有词库的分类器识别该词语的字符特征,若该字符特征与词库中的词语匹配,则输出词库中对应的该词语,其中,该字符特征是该词语的梯度方向直方图。
2. 根据权利要求1所述的方法,其中,通过估计词语的识别置信度来判断该字符特征与词库中的词语的匹配程度。
3. 根据权利要求1-2任一项所述的方法,其中,当该字符特征与词库中的所有词语都不匹配时,将该词语切分为单个字符进行识别。
4. 一种词语识别装置,包括:
词语分离单元,用于使用标点符号或空格来从名片图像上的文本行中分离出词语;
字符特征提取单元,用于将该词语作为一个整体,提取该词语的字符特征;
词语分类器单元,其具有词库,用于识别该词语的字符特征,若该字符特征与词库中的词语匹配,则输出词库中对应的该词语,其中,该字符特征是该词语的梯度方向直方图。
5. 根据权利要求4所述的装置,其中,词语分类器单元通过估计词语的识别置信度来判断该字符特征与词库中的词语的匹配程度。
6. 根据权利要求4-5任一项所述的装置,其中,还包括单字符识别单元,当该字符特征与词库中的所有词语都不匹配时,单字符识别单元将该词语切分为单个字符进行识别。”
申请人(下称复审请求人)对上述驳回决定不服,于2018年11月20日向国家知识产权局提出了复审请求,同时修改了权利要求书,其中,修改了原独立权利要求1和4,将原从属权利要求3和6的附加技术特征和说明书中的特征分别加入上述独立权利要求中,并删除了原从属权利要求3和6。
复审请求人认为:(1)对比文件1中的关键字符与权利要求1中的标点符号、空格不同,且对比文件1中的关键字符的提取需要进行字符识别,而权利要求1中不需要识别字符,也不需要理解其含义;(2)对比文件1的识别对象是手写字符地址,而权利要求1的识别对象是名片图像上的文本行;(3)本申请使用SVM分类器识别词语的字符特征,而对比文件1未公开本申请的SVM分类器;(4)本申请中,对整体的词语无法匹配时,可以将单个词进行切分来分别识别,而对比文件1不存在再次切分的问题。
复审请求时新修改的权利要求书如下:
“1. 一种词语识别方法,包括:
使用标点符号或空格来从名片图像上的文本行中分离出词语;
将该词语作为一个整体,提取该词语的字符特征;
使用具有词库的SVM分类器识别该词语的字符特征,若该字符特征与词库中的词语匹配,则输出词库中对应的该词语,其中,该字符特征是该词语的梯度方向直方图;
当该字符特征与词库中的所有词语都不匹配时,将该词语切分为单个字符进行识别。
2. 根据权利要求1所述的方法,其中,通过估计词语的识别置信度来判断该字符特征与词库中的词语的匹配程度。
3. 一种词语识别装置,包括:
词语分离单元,用于使用标点符号或空格来从名片图像上的文本行中分离出词语;
字符特征提取单元,用于将该词语作为一个整体,提取该词语的字符特征;
词语分类器单元,其具有词库,用于根据SVM算法识别该词语的字符特征,若该字符特征与词库中的词语匹配,则输出词库中对应的该词语,其中,该字符特征是该词语的梯度方向直方图;
单字符识别单元,当该字符特征与词库中的所有词语都不匹配时,单字符识别单元将该词语切分为单个字符进行识别。
4. 根据权利要求3所述的装置,其中,词语分类器单元通过估计词语的识别置信度来判断该字符特征与词库中的词语的匹配程度。”
经形式审查合格,国家知识产权局于2018年11月26日依法受理了该复审请求,并将其转送至原审查部门进行前置审查。
原审查部门在前置审查意见书中认为:(1)对比文件1中的关键字符的作用也是用于分割出词语,这与权利要求1中的标点符号、空格所起的作用相同,而由于识别对象的不同而导致了用于分割的字符不同,但由于名片图像也是常见的字符识别应用场景,因此本领域技术人员容易想到将对比文件1中的方法应用到名片上,此时,分割的字符应相应的变为名片上的常见字符。(2)名片图像已是常见的字符识别应用场景,因此本领域技术人员容易想到将对比文件1中的方法应用到名片上。(3)SVM分类器是使用特征分类的常见方式。(4)对比文件1的切分步骤在单字符识别之前,其也存在切分步骤,在将对比文件1的方法应用到名片上时,本领域技术人员容易想到再整体无法识别时,再进行词语切分。基于上述理由,坚持驳回决定。
随后,国家知识产权局成立合议组对本案进行审理。
合议组于2019年04月11日向复审请求人发出复审通知书,指出:1、权利要求1与对比文件1的区别技术特征为:(1)权利要求1中分离词语时是使用标点符号或空格从名片图像上进行分离,而对比文件1分离词语时是从地址图像上分离;(2)权利要求1中使用SVM分类器识别词语的字符特征,该字符特征是该词语的梯度方向直方图;(3)当字符特征与词库中的所有词语都不匹配时,将该词语切分为单个字符进行识别。针对区别技术特征(1),在对比文件1公开的对地址图像进行识别的基础上,本领域技术人员容易想到对其他具有地址信息的对象进行识别,例如名片,并且,对于本领域技术人员来说,利用常用的分隔符,例如标点符号或空格在文本行中分离出词语,这是本领域的惯用手段;针对区别技术特征(2),对于本领域技术人员来说,在利用字符特征,例如常见的字符特征梯度方向直方图进行字符识别时,通常会使用预先训练好的分类器,例如特征分类中常见的SVM分类器,这是本领域的惯用手段;针对区别技术特征(3),对比文件1已公开了可以利用单字符地名识别单元进行单字符地名识别,在此基础上,本领域技术人员能够获得启示,当字符特征与词库中的所有词语都不匹配时,则说明该词库中并不存在该词语,此时可以回归到通常的方法,即对单个字符进行识别,这也是本领域的惯用手段。因此,在对比文件1的基础上结合上述惯用手段,得到权利要求1的技术方案,对本技术领域的技术人员来说是显而易见的,权利要求1不具备创造性。2、权利要求2的附加技术特征是本领域的惯用手段,因此,在引用的权利要求不具备创造性的基础上,权利要求2也不具备创造性。3、权利要求3-4请求保护一种词语识别装置,其技术内容与权利要求1-2的方法相对应,基于对权利要求1-2的评述,权利要求3-4也不具备创造性。
复审请求人于2019年05月10日提交了意见陈述书和修改后的权利要求书,其中,将原从属权利要求2和4的附加技术特征和说明书中的特征分别加入独立权利要求1和3中,并删除了原从属权利要求2和4。针对复审通知书指出的审查意见,复审请求人认为:(1)本申请中分类器中的词库可以增加字符特征以及其对应的词语,通过在分类器中添加字符特征来提高该分类器的识别准确度。而在对比文件1中,关键字符字典中的关键字符的特征向量并不能随着识别过程的进行对其中的关键字符和特征向量进行增加。(2)对比文件1是通过计算距离来判断匹配程度,而本申请中是直接通过识别置信度(概率)来进行识别,相应的本申请具有更高的识别准确率。
答复复审通知书时新修改的权利要求如下:
“1. 一种词语识别方法,包括:
使用标点符号或空格来从名片图像上的文本行中分离出词语;
将该词语作为一个整体,提取该词语的字符特征;
使用具有词库的SVM分类器识别该词语的字符特征,若该字符特征与词库中的词语匹配,则输出词库中对应的该词语,其中,该字符特征是该词语的梯度方向直方图,通过估计词语的识别置信度来判断该字符特征与词库中的词语的匹配程度;
当该字符特征与词库中的所有词语都不匹配时,将该词语切分为单个字符进行识别;
于所述词库中增加字符特征以及其对应的词语。
2. 一种词语识别装置,包括:
词语分离单元,用于使用标点符号或空格来从名片图像上的文本行中分离出词语;
字符特征提取单元,用于将该词语作为一个整体,提取该词语的字符特征;
词语分类器单元,其具有词库,用于根据SVM算法识别该词语的字符特征,若该字符特征与词库中的词语匹配,则输出词库中对应的该词语,并且能够于所述词库中增加字符特征以及其对应的词语其中,该字符特征是该词语的梯度方向直方图,通过估计词语的识别置信度来判断该字符特征与词库中的词语的匹配程度;
单字符识别单元,当该字符特征与词库中的所有词语都不匹配时,单字符识别单元将该词语切分为单个字符进行识别。”
在上述程序的基础上,合议组认为本案事实已经清楚,可以作出审查决定。
二、决定的理由
1、审查文本的认定
复审请求人于2019年05月10日提交了权利要求书的修改替换页,经审查,所作修改符合专利法第33条和专利法实施细则第61条第1款的规定。本复审请求审查决定所针对的文本为:申请日2012年11月29日提交的说明书第1-45段、说明书附图图1-3、说明书摘要和摘要附图,2019年05月10日提交的权利要求第1-2项。
2、专利法第22条第3款
专利法第22条第3款规定:创造性,是指与现有技术相比,该发明具有突出的实质性特点和显著的进步,该实用新型具有实质性特点和进步。
如果一项权利要求的技术方案与最接近的现有技术相比存在多个区别技术特征,但这些区别技术特征属于本领域的惯用手段,本领域技术人员在该最接近的现有技术的基础上结合上述惯用手段获得权利要求的技术方案是显而易见的,那么该项权利要求所要求保护的技术方案相对于该最接近的现有技术和本领域惯用手段的结合而言不具有突出的实质性特点和显著的进步,因而不具备创造性。
本复审请求审查决定引用了驳回决定以及复审通知书中引用的对比文件1作为最接近的现有技术:
对比文件1:CN1904906 A,公开日:2007年01月31日。
2.1权利要求1不具备专利法第22条第3款规定的创造性。
权利要求1请求保护一种词语识别方法,对比文件1公开了一种地址识别方法,并具体公开了以下技术特征(参见说明书第40-42段、图1-14):
当输入了要进行识别的地址图像时,首先由单字符区域检测单元1将其分割成多个单字符区域。单字符区域被分割出之后,各个单字符区域都将被关键字提取单元2识别,并提取出关键字符。提取关键字符之后,关键字符所限定的区域(相当于词语)将被地名区域提取单元3从输入图像中分割出来(相当于从图像上的文本行中分离出词语),然后整体地名识别单元4将该关键字符限定区域的特征向量(相当于将该词语作为一个整体,提取该词语的字符特征)与地名词典(相当于词库)里的地名的特征向量相匹配,得出匹配距离小于规定阈值的地名候选的地名候选队列(相当于若该字符特征与词库中的词语匹配,则输出词库中对应的该词语)。
权利要求1与对比文件1相比,其区别技术特征在于:(1)权利要求1中分离词语时是使用标点符号或空格从名片图像上进行分离,而对比文件1分离词语时是从地址图像上分离;(2)权利要求1中使用SVM分类器识别词语的字符特征,该字符特征是该词语的梯度方向直方图,通过估计词语的识别置信度来判断该字符特征与词库中的词语的匹配程度;(3)当字符特征与词库中的所有词语都不匹配时,将该词语切分为单个字符进行识别,于所述词库中增加字符特征以及其对应的词语。基于上述区别技术特征,可以确定权利要求1实际所要解决的技术问题是如何分离词语、如何识别字符特征、如何判断字符特征与词库的匹配程度以及提供一种具体的字符特征。
针对区别技术特征(1),在对比文件1公开的对地址图像进行识别的基础上,本领域技术人员容易想到对其他具有地址信息的对象进行识别,例如名片,并且,对于本领域技术人员来说,利用常用的分隔符,例如标点符号或空格在文本行中分离出词语,这是本领域的惯用手段;
针对区别技术特征(2),对于本领域技术人员来说,在利用字符特征,例如常见的字符特征梯度方向直方图进行字符识别时,通常会使用预先训练好的分类器,例如特征分类中常见的SVM分类器,以及利用词语的识别置信度来判断字符特征与词库中的词语的匹配程度,这是本领域的惯用手段;
针对区别技术特征(3),对比文件1已公开了可以利用单字符地名识别单元进行单字符地名识别(参见对比文件1的说明书第40-42、97-102段),在此基础上,本领域技术人员能够获得启示,当字符特征与词库中的所有词语都不匹配时,则说明该词库中并不存在该词语,此时可以回归到通常的方法,即对单个字符进行识别,这是本领域的惯用手段。并且,为了增加分类器能够识别的词语,在词库中增加字符特征和其对应的词语以进行扩充更新,这也是本领域的惯用手段。
因此,在对比文件1的基础上结合上述公知常识以获得该权利要求所要求保护的技术方案,对所属技术领域的技术人员来说是显而易见的,该权利要求所要求保护的技术方案不具备突出的实质性特点和显著的进步,不具备专利法第22条第3款规定的创造性。
2.2权利要求2不具备专利法第22条第3款规定的创造性。
权利要求2请求保护一种词语识别装置,其技术内容与权利要求1的方法相对应,基于对权利要求1的评述,权利要求2也不具备专利法第22条第3款规定的创造性。
3、对复审请求人相关意见的评述
对于复审请求人的意见,合议组认为:(1)虽然对比文件1并未公开上述特征,但是对于本领域技术人员来说,为了增加分类器能够识别的词语,在词库中增加字符特征和其对应的词语以进行扩充更新,这是本领域的惯用手段。(2)置信度大小是衡量匹配结果正确性最常用的依据之一,因此,对于本领域技术人员来说,利用词语的识别置信度来判断字符特征与词库中的词语的匹配程度,这也是本领域的惯用手段。综上,对于复审请求人的意见,合议组不予支持。
三、决定
维持国家知识产权局于2018年08月06日对本申请作出的驳回决定。
如对本复审请求审查决定不服,根据专利法第41条第2款的规定,复审请求人可以自收到本决定之日起三个月内向北京知识产权法院起诉。


郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如作者信息标记有误,请第一时间联系我们修改或删除,多谢。

留言与评论(共有 0 条评论)
   
验证码: