图像文档自动排序方法及装置-复审决定


发明创造名称:图像文档自动排序方法及装置
外观设计名称:
决定号:187330
决定日:2019-08-16
委内编号:1F255126
优先权日:
申请(专利)号:201410773460.8
申请日:2014-12-16
复审请求人:上海合合信息科技发展有限公司
无效请求人:
授权公告日:
审定公告日:
专利权人:
主审员:王雪莲
合议组组长:高海燕
参审员:王艳坤
国际分类号:G06F17/30
外观设计分类号:
法律依据:专利法第22条第3款
决定要点
:如果一项权利要求所要求保护的技术方案与作为最接近的现有技术的对比文件相比存在区别技术特征,但是上述区别技术特征属于本领域的公知常识,或者在现有技术中的其它对比文件中公开,即现有技术中给出了将上述区别技术特征应用到作为最接近的现有技术的该对比文件以解决其存在的技术问题的启示,从而使得本领域技术人员在现有技术的基础上得到该项权利要求的技术方案是显而易见的,那么该项权利要求所要求保护的技术方案不具备创造性。
全文:
本复审请求涉及申请号为201410773460.8,名称为“图像文档自动排序方法及装置”的发明专利申请(下称本申请)。本申请的申请人为上海合合信息科技发展有限公司,申请日为2014年12月16日,公开日为2015年04月01日。
经实质审查,国家知识产权局原审查部门于2018年03月19日发出驳回决定,以权利要求1、8不符合专利法第22条第2款规定的新颖性,权利要求2-7、9-25不符合专利法第22条第3款规定的创造性为由驳回了本申请。驳回决定所依据的文本为申请日2014年12月16日提交的权利要求第1-25项、说明书第1-43段、说明书附图图1-6、摘要、摘要附图。驳回决定所针对的权利要求书如下:
“1. 一种图像文档自动排序方法,其特征在于,包括以下步骤:
步骤一,获取多个图像文档;
步骤二,分别对每个所述图像文档中的图像进行文字识别并得到识别结果,提取所述识别结果中的关键字段字符,并与该关键字段字符所在的图像文档相对应;
步骤三,根据所述关键字段字符作为排序依据,对各关键字段字符所对应的图像文档进行排序。
2. 根据权利要求1所述的图像文档自动排序方法,其特征在于,所述步骤一中,获取多个图像文档的方式为选择已有的图像文档,或者是以拍摄方式获取新的图像文档。
3. 根据权利要求1所述的图像文档自动排序方法,其特征在于,所述步骤二中,由用户在图像文档的图像中指定某区域,之后对所述图像进行图像处理以选择用户指定的区域,然后对所选择的区域的图像进行文字识别。
4. 根据权利要求1所述的图像文档自动排序方法,其特征在于,所述步骤二中,还包括对图像文档中的图像以切边、旋转、拉伸以及图像增强中至少一种方式进行图像处理的步骤,之后对进行过图像处理的图像进行文字识别。
5. 根据权利要求1、3或4所述的图像文档自动排序方法,其特征在于,所述关键字段字符为以下四种情况中的至少一种:
所述关键字段字符位于图像文档中图像上的特定位置或者位于进行图像处理后得到的图像上的特定位置;
所述关键字段字符包含有特定的关键字或者所述关键字段字符所在的字段包含有特定的关键字;
所述关键字段字符符合特定的格式或者所述关键字段字符所在的字段符合特定的格式;
所述关键字段字符为用户在所述识别结果中选择的字符。
6. 根据权利要求1所述的图像文档自动排序方法,其特征在于,所述步骤三中,包括对所述图像文档进行标记的步骤,标记的顺序与图像文档的排序顺序一致。
7. 根据权利要求6所述的图像文档自动排序方法,其特征在于,所述标记内容包括所述关键字段字符。
8. 一种如权利要求1-7任意一项所述的图像文档自动排序方法所采用的图像文档自动排序装置,其特征在于,基于计算机系统,包括:
图像文档获取部件,用来获取多个图像文档;
图像文字识别部件,用来分别对每个所述图像文档中的图像进行文字识别并得到识别结果;
关键字段字符提取部件,用来提取所述识别结果中的关键字段字符,并与该关键字段字符所在的图像文档相对应;
排序部件,用来根据所述关键字段字符作为排序依据,对各关键字段字符所对应的图像文档进行排序。
9. 根据权利要求8所述的图像文档自动排序装置,其特征在于,还包括图像指定部件,由用户在图像文档的图像中指定某区域,之后由所述对所述图像进行图像处理以选择用户指定的区域,然后由所述图像文字识别部件对所选择的区域的图像进行文字识别。
10. 根据权利要求8所述的图像文档自动排序装置,其特征在于,还包括图像处理部件,用来对图像文档中的图像以切边、旋转、拉伸以及图像增强中至少一种方式进行图像处理,之后由所述图像文字识别部件对进行过图像处理的图像进行文字识别。
11. 根据权利要求8所述的图像文档自动排序装置,其特征在于,所述关键字段字符提取部件中还包括关键字段字符选择部件,将用户在所述识别结果中选择的字符作为关键字段字符。
12. 根据权利要求8所述的图像文档自动排序装置,其特征在于,还包括图像文档标记部件,对所述图像文档进行标记,标记的顺序与图像文档的排序顺序一致。
13. 一种图像文档自动排序方法,其特征在于,包括存储有多个第一图像文档,所述多个第一图像文档按照其各自的第一关键字段字符的顺序排序,所述图像文档自动排序的方法还包括以下步骤:
步骤一,获取至少一个第二图像文档;
步骤二,分别对每个所述第二图像文档中的图像进行文字识别并得到识别结果,提取所述识别结果中的第二关键字段字符,并与该第二关键字段字符所在的第二图像文档相对应;
步骤三,将所述第二关键字段字符与所述第一关键字段字符相比较,根据所述第一关键字段字符和第二关键字段字符作为排序依据,将所述第二关键字段字符所对应的第二图像文档插入到所述第一图像文档排序中的相应位置,完成图像文档自动排序。
14. 根据权利要求13所述的图像文档自动排序方法,其特征在于,所述步骤一中,获取至少一个第二图像文档的方式为选择已有的图像文档,或者是以拍摄方式获取新的图像文档。
15. 根据权利要求13所述的图像文档自动排序方法,其特征在于,所述步骤二中,由用户在第二图像文档的图像中指定某区域,之后对所述图像进行图像处理以选择用户指定的区域,然后对所选择的区域的图像进行文字识别。
16. 根据权利要求13所述的图像文档自动排序方法,其特征在于,所述步骤二中,还包括对所述第二图像文档中的图像以切边、旋转、拉伸以及图像增强中至少一种方式进行图像处理的步骤,之后对进行过图像处理的图像进行文字识别。
17. 根据权利要求13、 15或16所述的图像文档自动排序方法,其特征在于,所述关键字段字符为以下四种情况中的至少一种:
所述关键字段字符位于第二图像文档中图像上的特定位置或者位于进行图像处理后得到的图像上的特定位置;
所述关键字段字符包含有特定的关键字或者所述关键字段字符所在的字段包含有特定的关键字;
所述关键字段字符符合特定的格式或者所述关键字段字符所在的字段符合特定的格式;
所述关键字段字符为用户在所述识别结果中选择的字符。
18. 根据权利要求13所述的图像文档自动排序方法,其特征在于,所述多个第一图像文档分别有用来表示其顺序的标记,所述步骤三中,包括对所述第二图像文档进行标记的步骤,标记的顺序与第一图像文档和第二图像文档的排序顺序一致。
19. 根据权利要求18所述的图像文档自动排序方法,其特征在于,所述标记内容包括所述关键字段字符。
20. 根据权利要求13所述的图像文档自动排序方法,其特征在于,所述步骤三之前还包括以下步骤:分别对每个所述第一图像文档中的图像进行文字识别并得到识别结果,提取所述识别结果中的第一关键字段字符,并与该第一关键字段字符所在的第一图像文档相对应。
21. 一种如权利要求13-20任意一项所述的图像文档自动排序方法所采用的图像文档自动排序装置,其特征在于,基于计算机系统,包括:
第一图像文档部件,存储有多个第一图像文档,所述多个第一图像文档按照其各自的第一关键字段字符的顺序排序;
第二图像文档获取部件,用来获取至少一个第二图像文档;
第二图像文字识别部件,用来分别对每个所述第二图像文档中的图像进行文字识别并得到识别结果;
第二关键字段字符提取部件,用来提取所述识别结果中的第二关键字段字符,并与该第二关键字段字符所在的第二图像文档相对应;
排序添加部件,用来将所述第二关键字段字符与所述第一关键字段字符相比较,根据所述第一关键字段字符和第二关键字段字符作为排序依据,将所述第二关键字段字符所对应的第二图像文档插入到所述第一图像文档排序中的相应位置。
22. 根据权利要求21所述的图像文档自动排序装置,其特征在于,还包括第二图像指定部件,由用户在第二图像文档的图像中指定某区域,之后由所述对所述第二图像进行图像处理以选择用户指定的区域,然后由所述第二图像文字识别部件对所选择的区域的图像进行文字识别。
23. 根据权利要求21所述的图像文档自动排序装置,其特征在于,还包括第二图像处理部件,用来对第二图像文档中的图像以切边、旋转、拉伸以及图像增强中至少一种方式进行图像处理,之后由所述第二图像文字识别部件对进行过图像处理的图像进行文字识别。
24. 根据权利要求21所述的图像文档自动排序装置,其特征在于,所述第二关键字段字符提取部件中还包括第二关键字段字符选择部件,将用户在所述识别结果中选择的字符作为第二关键字段字符。
25. 根据权利要求21所述的图像文档自动排序装置,其特征在于,所述第一图像文档部件中存储的第一图像文档分别有用来表示其顺序的标记,所述图像文档自动排序装置还包括第二图像文档标记部件,对所述第二图像文档进行标记,标记的顺序与第一图像文档和第二图像文档的排序顺序一致。”
驳回决定中引用下列对比文件:
对比文件1:CN102938061A,公开日为2013年02月20日;
对比文件2:CN101162471A,公开日为2008年04月16日。
驳回决定的主要理由是:
对比文件1公开了一种方便电子化的专业笔记本及其页码自动识别方法,已经公开了权利要求1的全部技术特征,权利要求1要求保护的技术方案与对比文件1所公开的技术方案实质上相同,且两者适用于相同的文档排序技术领域,都解决了相同的通过图像识别文档中关键字来对文档进行自动排序的技术问题,并具有相同的自动排序、方便用户使用的预期效果,因此权利要求1所要求保护的技术方案不具备专利法第22条第2款规定的新颖性。从属权利要求2-6引用权利要求1,其各自的部分或全部附加技术特征分别构成与权利要求1的区别技术特征。基于上述区别,权利要求2-6实际解决的技术问题分别是:如何获得图像文档,如何获得文字识别区域,如何对图像进行处理,如何确定关键字段字符,如何对图像文档进行标记。上述区别技术特征均属于本领域的公知常识。因此,在对比文件1的基础上结合本领域公知常识得出权利要求2-6要求保护的技术方案,对本领域的技术人员来说是显而易见的,因此权利要求2-6不具备专利法第22条第3款规定的创造性。从属权利要求7的附加技术特征是本领域的公知常识。因此权利要求7也不具备专利法第22条第3款规定的创造性。
权利要求8请求保护一种如权利要求1-7任意一项所述的图像文档自动排序方法所采用的图像文档自动排序装置,其是与权利要求1完全对应的产品权利要求,基于对权利要求1相同的评述理由,权利要求8也不具备专利法第22条第2款规定的新颖性。权利要求9、10、12均是权利要求8的从属权利要求,其附加的技术特征分别与权利要求3、4、6的附加技术特征对应相同,基于相同的证据和理由,权利要求9、10、12也不具备专利法第22条第3款规定的创造性。
权利要求11是权利要求8的从属权利要求,其附加技术特征是本领域技术人员的惯用手段。因此,在对比文件1的基础上结合本领域公知常识得出权利要求11要求保护的技术方案,对本领域的技术人员来说是显而易见的,因此权利要求11不具备专利法第22条第3款规定的创造性。
权利要求13与对比文件1的区别技术特征在于:获取至少一个第二图像文档;分别对每个所述第二图像文档中的图像进行文字识别并得到识别结果,提取所述识别结果中的第二关键字段字符,并与该第二关键字段字符所在的第二图像文档相对应;将所述第二关键字段字符与所述第一关键字段字符相比较,根据所述第一关键字段字符和第二关键字段字符作为排序依据,将所述第二关键字段字符所对应的第二图像文档插入到所述第一图像文档排序中的相应位置,完成图像文档自动排序。基于上述区别,权利要求13相对于对比文件1实际要解决的技术问题是如何在已排好序的图像文档中按既定顺序插入新的文档。对比文件2公开了一种插入排序的方法,其公开的特征在对比文件2中所起的作用与在本申请中所起作用相同,都是根据关键字比较来将新的数据插入原有已排好顺序的数据中,即对比文件2给出了将该技术特征应用于对比文件1以进一步解决其技术问题的启示。因此,在对比文件1的基础上结合对比文件2以获得权利要求13所要求保护的技术方案,对所属技术领域的技术人员来说是显而易见的,因此权利要求13不具备专利法第22条第3款规定的创造性。
从属权利要求14-20的附加技术特征,或者在对比文件1中公开,或者属于本领域的公知常识。因此,也不具备专利法第22条第3款规定的创造性。
权利要求21、22、23、25均是与权利要求13、15、16、18相对应的装置权利要求,从属权利要求24的附加技术特征是本领域技术人员的惯用手段。因此,基于相同的证据和理由,权利要求21-25也不具备专利法第22条第3款规定的创造性。
申请人(下称复审请求人)对上述驳回决定不服,于2018年07月02日向复审委员会提出了复审请求,未修改权利要求书。复审请求人认为:(1)本申请中识别范围是图像文档中的图像,对比文件1中识别范围是页码标注区域,页码标注区域只是纸质页面图像中的一块特定区域;(2)本申请直接对图像文档中的图像进行文字识别,对图像文档并无特殊要求,对比文件1中要求预先在纸质页面上印刷有页码标注区域,先根据纸质页面图像确定纸质页面类型、再获得页码标注区域在纸质页面中的位置、再识别页面标注区域中的页码;(3)本申请中进行的是文字识别,对比文件1中进行的是页码识别;(4)本申请在文字识别后对识别结果(即文字)进行了再处理(提取关键字段字符),然后将在处理结果(即关键字段字符)应用到图像文件中,对比文件1在页码识别后缺少对识别结果(即页码)再处理的记载,只是直接将识别结果(即页码)加入到电子化文档中;(5)本申请说明书给出了两种不同类型的关键字段字符,因此可以根据多个排序依据对图像文档进行多种排序,对比文件1只能以页码识别的直接结果进行排序,不存在其他排序依据。
经形式审查合格,专利复审委员会于2018年07月06日依法受理了该复审请求,并将其转送至原审查部门进行前置审查。
原审查部门在前置审查意见书中认为:(1)对比文件1拍摄的是整张纸质页面图像,然后再在页面图像中识别出页码,页码只是位于图像中某一个位置,本申请中要识别的文字也是位于图像中某一个位置,其次,就识别范围而言,不论范围大小,都是对图像中的字符进行识别,其识别方法是相同的,根据本申请的记载,其对图像进行文字识别时,也需要指定识别区域;(2)对比文件1中印刷有页码标注区域,只是为了便于图像识别,并根据页码进行排序,就好比本申请的图像中得有编号、日期等可以进行排序的字符,对比文件1事先标定了页码区域相当于指定了识别区域,正如本申请也需要指定识别区域一样;(3)关于识别对象,百度百科对“文字”的解释是:文字和语言等其他工具一样,都是交流信息的工具,如汉字、拉丁字母等都可以称为文字;同理页码也属于一种文字,既然都是文字,那这里识别的对象也是相同的;(4)虽然对比文件1没有像本申请一样记载:先识别文字,再提取关键字段字符,再将关键字段字符作为排序依据,对比文件1只是直接识别页码,将页面作为排序依据,但是其直接效果是一样的,因为对比文件1只需要使用页码作为排序依据,因此对比文件1直接识别出页码这个关键字段字符,如果还需要其他的排序依据,同样可以识别其他的关键字段字符;(5)本申请权利要求1中并未记载有多种排序依据,不能将说明书的内容作为权利要求的内容来限定本申请权利要求的保护范围,即使申请人将其他多种排序依据加入到权利要求中,也不具有创造性,因为排序依据只是表现形式的不同,其都是从图形识别得到的文字,实质上是相同的,不能认为使用日期排序相对于使用页码排序就具有创造性。因而坚持原驳回决定。
随后,专利复审委员会成立合议组对本案进行审理。
合议组于2018年12月29日向复审请求人发出复审通知书,指出:对比文件1公开了一种方便电子化的专业笔记本及其页码自动识别方法,已经公开了权利要求1的全部技术特征,权利要求1要求保护的技术方案与对比文件1所公开的技术方案实质上相同,且两者适用于相同的文档排序技术领域,都解决了相同的通过图像识别文档中关键字来对文档进行自动排序的技术问题,并具有相同的自动排序、方便用户使用的预期效果,因此权利要求1所要求保护的技术方案不具备专利法第22条第2款规定的新颖性。
权利要求2引用权利要求1,其中包括方案1)获取多个图像文档的方式为选择已有的图像文档;方案2)以拍摄方式获取新的图像文档。权利要求3引用权利要求1。从属权利要求2中方案2)以及从属权利要求3的附加技术特征均已被对比文件1公开,因此权利要求2、3也不具备专利法第22条第2款规定的新颖性。对于权利要求2中的方案1),从属权利要求4、6,其部分或全部附加技术特征构成与对比文件1之间的区别。基于上述区别,权利要求2、4、6实际解决的问题分别是如何获取图像文档,如何对图像进行处理,如何对图像文档进行标记。上述区别均是本领域的公知常识。因此,在对比文件1的基础上结合本领域的公知常识从而获得上述权利要求是显而易见的,上述权利要求不具备专利法第22条第3款规定的创造性。
权利要求5引用权利要求1、3或4。其附加技术特征已在对比文件1中公开。因此,在其引用的权利要求不具备新颖性时,权利要求5也不具备专利法第22条第3款规定的新颖性;在其引用的权利要求不具备创造性时,权利要求5也不具备专利法第22条第3款规定的创造性。从属权利要求7的附加技术特征是本领域的公知常识。因此权利要求7也不具备专利法第22条第3款规定的创造性。
权利要求8请求保护一种如权利要求1-7任意一项所述的图像文档自动排序方法所采用的图像文档自动排序装置,其限定特征与权利要求1中的特征相对应,从属权利要求9-12的附加技术特征与从属权利要求3-6相对应。基于相同的证据和理由,在其引用的权利要求不具备新颖性时,上述权利要求也不具备专利法第22条第3款规定的新颖性;在其引用的权利要求不具备创造性时,上述权利要求也不具备专利法第22条第3款规定的创造性。
权利要求13与对比文件1的区别在于:获取至少一个第二图像文档;分别对每个所述第二图像文档中的图像进行文字识别并得到识别结果,提取所述识别结果中的第二关键字段字符,并与该第二关键字段字符所在的第二图像文档相对应;将所述第二关键字段字符与所述第一关键字段字符相比较,根据所述第一关键字段字符和第二关键字段字符作为排序依据,将所述第二关键字段字符所对应的第二图像文档插入到所述第一图像文档排序中的相应位置,完成图像文档自动排序。基于上述区别,权利要求13实际解决的技术问题是如何在已排好序的图像文档中按既定顺序插入新的文档。对比文件2给出了可根据关键字比较来将新的数据插入原有已排好顺序的数据序列中形成新的排序序列的技术启示。因此,在对比文件1的基础上结合对比文件2以获得权利要求13所要求保护的技术方案是显而易见的,因此权利要求13不具备专利法第22条第3款规定的创造性。从属权利要求14-20的附加技术特征分别与权利要求1-7的技术特征相对应,因此,也不具备专利法第22条第3款规定的创造性。
权利要求21请求保护一种如权利要求13-20任意一项所述的图像文档自动排序方法所采用的图像文档自动排序装置,其是与权利要求13完全对应的产品权利要求,从属权利要求22-25的附加技术特征与权利要求3-6的技术特征相对应,基于相同证据和理由,权利要求21-25也不具专利法第22条第3款规定的创造性。
复审请求人于2019 年01月28日提交了意见陈述书,并修改了权利要求1、8、13、21,其中在权利要求1、8中增加了技术特征“根据是否包含关键字或者是否符合特定格式来”、“并将排序后的图像文档的文件名改为所述关键字段字符”;在权利要求13、21中增加技术特征“根据是否包含关键字或者是否符合特定格式来”、“并将排序后的第一图像文档和第二图像文档的文件名改为所述第一关键字段字符和第二关键字段字符”。复审请求人认为:(1)对比文件1仅记载了识别纸质页面图像的页码标注区域中的页码内容,未记载对所识别的页码内容再进行提取,自然也没有记载提取的判定条件,即对比文件1没有公开根据是否包含关键字或者是否符合特定格式来提取所述识别结果中的关键字段字符的特征;也没有公开将排序后的图像文档的文件名改为关键字段字符的特征。(2)对比文件1需要在纸质页面上印刷页面标注区域,需要确定纸质页面的类型,仅根据页码内容对电子化文档排序,而本申请对纸质页面没有要求,不需要指定文字识别区域,无需确定纸质页面的类型,还对排序后的图像文档以关键字段字符重命名。
复审请求人在答复复审通知书时,修改后的权利要求1、8、13、21如下:
“1. 一种图像文档自动排序方法,其特征在于,包括以下步骤:
步骤一,获取多个图像文档;
步骤二,分别对每个所述图像文档中的图像进行文字识别并得到识别结果,根据是否包含关键字或者是否符合特定格式来提取所述识别结果中的关键字段字符,并与该关键字段字符所在的图像文档相对应;
步骤三,根据所述关键字段字符作为排序依据,对各关键字段字符所对应的图像文档进行排序,并将排序后的图像文档的文件名改为所述关键字段字符。”
“8. 一种如权利要求1-7任意一项所述的图像文档自动排序方法所采用的图像文档自动排序装置,其特征在于,基于计算机系统,包括:
图像文档获取部件,用来获取多个图像文档;
图像文字识别部件,用来分别对每个所述图像文档中的图像进行文字识别并得到识别结果;
关键字段字符提取部件,用来根据是否包含关键字或者是否符合特定格式来提取所述识别结果中的关键字段字符,并与该关键字段字符所在的图像文档相对应;
排序部件,用来根据所述关键字段字符作为排序依据,对各关键字段字符所对应的图像文档进行排序,并将排序后的图像文档的文件名改为所述关键字段字符。”
“13. 一种图像文档自动排序方法,其特征在于,包括存储有多个第一图像文档,所述多个第一图像文档按照其各自的第一关键字段字符的顺序排序,所述图像文档自动排序的方法还包括以下步骤:
步骤一,获取至少一个第二图像文档;
步骤二,分别对每个所述第二图像文档中的图像进行文字识别并得到识别结果,根据是否包含关键字或者是否符合特定格式来提取所述识别结果中的第二关键字段字符,并与该第二关键字段字符所在的第二图像文档相对应;
步骤三,将所述第二关键字段字符与所述第一关键字段字符相比较,根据所述第一关键字段字符和第二关键字段字符作为排序依据,将所述第二关键字段字符所对应的第二图像文档插入到所述第一图像文档排序中的相应位置,完成图像文档自动排序,并将排序后的第一图像文档和第二图像文档的文件名改为所述第一关键字段字符和第二关键字段字符。”
“21. 一种如权利要求13-20任意一项所述的图像文档自动排序方法所采用的图像文档自动排序装置,其特征在于,基于计算机系统,包括:
第一图像文档部件,存储有多个第一图像文档,所述多个第一图像文档按照其各自的第一关键字段字符的顺序排序;
第二图像文档获取部件,用来获取至少一个第二图像文档;
第二图像文字识别部件,用来分别对每个所述第二图像文档中的图像进行文字识别并得到识别结果;
第二关键字段字符提取部件,用来根据是否包含关键字或者是否符合特定格式来提取所述识别结果中的第二关键字段字符,并与该第二关键字段字符所在的第二图像文档相对应;
排序添加部件,用来将所述第二关键字段字符与所述第一关键字段字符相比较,根据所述第一关键字段字符和第二关键字段字符作为排序依据,将所述第二关键字段字符所对应的第二图像文档插入到所述第一图像文档排序中的相应位置,并将排序后的第一图像文档和第二图像文档的文件名改为所述第一关键字段字符和第二关键字段字符。”
合议组于2019年03月08日发出合议组成员变更通知书,告知复审请求人本案合议组成员变更为会议组组长高海燕、主审员王雪莲、参审员王艳坤。复审请求人逾期未答复,视为无回避请求。
合议组于2019年03月29日再次向复审请求人发出复审通知书,指出: 权利要求1与对比文件1相比,区别在于:1)根据是否符合特定格式来提取所述识别结果中的关键字段字符;2)将排序后的图像文档的文件名改为所述关键字段字符。基于上述区别,权利要求1实际解决的问题是:如何从图像识别结果中提取内容,以及如何对排序后的图像文档进行命名。上述区别1)、2)均是属于本领域的公知常识。因此,在对比文件1的基础上结合本领域的公知常识以获得权利要求1的技术方案是显而易见的,不具备专利法第22条第3款规定的创造性。从属权利要求2-7的附加技术特征,或者在对比文件1中公开,或者属于本领域的公知常识,因此,也不具备专利法第22条第3款规定的创造性。
权利要求8请求保护一种如权利要求1-7任意一项所述的图像文档自动排序方法所采用的图像文档自动排序装置,其技术特征与权利要求1中的特征相对应,从属权利要求9-12的附加技术特征与从属权利要求3-6中的全部或部分附加技术特征相对应。基于相同的证据和理由,权利要求8-12也不具备专利法第22条第3款规定的创造性。权利要求13与对比文件1的区别技术特征在于:获取至少一个第二图像文档;分别对每个所述第二图像文档中的图像进行文字识别并得到识别结果,根据是否包含关键字或者是否符合特定格式来提取所述识别结果中的第二关键字段字符,并与该第二关键字段字符所在的第二图像文档相对应;将所述第二关键字段字符与所述第一关键字段字符相比较,根据所述第一关键字段字符和第二关键字段字符作为排序依据,将所述第二关键字段字符所对应的第二图像文档插入到所述第一图像文档排序中的相应位置,完成图像文档自动排序,并将排序后的第一图像文档和第二图像文档的文件名改为所述第一关键字段字符和第二关键字段字符。基于上述区别技术特征,权利要求13实际解决的技术问题是如何在已排好序的图像文档中按既定顺序插入新的文档。对比文件2给出了可根据关键字比较来将新的数据插入原有已排好顺序的数据序列中形成新的排序序列的技术启示。其它区别技术特征属于本领域的公知常识。因此,在对比文件1的基础上结合对比文件2和本领域的公知常识以获得权利要求13所要求保护的技术方案是显而易见的,因此不具备专利法第22条第3款规定的创造性。从属权利要求14-20的附加技术特征分别与权利要求1-7的技术特征相对应,因此,也不具备专利法第22条第3款规定的创造性。
权利要求21请求保护一种如权利要求13-20任意一项所述的图像文档自动排序方法所采用的图像文档自动排序装置,其是与权利要求13完全对应的产品权利要求,从属权利要求22-25的附加技术特征与权利要求3-6的附加技术特征相对应,基于相同证据和理由,权利要求21-25也不具备专利法第22条第3款规定的创造性。
复审请求人于2019 年05月13日提交了意见陈述书,并未修改申请文件。复审请求人认为:权利要求1与对比文件1相比,区别在于:本申请记载了在文字识别结果中提取关键字段字符,对比文件1未记载对文字识别结果进行提取的内容;本申请将排序后的图像文档的文件名改为所述关键字段字符。对比文件1仅记载了将页码内容加入到纸质页面的电子化文档中,未记载修改电子化文档的文档名。“文字识别”是指从图像中识别出字符,本申请所记载的“提取”是指图像文档的文字识别结果包含较多内容,其中仅有部分内容与图像文档排序有关,因此需要从文字识别结果的较多内容中根据是否包含关键字、是否符合特定格式等提取出与排序有关的部分内容。对比文件1仅记载了识别纸质页面图像的页码标注区域中的页码内容,其文字识别结果仅为页码,不包含任何其他内容。对比文件1并没有从文字识别结果中再根据任何条件进行提取操作,而只是使用了文字识别结果(即页码)。权利要求1所实际解决的技术问题是:提供一种图像文档自动排序方法,对纸件或图像文档没有特殊要求(无需在文档中指定特殊区域),可使用户根据文件名快速准确地找到图像文档。对比文件1解决的是类似的技术问题,但与本申请的权利要求1采用了不同的技术方案。对比文件1需要在纸质页面上印刷页面标注区域,本申请对纸质页面没有任何要求,也不需要在图像文档中指定文字识别的区域。对比文件1需要确定纸质页面的类型,确定手段包括预先已知纸质页面的类型、或者创建纸质页面的类型,本申请无需确定纸质页面的类型。对比文件1只是在电子化文档中加入页码内容,并据此对电子化文档排序。本申请不仅以提取的关键字段字符作为图像文档的排序依据,还对排序后的图像文档以关键字段字符重命名,进一步便于用户根据文件名查找和管理图像文档。因此,权利要求1-25具备创造性。
在上述程序的基础上,合议组认为本案事实已经清楚,可以作出审查决定。
二、决定的理由
审查文本的认定
复审请求人在2019年05月13日答复复审通知书时,仅陈述了意见,并未修改申请文件。因此,本复审决定所针对的文本如下,即:申请日2014年12月16日提交的说明书第1-43段、说明书附图图1-6、说明书摘要、摘要附图;2019年01月28日提交的权利要求第1-25项。
关于专利法第22条第3款
专利法第22条第3款规定:“创造性,是指与现有技术相比,该发明具有突出的实质性特点和显著的进步,该实用新型具有实质性特点和进步”。
如果一项权利要求所要求保护的技术方案与作为最接近的现有技术的对比文件相比存在区别技术特征,但是上述区别技术特征属于本领域的公知常识,或者在现有技术中的其它对比文件中公开,即现有技术中给出了将上述区别技术特征应用到作为最接近的现有技术的该对比文件以解决其存在的技术问题的启示,从而使得本领域技术人员在现有技术的基础上得到该项权利要求的技术方案是显而易见的,那么该项权利要求所要求保护的技术方案不具备创造性。
本复审决定引用了驳回决定和复审通知书中引用的以下对比文件作为现有技术,即:
对比文件1:CN 102938061A,公开日为2013年02月20日;
对比文件2:CN 101162471A,公开日为2008年04月16日。
其中,对比文件1是最接近的现有技术。
(2.1)权利要求1请求保护一种图像文档自动排序方法,对比文件1公开了一种方便电子化的专业笔记本及其页码自动识别方法,并具体公开了如下技术特征(参见说明书第[0032]-[0038]段):拍摄方便电子化的专业笔记本的纸质页面图像(相当于“步骤一,获取多个图像文档”);识别所述页码标注区域中的页码内容加入到所述纸质页面的电子化文档中(识别页码内容加入到纸质页面的电子化文档中,意味着必然存在提取页码的步骤,而能提取到页码的前提是识别内容中包括页码,因此相当于“步骤二,分别对每个所述图像文档中的图像进行文字识别并得到识别结果,根据是否包含关键字来提取所述识别结果中的关键字段字符,并与该关键字段字符所在的图像文档相对应”);本发明通过在笔记本纸质页面上印刷页码标注区域,并在用CamScanner等应用软件对笔记本纸质页面进行电子化的时候自动识别该页码标注区域的页码内容,从而方便电子化文档管理和查询。利用增加页码标注区域的方法对电子化文档的顺序进行确定(相当于“步骤三,根据所述关键字段字符作为排序依据,对各关键字段字符所对应的图像文档进行排序”)。
权利要求1与对比文件1相比,区别在于:1)根据是否符合特定格式来提取所述识别结果中的关键字段字符;2)将排序后的图像文档的文件名改为所述关键字段字符。
基于上述区别,权利要求1实际解决的问题是:如何从图像识别结果中提取内容,以及如何对排序后的图像文档进行命名。
针对区别1),对于本领域技术人员来说,根据特定格式来进行内容提取,这是本领域的公知常识。对比文件1已经公开了可以从图像文档的特定区域提取页码的方案,页码本身也能体现特定的格式,因此本领域技术人员很容易想到也可以根据识别结果中是否符合特定的格式,来提取关键字段字符。
针对区别2),对于本领域技术人员来说,将图像进行内容提取后,根据提取内容对图像进行重新命名,有利于图像的管理,这是本领域常用的技术手段,属于本领域的公知常识。在对比文件1已经公开了对图像进行页码提取以便于进行查询和管理的方案的基础上,本领域技术人员很容易想到可以对排序后的图像文档以提取的关键字段字符进行重命名。
因此,在对比文件1的基础上结合本领域的公知常识以获得权利要求1的技术方案是显而易见的,权利要求1的方案不具备突出的实质性特点和显著的进步,不具备专利法第22条第3款规定的创造性。
(2.2)权利要求2引用权利要求1。对比文件1还公开了(参见说明书第[0034]段):拍摄方便电子化的专业笔记本的纸质页面图像(相当于“以拍摄的方式获取新的图像文档”)。对于本领域技术人员来说,在已有的图像文档中选择某些图像文档以获取相应的图像文档,这是本领域的公知常识。因此,在其引用的权利要求不具备创造性时,权利要求2也不具备专利法第22条第3款规定的创造性。
(2.3)权利要求3引用权利要求1。其附加技术特征已在对比文件1中公开:在笔记本纸质页面上印刷页码标注区域,并在用CamScanner等应用软件对笔记本纸质页面进行电子化的时候自动识别该页码标注区域的页码内容,从而方便电子化文档管理和查询。利用增加页码标注区域的方法对电子化文档的顺序进行确定。因此,在其引用的权利要求不具备创造性时,权利要求3也不具备专利法第22条第3款规定的创造性。
(2.4)权利要求4引用权利要求1。对比文件1已经公开了切边的特征:通过图像中的直线检测法确定四条边缘线,切除掉图像中四条边缘线限定范围外的背景区域。对于本领域技术人员来说,通过旋转、拉伸、图像增强等方式对图像进行处理以便于后续进行识别等应用,这是本领域的公知常识。因此,在其引用的权利要求不具备创造性时,权利要求4也不具备专利法第22条第3款规定的创造性。
(2.5)权利要求5引用权利要求1、3或4。其附加技术特征已在对比文件1中公开,具体如上述。因此,在其引用的权利要求不具备创造性时,权利要求5也不具备专利法第22条第3款规定的创造性。
(2.6)权利要求6引用权利要求1。对于本领域技术人员来说,使用文档的排序顺序来对文档进行标记,这是本领域的公知常识。因此,在其引用的权利要求不具备创造性时,权利要求6也不具备专利法第22条第3款规定的创造性。
权利要求7引用权利要求6。对于本领域技术人员来说,将关键字作为文档的标记内容,这是本领域的公知常识。因此在其引用的权利要求不具备创造性的情况下,权利要求7也不具备专利法第22条第3款规定的创造性。
(2.7)权利要求8请求保护一种如权利要求1-7任意一项所述的图像文档自动排序方法所采用的图像文档自动排序装置,其限定特征与权利要求1中的特征相对应。基于相同的证据和理由,在其引用的权利要求不具备创造性时,权利要求8也不具备专利法第22条第3款规定的创造性。
从属权利要求9-12的附加技术特征与从属权利要求3-6中的全部或部分附加技术特征相对应,基于相同的证据和理由,在其引用的权利要求不具备创造性时,权利要求9-12也不具备专利法第22条第3款规定的创造性。
(2.8)权利要求13请求保护一种图像文档自动排序方法,对比文件1公开了一种方便电子化的专业笔记本及其页码自动识别方法,并具体公开了如下技术特征(参见说明书第[0032]-[0038]段):拍摄方便电子化的专业笔记本的纸质页面图像;识别所述页码标注区域中的页码内容加入到所述纸质页面的电子化文档中;本发明通过在笔记本纸质页面上印刷页码标注区域,并在用CamScanner等应用软件对笔记本纸质页面进行电子化的时候自动识别该页码标注区域的页码内容,从而方便电子化文档管理和查询。利用增加页码标注区域的方法对电子化文档的顺序进行确定(相当于“存储有多个第一图像文档,所述多个图像文档按照其各自的第一关键字段字符的顺序排序”)。
该权利要求与对比文件1的区别技术特征在于:获取至少一个第二图像文档;分别对每个所述第二图像文档中的图像进行文字识别并得到识别结果,根据是否包含关键字或者是否符合特定格式来提取所述识别结果中的第二关键字段字符,并与该第二关键字段字符所在的第二图像文档相对应;将所述第二关键字段字符与所述第一关键字段字符相比较,根据所述第一关键字段字符和第二关键字段字符作为排序依据,将所述第二关键字段字符所对应的第二图像文档插入到所述第一图像文档排序中的相应位置,完成图像文档自动排序,并将排序后的第一图像文档和第二图像文档的文件名改为所述第一关键字段字符和第二关键字段字符。基于上述区别技术特征,该权利要求实际解决的技术问题是如何在已排好序的图像文档中按既定顺序插入新的文档。
对于本领域技术人员来说,根据特定格式来进行内容提取,将图像进行内容提取后,根据提取内容对图像进行重新命名,有利于图像的管理,这些是本领域的公知常识。对比文件1已经公开了可以从图像文档的特定区域提取页码以便于进行查询和管理的方案,页码本身也能体现特定的格式,因此本领域技术人员很容易想到也可以根据识别结果中是否符合特定的格式,来提取关键字段字符。对比文件2公开了一种插入排序的方法,并具体公开了如下技术特征(参见说明书第2页):本发明实施例一方面提供了一种插入排序的方法,用于将待插入数据的关键字按排序队列中节点数据的关键字的排序规则插入所述排序队列,包括以下步骤:将所述排序队列中各节点数据的关键字与所述待插入数据的关键字进行比较;根据所述比较结果对所述排序队列中的节点数据进行移位操作;在进行所述移位操作的同时将所述待插入数据插入所述排序队列(相当于“将第二关键字段字符与第一关键字段字符相比较,根据第一关键字段字符和第二关键字段字符作为排序依据,将第二关键字段字符所对应的数据插入到第一数据排序中的相应位置,完成数据的自动排序”)。可见,对比文件2给出了可根据关键字比较来将新的数据插入原有已排好顺序的数据序列中形成新的排序序列的技术启示。本领域技术人员在面对如何在已排好序的图像文档序列中按既定顺序插入新的文档的问题时,很容易想到可同样对新的图像文档进行内容识别并提取出关键字段字符,进而通过关键字比较的方式将新的图像文档按既定顺序插入已排好序的图像文档序列中,并以提取的关键字段字符对相应的图像文档进行重命名。
因此,在对比文件1的基础上结合对比文件2和本领域的公知常识以获得权利要求13所要求保护的技术方案是显而易见的,因此权利要求13所要求保护的技术方案不具备突出的实质性特点和显著的进步,因而不具备专利法第22条第3款规定的创造性。
(2.9)从属权利要求14-20的附加技术特征分别与权利要求1-7的技术特征相对应。因此,基于相同的证据和理由,在其引用的权利要求不具备创造性时,权利要求14-20也不具备专利法第22条第3款规定的创造性。
(2.10)权利要求21请求保护一种如权利要求13-20任意一项所述的图像文档自动排序方法所采用的图像文档自动排序装置,其是与权利要求13完全对应的产品权利要求,基于相同证据和理由,权利要求21也不具备专利法第22条第3款规定的创造性。
从属权利要求22-25的附加技术特征与权利要求3-6的附加技术特征相对应。基于相同的证据和理由,在其引用的权利要求不具备创造性时,权利要求22-25也不具备专利法第22条第3款规定的创造性。
对复审请求人相关意见的评述
针对复审请求人陈述的意见,合议组认为:
如复审请求人所认同的,“文字识别”是指从图像中识别出字符,“提取”是指图像文档的文字识别结果包含较多内容,从中提取出一部分或全部内容。可见,二者均需从图像中识别出字符。根据对比文件1的方案,其将识别的页码内容加入到纸质页面的电子化文档中,即需要识别并将识别的页码(相当于全部识别结果)加入到电子化文档中,本申请中也是将识别结果提取出所需部分(相当于部分识别结果)来命名图像文档,在识别过程中不可避免也需要确定文字的范围和痕迹。对比文件1和本申请均是用来实现图像文档的自动排序,二者发明构思是相近的。对于本领域技术人员来说,根据特定格式来进行内容提取,这是本领域的公知常识。对比文件1已经公开了可以从图像文档的特定区域提取页码的方案,页码本身也能体现特定的格式,因此本领域技术人员很容易想到也可以根据识别结果中是否符合特定的格式,来提取关键字段字符。将图像进行内容提取后,根据提取内容对图像进行重新命名,有利于图像的管理,这是本领域常用的技术手段,属于本领域的公知常识。在对比文件1已经公开了对图像进行页码提取以便于进行查询和管理的方案的基础上,本领域技术人员很容易想到可以对排序后的图像文档以提取的关键字段字符进行重命名。因此,相对于对比文件1和本领域公知常识的结合,权利要求1不具备专利法第22条第3款规定的创造性。如前所述,权利要求1-25相对于对比文件1、本领域公知常识和/或对比文件2的结合不具备专利法第22条第3款规定的创造性。
因此,对于复审请求人陈述的意见,合议组不予支持。
三、决定
维持国家知识产权局于2018年03月19日对本申请作出的驳回决定。
如对本复审请求审查决定不服,根据专利法第41条第2款的规定,复审请求人可以自收到本决定之日起三个月内向北京知识产权法院起诉。


郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如作者信息标记有误,请第一时间联系我们修改或删除,多谢。

留言与评论(共有 0 条评论)
   
验证码: