发明创造名称:一种具有智能检测功能的数据处理方法及系统
外观设计名称:
决定号:192023
决定日:2019-09-20
委内编号:1F262656
优先权日:
申请(专利)号:201410291108.0
申请日:2014-06-24
复审请求人:国家电网公司 国网山东省电力公司电力科学研究院 山东亿云信息技术有限公司
无效请求人:
授权公告日:
审定公告日:
专利权人:
主审员:王艳坤
合议组组长:田志刚
参审员:李燕东
国际分类号:G06F17/30
外观设计分类号:
法律依据:专利法第22条第3款
决定要点:如果一项权利要求的技术方案与最接近的现有技术相比存在区别技术特征,该区别技术特征不属于本领域的公知常识,也未被其他现有技术所公开,现有技术也没有给出将该最接近的现有技术与现有技术相结合的技术启示,本领域技术人员没有动机去改进该最接近的现有技术并获得该项权利要求的技术方案,并且该区别技术特征的存在使得该项权利要求的技术方案具备有益的技术效果,则该项权利要求具备创造性。
全文:
本复审请求涉及申请号为201410291108.0,名称为“一种具有智能检测功能的数据处理方法及系统”的发明专利申请(下称本申请)。本申请的申请人为国家电网公司、国网山东电力公司电力科学研究院、山东亿云信息技术有限公司,申请日为2014年06月24日,公开日为2014年11月05日。
经实质审查,国家知识产权局原审查部门于2018年07月25日发出驳回决定,驳回了本申请,其理由是:权利要求1-4不具备专利法第22条第3款规定的创造性。驳回决定所依据的文本为:申请日2014年06月24日提交的说明书第1-162段、说明书附图图1-5、摘要附图,2014年08月29日提交的说明书摘要,2017年08月11日提交的权利要求第1-4项 。驳回决定所针对的权利要求书如下:
“1. 一种具有智能检测功能的数据处理方法,其特征是,包括如下步骤:
步骤一:通过JS脚本自动检测当前用户使用浏览器版本,对于非IE系列浏览器给予提示,并关闭;检测使用浏览器符合要求即进入系统进行数据采集;
步骤二:将远程数据采集终端通过手写板采集完成人笔迹存储至笔迹特征库,将采集的与项目直接相关的数据存储到项目申报库主数据表中,每条数据对应唯一项目编号,与项目间接相关的数据存储到项目申报库各子数据表中,子数据表中设置项目编号作为外键与主数据表关联;采集的图片、Word和PDF文档数据以文件形式存储至服务器缓存区,将文档相对路径存储至项目申报数据库附件子数据表中;申报数据库的子数据表中还存储有历史项目申报信息;
步骤三:主计算机读取项目申报库主数据表及各子数据表中数据,判断数据是否符合要求;对于图片文档,利用项目申报数据库附件子数据表中文档路径调用服务器缓存区图片文档,利用图像识别模块读取图片文档内容,识别完成人笔迹与笔迹特征库进行比对,完成单位盖章与完成单位数据表完成单位名称是否相符,如果笔迹特征库中笔迹信息、项目申报数据表中申报项目的信息及图片文档均符合要求就进入步骤四,如果不符合就返回步骤二;
步骤四:将步骤三中符合要求的项目数据从项目申报数据库同步到评审数据库,该同步过程采取单向同步;对评审数据库的申报信息进行三次筛选,并将最终数据输出在服务器的浏览页面上;
所述步骤三中,对项目申报库各子数据表存储的数据进行分词或者直接匹配,利用判断模块判断当前的申报项目的信息是否为项目名称或论文论著名称,如果是就进入关键词比较模块,如果不是,再进行判断是否为项目的完成人姓名及身份证号或知识产权号,如果是,则进入直接匹配模块;
利用关键词比较模块将当前的申报项目的信息的项目名称或论文论著名称与历史项目申报信息中的另一申报项目的项目名称或论文论著名称的关键词比较,如果相似度不低于设定值,判定重复,否则不重复;
利用直接匹配模块将当前的申报项目的信息项目的完成人姓名及身份证号或知识产权号与历史项目申报信息中的另一申报项目的项目完成人姓名及身份证号或知识产权号直接进行匹配,如果相同判定重复,否则不重复;
利用存储模块将关键词比较模块及直接匹配模块判定不重复申报项目的信 息存储到主计算机的缓存区,将判定重复的申报项目的信息存储到主计算机中的项目申报数据库查重表中;
所述关键词比较模块将当前的申报项目的信息的项目名称或论文论著名称与历史项目申报信息中的另一申报项目的项目名称或论文论著名称的关键词比较,如果相似度不低于设定值,判定重复,否则不重复,具体过程为:
利用关键词提取模块取出当前申报项目的信息及历史项目申报信息中的一个,对取出的信息进行分词,将分解出的关键词分别存储到主计算机中项目申报数据库对应的两个数组中;
利用关键词匹配模块对项目申报数据库对应的两个数组中的关键词进行遍历循环比较,得出相同关键词数及各组关键词数;
根据相似度模块得出当前申报项目的信息与历史项目申报信息中的项目信息的相似度,将该相似度与设定值比较,如果相似度不低于设定值,判定重复,否则不重复;
所述利用关键词提取模块取出当前申报项目的信息及历史项目申报信息中的一个,对取出的信息进行分词,采用ShootSearch组件分词;
所述相似度模块具体用于比较项目申报数据库对应的两个数组中关键词数大小,取出较小关键词数,用相同关键词数除以较小关键词数得出相似度;
所述利用直接匹配模块将当前的申报项目的信息项目的完成人姓名及身份证号或知识产权号与历史项目申报信息中的另一申报项目的项目完成人姓名及身份证号或知识产权号直接进行匹配,具体为:
将远程数据采集终端采集的申报项目的信息与申报数据库的子数据表中历史项目申报信息直接进行遍历循环匹配,判断是否匹配,如果匹配,则判定重复,否则,不重复;
所述申报项目的信息包括项目名称、论文论著名称、项目的完成人姓名及身份证号及知识产权号,历史项目申报信息包括当前年度其他项目或近三年所有项目中的项目名称、论文论著名称、项目的完成人姓名及身份证号及知识产权号,知识产权号为专利申请号或者专利公开号;
所述步骤三中对评审数据库的申报信息进行三次筛选,具体为:
对符合要求的评审数据库中的项目进行第一次筛选,根据项目信息遴选对应 的网络评审专家,通过网络评审对同步到评审数据库中的数据进行筛选;将筛选出的申报项目数据存储到评审数据库中的第三缓存区;
对存储到第三缓存区中的申报项目数据进行第二次筛选;根据项目信息遴选资深专家,对第一次筛选取出的数据进行专家投票,从投票结果中取出初步获奖项目,将初步获奖项目的数据存储到评审数据库中的第四缓存区;
对存储到第四缓存区中的申报项目数据进行第三次筛选;根据项目信息遴选科技委员会专家,对第二次筛选中取出的数据进行专家审核,从审核结果中取出最终获奖项目,将最终获奖项目存储到评审数据库中的第五缓存区;
所述第一次筛选是打分、第二次筛选是投票分等级、第三次筛选是投票表决。
2. 如权利要求1所述一种具有智能检测功能的数据处理方法,其特征是,所述三次筛选中,专家的遴选的过程具体为:
S1:将科技项目学科信息以数据集A的形式存储在评审数据库的子数据表中,评审数据库的子数据表中还存储有以数据集B的形式存储的专家学科信息;
S2:在数据集B中选取专家学科信息并作为条件因素,判断该专家学科信息的条件因素是否为一级学科,如果是,则将该条件因素与以数据集A的形式存储的科技项目学科信息的关键因素匹配,遍历专家学科信息中的条件因素是否包含关键因素,如果包含则匹配,并进入步骤S5,否则不匹配,进入步S3;
S3:判断该专家信息的条件因素是否为二级学科,如果是,则将该条件因素与以数据集A的形式存储的科技项目信息的关键因素匹配,遍历专家信息中的条件因素是否包含关键因素,如果包含则匹配,进入步骤S5,否则不匹配,进入步骤S4;
S4:判断该专家信息的条件因素是否为三级学科,如果是,则将该条件因素与以数据集A的形式存储的科技项目信息的关键因素匹配,遍历专家信息中的条件因素是否包含关键因素,如果包含则匹配,进入S5,否则不匹配;
S5:从存储的专家学科信息的数据集B中随机选取与科技项目相匹配的专家数量,并将取出的数据存储至评审数据库。
3. 一种具有智能检测功能的数据处理系统,其特征是,包括:
系统校验模块,用于通过JS脚本自动检测当前用户使用浏览器版本,对于非IE系列浏览器给予提示,并关闭;检测使用浏览器符合要求即进入系统进行 数据采集;
远程数据采集终端,用于将采集的申报项目的数据信息存储到网络服务器的缓存区,将远程数据采集终端通过手写板采集完成人笔迹存储至笔迹特征库;
主计算机,用于调用网络服务器的缓存区的申报项目的数据信息并存储,将采集的与项目直接相关的数据存储到项目申报库主数据表中,每条数据对应唯一项目编号,与项目间接相关的数据存储到项目申报库各子数据表中,子数据表中设置项目编号作为外键与主数据表关联;采集的图片、Word和PDF文档数据以文件形式存储至主计算机的服务器缓存区,将文档相对路径存储至项目申报数据库附件子数据表中;申报数据库的子数据表中还存储有历史项目申报信息;
查重判断模块,用于根据主计算机读取第一缓存区中的申报项目的信息,判断数据是否符合要求;对于图片文档,利用项目申报数据库附件子数据表中文档路径调用主计算机的第二缓存区图片文档,利用图像识别模块读取图片文档内容,识别完成人笔迹与笔迹特征库进行比对,完成单位盖章与完成单位数据表完成单位名称是否相符,如果笔迹特征库中笔迹信息、项目申报数据表中申报项目的信息及图片文档均符合要求就进入筛选模块,如果不符合就重新采集数据;
输出模块,用于将符合要求的项目数据从项目申报数据库同步到评审数据库;对评审数据库的申报信息进行三次筛选,并将最终数据输出在服务器的浏览页面上;
所述查重判断模块中,具体还包括选择模块,选择模块用于对主计算机读取第一缓存区中的项目申报库各子数据表存储的数据进行分词或者直接匹配,利用判断当前的申报项目的信息是否为项目名称或论文论著名称,如果是就进入关键词比较模块,如果不是,再进行判断是否为项目的完成人姓名及身份证号或知识产权号,如果是,则进入直接匹配模块;
关键词比较模块,用于将当前的申报项目的信息的项目名称或论文论著名称与历史项目申报信息中的另一申报项目的项目名称或论文论著名称的关键词比较,如果相似度不低于设定值,判定重复,否则不重复;
直接匹配模块,用于将当前的申报项目的信息项目的完成人姓名及身份证号或知识产权号与历史项目申报信息中的另一申报项目的项目完成人姓名及身份证号或知识产权号直接进行匹配,如果相同判定重复,否则不重复;
存储模块,用于将关键词比较模块及直接匹配模块判定不重复申报项目的信息存储到主计算机的缓存区,将判定重复的申报项目的信息存储到主计算机中的项目申报数据库查重表中;
所述关键词比较模块,具体包括:
关键词提取模块,用于取出当前申报项目的信息及历史项目申报信息中的一个,对取出的信息进行分词,将分解出的关键词分别存储到主计算机中项目申报数据库对应的两个数组中;
相似度模块,用于得出当前申报项目的信息与历史项目申报信息中的项目信息的相似度,将该相似度与设定值比较,如果相似度不低于设定值,判定重复,否则不重复;
所述利用关键词提取模块取出当前申报项目的信息及历史项目申报信息中的一个,对取出的信息进行分词,采用ShootSearch组件分词;
所述相似度模块具体用于比较项目申报数据库对应的两个数组中关键词数大小,取出较小关键词数,用相同关键词数除以较小关键词数得出相似度;
所述筛选模块包括一次筛选模块、二次筛选模块及三次筛选模块,所述一次筛选模块用于对符合要求的项目进行第一次筛选,根据项目信息遴选对应的网络评审专家,通过网络评审对同步到评审数据库中的数据进行筛选;将筛选出的申报项目数据存储到评审数据库中的第三缓存区;
所述二次筛选模块用于对存储到第三缓存区中的申报项目数据进行第二次筛选;根据项目信息遴选资深专家,对一次筛选模块中取出的数据进行专家投票,从投票结果中取出初步获奖项目,将初步获奖项目的数据存储到评审数据库中的第四缓存区;
所述三次筛选模块用于对存储到第四缓存区中的申报项目数据进行数据第三次筛选;根据项目信息遴选科技委员会专家,对二次筛选模块中取出的数据进行专家审核,从审核结果中取出最终获奖项目,将最终获奖项目存储到评审数据库中的第五缓存区;将存储在评审数据库中的第五缓存区中的最终获奖项目的数据输出;所述第一次筛选是打分、第二次筛选是投票分等级、第三次筛选是投票表决。
4. 如权利要求3所述一种具有智能检测功能的数据处理系统,其特征是,所 述筛选模块,具体包括:
筛选存储模块,用于调用科技项目学科信息并以数据集A的形式存储在评审数据库的子数据表中,评审数据库的子数据表中还存储有以数据集B的形式存储的专家学科信息;
一级学科提取模块,用于在数据集B中选取专家学科信息并作为条件因素,判断该专家学科信息的条件因素是否为一级学科,如果是,则将该条件因素与以数据集A的形式存储的科技项目学科信息的关键因素匹配,遍历专家学科信息中的条件因素是否包含关键因素,如果包含则匹配,否则不匹配;
二级学科提取模块,用于判断该专家信息的条件因素是否为二级学科,如果是,则将该条件因素与以数据集A的形式存储的科技项目信息的关键因素匹配,遍历专家信息中的条件因素是否包含关键因素,如果包含则匹配,否则不匹配;
三级学科提取模块,用于判断该专家信息的条件因素是否为三级学科,如果是,则将该条件因素与以数据集A的形式存储的科技项目信息的关键因素匹配,遍历专家信息中的条件因素是否包含关键因素,如果包含则匹配,否则不匹配;
随机数据生成模块,用于从存储的专家学科信息的数据集B中随机选取与科技项目相匹配的专家数量,并将取出的数据存储至评审数据库。”
驳回决定引用如下对比文件:
对比文件1:CN101593324A,公开日为2009年12月02日;
对比文件2:CN102376023A,公开日为2012年03月14日;
对比文件3:CN103235774A,公开日为2013年08月07日。
驳回决定的主要理由是:权利要求1与对比文件1相比,其区别在于:(1)步骤一;(2)采用手写板采集笔迹,并且判断的是项目数据;(3)步骤四以及步骤三中对评审数据库的申报信息进行三次筛选的具体步骤;(4)申报数据以及采集的图片等文档数据分别存储到服务器缓存区以及主机算计缓存区;(5)所述步骤三中的关键词匹配步骤。基于上述区别技术特征(1),该权利要求实际要解决的技术问题是:如何保障网页的正常运行。公知常识举证文件1(“突破DreamWeaver 4.0创作实例五十讲”,王龙,第47页,中国水利水电出版社,2001年8月)公开了:浏览器的检测:浏览器的兼容性对于网页制作是非常重要的,所以最好在网页中加入一些代码实现对浏览器类型的检测,Dreamweaver提供了这个功能,可以根据浏览器的类型或版本实现跳转到不同的页面。可见,在网页中通过代码来自动检测浏览器版本,以查看是否符合网页需求是本领域公知常识。而指定某种浏览器类型,在不符合要求时不运行网页,以及使用JS脚本实现网页中的某个功能,是本领域技术人员的惯用技术手段。基于上述区别技术特征(2),该权利要求实际要解决的技术问题是:如何实现对项目的在线审批。在线项目审批时同样是将项目的相关文件上传到服务器进行审批的,故将对比文件1公开的在线审批方式应用到项目审批中也是本领域技术人员容易想到的。公知常识举证文件2(“射频识别(RFID)技术原理与应用”,郎为民,第26页,机械工业出版社,2006年6月)公开了:一种典型的在线签名识别系统流程如图1-14所示:该系统通过手写板采集书写过程中的时间、压力、位置等相关信息,然后采用基于笔画分割的笔迹分析处理程序提取书写者书写风格特征,最后通过与笔记特征库中的特征进行匹配,得到书写人鉴别结论。可见,手写板采集笔迹存储到笔迹特征库以实现笔迹识别,是本领域公知常识。基于上述区别技术特征(3),该权利要求实际要解决的技术问题是:如何组织评审数据库。对比文件2公开了一种信用评审用审批材料的集成化方法,对比文件2公开了设置评审数据库以及数据库的部分组织方式,且其在对比文件2中的作用与其在本申请权利要求中的作用相同,都是限定评审数据库。因此本领域技术人员可以从对比文件2中得到技术启示,将其应用于对比文件1以解决其技术问题。其中对比文件2没有指出有关三次筛选以及单向同步、子数据库存储的内容、外键、历史项目申报表信息,但是对比文件1已经公开了多级审批,为其设置专门的评审数据库,并将审批具体化为三次筛选是本领域技术人员常规选择;其筛选过程是本领域技术人员可以根据需求选择,具体的专家匹配规则也是本领域技术人员可以根据需求设定;而将间接数据存储到子数据表、设置外键与主数据表相关联以及存储历史数据均属于常规的数据库组织方式,为本领域常用手段;至于单向同步的同步方式,属于本领域技术人员容易选择的配置手段。基于区别技术特征(4),该权利要求实际要解决的技术问题是:如何对不同的具体数据进行存储。图片、word文档以及PDF文档都是项目数据常见的承载形式,而对不同数据分类型、分区存储并建立彼此之间的关联关系属于数据存储的惯用手段,属于本领域公知常识。基于区别技术特征(5),该权利要求实际要解决的技术问题是:如何实现对申报项目的查重处理。对比文件3公开了一种科技项目申请书特征词提取方法,并具体披露了由于目前科技项目管理信息系统建设的不健全,导致项目重复申报情况十分普遍,为有效杜绝这种现象,针对科技项目申请书信息进行文本相似度计算研究是非常有必要的;将申请书主要文本切分成子串序列并进行中科院ICTCLAS分词等操作,从而便于实现科技项目相似性检查。可见,上述特征在对比文件3中所起的作用与区别技术特征在本申请中所起的作用类似,都是为了排查重复申报的项目,且两者采用的手段都是基于分词基础上的相似性比较。也就是说,对比文件3给出了将上述特征应用于对比文件1的启示,其中对比文件3没有公开具体的筛选过程以及专家匹配规则,而对本领域技术人员来说,论文和知识产权是项目成果最常见的体现形式,本领域技术人员很容易想到在评审前先对项目成果的类别进行辨别,这是本领域技术人员的惯用技术手段;且对本领域技术人员来说,利用直接匹配模块将当前的申报项目的信息项目的完成人姓名及身份证号或知识产权号与历史项目申报信息中的另一申报项目的完成人姓名及身份证号或知识产权号直接进行匹配,如果相同判定重复,否则不重复,本领域技术人员很容易想到知识产权号是唯一的,可以作为项目成果是否重复的依据,是本领域公知常识,利用存储模块将关键词比较模块及直接匹配模块判定不重复申报项目的信息存储到主计算机的缓存区,将判定重复的申报项目的信息存储到主计算机中的项目申报数据库查重表中,这仅仅涉及项目查重中数据的存储,对本领域技术人员来说是惯用技术手段,而利用图像识别模块检测单位盖章与单位名称是否相符,以及识别笔记是否相符等等,均为本领域技术人员的惯用技术手段,目的都是为了保证同步到评审数据库的数据符合要求,是所属领域的公知常识;利用关键词提取模块取出当前申报项目的信息及历史项目申报信息中的一个,对取出的信息进行分词,采用ShootSearch组件分词,是本领域技术人员惯用技术手段。公知常识举证文件3(“信息组织”,周宁,第30页,武汉大学出版社,2004年11月)公开了:通常可以通过标引词和关键词来判断文献主题,如果其关键词相同或相近,就可以把这些文献归为一类,也就是说文献聚类可以在文献所包含的词的基础上形成,两篇文献所拥有的共同的关键词的数量越多,说明这两篇文献的相关度越大,越有可能属于相似的主题领域。可见,根据相同关键词数量的多少来判断两个文献的相似度是本领域公知常识。公知常识举证文件4(“术语相似度计算方法研究”,徐健,中山大学出版社,2012年9月)公开了:通过术语对联合搜索和分别搜索获得的命中网页数指标可以作为计算术语间相似关系的有效度量,Web-Overlap方法。使用集合交集大小除以两个集合中数量较小的那个集合的大小以得到语义相似度,是本领域公知常识。在此基础上,在获得两个文本的相似度时,本领域技术人员不难想到使用相同关键词数除以较小关键词数得出相似度,相同的关键词占比越高,文本越有可能相似,而使用数据和集合等数据结构存储分词结果都是本领域技术人员惯用技术手段。由此可见,在对比文件1的基础上结合对比文件2、3以及本领域公知常识得到该权利要求所要保护的技术方案,对于本领域技术人员来说是显而易见的。因此,该权利要求1不具有不具备专利法第22条第3款规定的创造性。
权利要求2引用权利要求1,其限定了三次筛选中的专家遴选方案,但是其筛选过程是本领域技术人员可以根据需求选择,而具体的专家匹配规则也是本领域技术人员可以根据需求设定,其使用是本领域常用手段。当其引用的权利要求不具备创造性时,权利要求2不具备专利法第22条第3款规定的创造性。
权利要求3-4请求保护一种具有智能检测功能的数据处理系统,权利要求3-4的模块与权利要求1-2的方法步骤对应,基于对权利要求1-2的评述,当其引用的权利要求不具备创造性时,权利要求3-4相对于对比文件1、2、3以及本领域常用技术手段的结合也不具备专利法第22条第3款规定的创造性。
申请人(下称复审请求人)对上述驳回决定不服,于2018年10月12日向国家知识产权局提出了复审请求,未对权利要求书进行任何修改。复审请求人认为:对比文件1与本申请所属技术领域不同,所要解决的技术问题不同、技术方案不同、技术效果不同。对比文件1的“审批文件”不能等同与本申请的“申报项目数据信息”,保证签章真实性的方法不能等同与“项目申报中判断数据是否符合要求”。本申请大量区别均未被对比文件1公开,包括:浏览器版本的检测、数据的采集、存储、查重和形式审查、单向同步、相似度计算方法、多级审批等,这些步骤具有特定的执行顺序、相互依存和结合后解决了对科技项目的数据查重问题。因而,本申请具备创造性 。
经形式审查合格,国家知识产权局于2018年10月17日依法受理了该复审请求,并将其转送至原审查部门进行前置审查。
原审查部门在前置审查意见书中认为:对比文件1与本申请属于相近技术领域,都属于在线审批专家系统,应用环境都属于项目申报,审批的对象都属于用户提交的资料;本申请并不仅仅涉及资料查重,其系统首先是一个在线审批系统,至于其能够实现的具体功能,或被对比文件公开,或属于本领域常用技术手段。结合对比文件1、2、3以及本领域常用技术手段能够得到本申请权利要求的技术方案,达到相同的技术效果。本申请的“申报项目的数据信息”涵盖了较宽的保护范围,审批文件属于申报项目信息的一种;审查员并没有将保证签章的真实性的方法与“项目申报中判断数据是否符合要求”对应,在进行审批时,项目申报中判断数据是否符合要求是本领域技术人员的惯用技术手段。公知常识举证文件1公开了浏览器的检测、对比文件1公开了数据的采集和存储,且对比文件2公开了评审数据库的组织方式,对比文件3公开了对审批项目的查重,公知举证文件3和4部分公开了判断相似性的方法,多次审核的审批手段已被对比文件1公开,并且对比文件2还涉及项目的打分、投票,而投票分等级属于常规的审批手段。本申请与对比文件1之间的区别看似很多,然而许多区别之间并无实质的关联,而是属于计算机技术领域分别用来解决常见问题的惯用解决方式,因而即使是将考虑这些区别之间的特定顺序,以及将这些区别结合起来作为一个整体,仍不足以使本申请的权利要求具备创造性。对比文件1作为本申请最接近的现有技术公开了评审系统的基本架构,对比文件3给出了针对科技项目申请书信息进行文本相似度比较以防止重复项目申报的技术启示,在此基础上结合本领域惯用手段,以得到本申请各项权利要求请求保护的技术方案对本领域技术人员而言是显而易见的,其不具备突出的实质性特点,不具备创造性 ,因而坚持原驳回决定。
随后,国家知识产权局成立合议组对本案进行审理。
在上述程序的基础上,合议组认为本案事实已经清楚,可以作出审查决定。
二、决定的理由
1.审查文本的认定
复审请求人在提交复审请求时,未对权利要求书进行修改。本复审决定所针对的审查文本是:申请日2014年06月24日提交的说明书第1-162段、说明书附图图1-5、摘要附图,2014年08月29日提交的说明书摘要,2017年08月11日提交的权利要求第1-4项 。
2.关于专利法第22条第3款
专利法第22条第3款规定:“创造性,是指与现有技术相比,该发明具有突出的实质性特点和显著的进步,该实用新型具有实质性特点和进步。”
如果一项权利要求的技术方案与最接近的现有技术相比存在区别技术特征,该区别技术特征不属于本领域的公知常识,也未被其他现有技术所公开,现有技术也没有给出将该最接近的现有技术与现有技术相结合的技术启示,本领域技术人员没有动机去改进该最接近的现有技术并获得该项权利要求的技术方案,并且该区别技术特征的存在使得该项权利要求的技术方案具备有益的技术效果,则该项权利要求具备创造性。
本复审决定引用的对比文件与驳回决定所使用的对比文件相同,即
对比文件1:CN101593324A,公开日为2009年12月02日;
对比文件2:CN102376023A,公开日为2012年03月14日;
对比文件3:CN103235774A,公开日为2013年08月07日,
其中,对比文件1为最接近的现有技术。
2.1.权利要求1要求一种具有系统检测及生物识别功能的数据处理方法。而对比文件1公开一种基于可信计算应用技术的网络多级审批方法及系统,用于商业报表或事业单位文件自下而上逐级审批,所述方法以下步骤:(1)建立符合TCG规范和TCM规范的网络多级审批系统平台,包括服务器和若干客户机,各服务器和客户机均配备TPM可信计算芯片,安装可信多任务操作系统,运行监控和度量程序,服务器利用可信计算芯片对客户端的硬件进行可信度度量,保证客户端硬件的完整可信;(2)在服务器端建立可信密钥授权管理体系,客户机端采用USB硬件式密码钥匙盘进行审批系统的安全身份认证;(3)建立网络多级审批电子签章系统,用户在逐级审批过程中,利用输入设备进行签章;签章采用手写输入的签名或预设的图章,最终被保存为签章图片嵌入待审批文件的相应区域;(4)对生成的签章图片,嵌入数字水印进行防伪;(5)提取在线手写签章的笔迹特征,设计BP神经网络分类器,在服务器端对审批签名进行笔迹识别,保证签章的真实性;(6)对审批文件建立数字内容使用痕迹的产生和管理方法,每一次操作均记录下使用痕迹作为数字版权和版本信息。所述的步骤(1)中:客户机与服务器通过B/S模式建立连接,在客户机进行审批操作时,调用的服务和文件资源全部来自于服务器,对数据的读取、处理和保存都在服务器上进行操作,并经过服务器端软件的监控和度量,保证客户端操作信息的完整可信。所述的步骤(3)具体包括:(3.1)具有审批权限的用户通过中间件技术,打开在远程服务器端的待审批文件,确认文件内容后,在相应位置进行在线电子签章;(3.2)多级审批中,当第一级的签章确定后,待审批文件就被定义为“受保护”的安全级,此时无论是修改第一级签章或是继续下一级审批签章,都必须通过密码钥匙盘和用户口令进行操作;没有权限的情况下,对审批文件的任何操作,包括非法的复制和移动,已签审的签章将会自动失效;(3.3)审批人员进行电子签章、修改签章、删除签章操作时,需要进行插入USB密码钥匙,并进行用户口令验证;经过签署的审批文档,会根据密码钥匙盘中的用户信息以及操作信息,将审批单位、审批人员以及审批时间信息自动加入文档信息中,并在文档信息中生成密钥序列以备校验;(3.4)每一级的审批签章或手写,或将已生成的图片导入审批文档中,最终以图片格式显示在相应的签审区域(参见说明书第1-20页)。由此可见,对比文件1所公开的一种基于可信计算应用技术的网络多级审批方法及系统,是用于商业报表或事业单位文件自下而上逐级审批,侧重于同一篇文件自下而上各级领导的审批,其针对传统的操作模式中,不管是商业报表或是事业单位的文件,一旦自下而上逐级审批过程中在某一级出现滞留以及审批方的签名或印章真实性的安全问题,为克服传统审批模式中效率低下、时间及资源成本高且不足,提高网络应用的安全性而提出该基于可信计算平台的网络多级审批方法。
权利要求1与对比文件1相比,区别在于:
a步骤一:通过JS脚本自动检测当前用户使用浏览器版本,对于非IE系列浏览器给予提示,并关闭;检测使用浏览器符合要求即进入系统进行数据采集;
b步骤二:将远程数据采集终端通过手写板采集完成人笔迹存储至笔迹特征库,将采集的与项目直接相关的数据存储到项目申报库主数据表中,每条数据对应唯一项目编号,与项目间接相关的数据存储到项目申报库各子数据表中,子数据表中设置项目编号作为外键与主数据表关联;采集的图片、Word和PDF文档数据以文件形式存储至服务器缓存区,将文档相对路径存储至项目申报数据库附件子数据表中;申报数据库的子数据表中还存储有历史项目申报信息;
c步骤三:主计算机读取项目申报库主数据表及各子数据表中数据,判断数据是否符合要求;对于图片文档,利用项目申报数据库附件子数据表中文档路径调用服务器缓存区图片文档,利用图像识别模块读取图片文档内容,识别完成人笔迹与笔迹特征库进行比对,完成单位盖章与完成单位数据表完成单位名称是否相符,如果笔迹特征库中笔迹信息、项目申报数据表中申报项目的信息及图片文档均符合要求就进入步骤四,如果不符合就返回步骤二;
d步骤四:将步骤三中符合要求的项目数据从项目申报数据库同步到评审数据库,该同步过程采取单向同步;对评审数据库的申报信息进行三次筛选,并将最终数据输出在服务器的浏览页面上;
e所述步骤三中,对项目申报库各子数据表存储的数据进行分词或者直接匹配,利用判断模块判断当前的申报项目的信息是否为项目名称或论文论著名称,如果是就进入关键词比较模块,如果不是,再进行判断是否为项目的完成人姓名及身份证号或知识产权号,如果是,则进入直接匹配模块;
利用关键词比较模块将当前的申报项目的信息的项目名称或论文论著名称与历史项目申报信息中的另一申报项目的项目名称或论文论著名称的关键词比较,如果相似度不低于设定值,判定重复,否则不重复;
利用直接匹配模块将当前的申报项目的信息项目的完成人姓名及身份证号或知识产权号与历史项目申报信息中的另一申报项目的项目完成人姓名及身份证号或知识产权号直接进行匹配,如果相同判定重复,否则不重复;
利用存储模块将关键词比较模块及直接匹配模块判定不重复申报项目的信 息存储到主计算机的缓存区,将判定重复的申报项目的信息存储到主计算机中的项目申报数据库查重表中;
所述关键词比较模块将当前的申报项目的信息的项目名称或论文论著名称与历史项目申报信息中的另一申报项目的项目名称或论文论著名称的关键词比较,如果相似度不低于设定值,判定重复,否则不重复,具体过程为:
利用关键词提取模块取出当前申报项目的信息及历史项目申报信息中的一个,对取出的信息进行分词,将分解出的关键词分别存储到主计算机中项目申报数据库对应的两个数组中;
利用关键词匹配模块对项目申报数据库对应的两个数组中的关键词进行遍历循环比较,得出相同关键词数及各组关键词数;
根据相似度模块得出当前申报项目的信息与历史项目申报信息中的项目信息的相似度,将该相似度与设定值比较,如果相似度不低于设定值,判定重复,否则不重复;
所述利用关键词提取模块取出当前申报项目的信息及历史项目申报信息中的一个,对取出的信息进行分词,采用ShootSearch组件分词;
所述相似度模块具体用于比较项目申报数据库对应的两个数组中关键词数大小,取出较小关键词数,用相同关键词数除以较小关键词数得出相似度;
所述利用直接匹配模块将当前的申报项目的信息项目的完成人姓名及身份证号或知识产权号与历史项目申报信息中的另一申报项目的项目完成人姓名及身份证号或知识产权号直接进行匹配,具体为:
将远程数据采集终端采集的申报项目的信息与申报数据库的子数据表中历史项目申报信息直接进行遍历循环匹配,判断是否匹配,如果匹配,则判定重复,否则,不重复;
所述申报项目的信息包括项目名称、论文论著名称、项目的完成人姓名及身份证号及知识产权号,历史项目申报信息包括当前年度其他项目或近三年所有项目中的项目名称、论文论著名称、项目的完成人姓名及身份证号及知识产权号,知识产权号为专利申请号或者专利公开号;
f所述步骤三中对评审数据库的申报信息进行三次筛选,具体为:
对符合要求的评审数据库中的项目进行第一次筛选,根据项目信息遴选对应 的网络评审专家,通过网络评审对同步到评审数据库中的数据进行筛选;将筛选出的申报项目数据存储到评审数据库中的第三缓存区;
对存储到第三缓存区中的申报项目数据进行第二次筛选;根据项目信息遴选资深专家,对第一次筛选取出的数据进行专家投票,从投票结果中取出初步获奖项目,将初步获奖项目的数据存储到评审数据库中的第四缓存区;
对存储到第四缓存区中的申报项目数据进行第三次筛选;根据项目信息遴选科技委员会专家,对第二次筛选中取出的数据进行专家审核,从审核结果中取出最终获奖项目,将最终获奖项目存储到评审数据库中的第五缓存区;
所述第一次筛选是打分、第二次筛选是投票分等级、第三次筛选是投票表决。
基于上述区别技术特征,本申请实际要解决的技术问题是如何对申报材料进行自动查重以及多级筛选的问题。
关于区别技术特征a,尽管对比文件1没有公开上述区别技术特征,但是,对于本领域技术人员而言,在数据预处理阶段,对相关调用软件及其版本检测是本领域的常用技术手段。
关于区别技术特征b,首先对比文件1没有涉及项目申报的前期数据采集,也没有公开存储方式。然而,对于本领域技术人员而言,“将远程数据采集终端通过手写板采集完成人笔迹存储至笔迹特征库”是在科技奖励项目申报过程中数据预处理的常用技术手段。
其次,对比文件2公开一种信用评审用评审材料的集成化方法,应用于评审工作系统中,所述评审工作系统由客户端装置、网络装置、服务器群、数据总线和数据库构成,所述客户端装置通过网络装置与服务器群连接,所述服务器群内包括现场管理装置、评审意见登记装置、工作底稿查阅工具装置,所述服务器群内部的各个服务器装置通过数据总线连接,并由数据总线连接至所述数据库,所述基于评审工作系统的评审过程包括如下步骤,启动步骤,现场管理装置接收评审员的工作状态信号; 调用步骤,所述工作底稿查阅工具装置从数据库调用评审项目的评审材料数据; 查阅步骤,评审员通过工作底稿查阅工具装置查阅通过评审材料集成化方法集成化后的评审材料,进而得到修改意见; 修正步骤,评审员通过工作底稿查阅工具装置根据修正意见修正,得到修正结果; 存储步骤,工作底稿查阅工具装置将上述修正结果和修改意见存储在数据库中; 记录步骤,现场管理装置记录评审员的评审意见,并将所述评审意见和评审员的投票结果存储到数据库中; 所述评审材料包括评级对象的信息数据,档案材料,及信用报告。评审材料的集成化方法具体包括如下步骤:(1)定义原始表、一级表、二级表; (2)档案材料预处理步骤, (21)扫描步骤,扫描档案文件夹,读取档案文件名、文件路径; (22)生成步骤,自动为档案文件生成档案文件ID; (23)存储步骤,档案文件ID、评级对象名称、档案文件名、档案文件路径存储到原始表中,现场与档案文件夹相对应的档案文件索引记录集; (3)信息数据预处理步骤, (31)读取步骤,读取评级对象的信息数据,并存入到缓存区; (32)标记步骤,根据数据表名和预先设置的程序逻辑,为每条信息数据标记数据类型; (33)生成步骤,按照评级对象信息数据的类型,把不同类型的信息数据从缓存区读取出来,生成数据文件,数据文件由数据模块构成,在数据模块中,系统根据数据记录的类型在每个数据模块中的“数据类型域”填写数据类型内容,从而标记该模块的数据的类型属性; (34)扫描步骤,扫描数据文件中的数据模块,生成数据模块清单,并且预留“数据来源”栏; (35)写入步骤,自动匹配档案文件名,从原始表中读取档案文件ID,把数据模块中的“数据来源域”写入该档案文件ID; (36)存入步骤,对数据文件生成相应的文件ID,把数据文件和评级对象名称存入一级表,并且把数据模块清单同时存入; (4)指标预处理过程, (41)扫描存储步骤,扫描评级对象数据库,由指标计算模块调用信息数据及计算指标,并且把结果存到缓存区;(42)标记步骤,根据数据表名和系统预先设置的程序逻辑,为每个指标标记输入变量名称; (43)生成步骤,将指标计算结果从缓存区读取出来,生成指标文件,指标文件由指标模块构成,在指标模块中,系统根据指标的名称在每个模块中的“指标名称”填写指标名称,根据输入变量填写模块中的“输入变量域”,并且根据调用的评级对象在模块中的“数据文件域”中填写该评级对象的数据文件ID,(44)存入步骤,对指标文件生成文件ID,把指标文件、评级对象名称存入一级表,并且把数据模块清单同时存入;(5)信用报告预处理过程,(51)将评级报告中的每个可变数据项上都存储相关的一级表、二级表的标签。由此,可见对比文件2公开了通过设置唯一项目编号/ID且以此为关联分别在不同级别数据表中存储评审数据,且两者的作用相同。同时,评审数据库中存储历史项目申报信息是科技奖励项目申报过程中常用技术手段。对于本领域技术人员而言,非结构化数据以图片、Word和PDF文件形式存储存在缓存区是数据存储方式的常用技术手段。
关于区别技术特征c,对比文件1、2或3没有公开上述区别技术特征。但是,对于本领域技术人员而言,在进行大量的项目评审材料评审处理过程中,为实现合法性判断和查重处理,减少冗余数据,避免资源人力浪费,加快审查进度并提高评审质量,判断数据是否符合要求,以及进行图片识别、字迹对比、项目信息比对均为科技奖励项目申报过程中的常用技术手段。
关于区别技术特征d,对于本领域技术人员而言,将项目申报数据从其数据存储侧单向同步到评述专家侧是确保原始数据的唯一性、完整性和准确性,防止报奖项目数据源被篡改,对数据安全、准确唯一所采用的常用技术手段。另外,在科技奖励项目申报评述过程中,评审专家进行三次或更多次筛选并将最终结果呈现在服务器浏览器页面也是本领域的常用技术手段。
关于区别技术特征e,对比文件3公开了一种科技项目申请书特征词提取方法,并具体公开了以下技术特征(参见说明书第[0002]-[0003]段,摘要):由于目前科技项目管理信息系统建设的不健全,导致项目重复申报情况十分普遍,为有效杜绝这种现象,针对科技项目申请书信息进行文本相似度计算研究是非常有必要的;将申请书主要文本切分成子串序列并进行中科院ICTCLAS分词等操作,从而便于实现科技项目相似性查新。可见对比文件3给出了在分词基础上进行相似性比较的技术启示。对本领域技术人员来说,论文和知识产权是项目成果最常见的体现形式,本领域技术人员很容易想到在评审前先对项目成果的类别进行辨别,这是本领域技术人员的惯用技术手段;且对本领域技术人员来说,利用知识产权号的唯一性以作为项目成果是否重复的依据,通过利用直接匹配模块将当前的申报项目的信息项目的完成人姓名及身份证号或知识产权号与历史项目申报信息中的另一申报项目的完成人姓名及身份证号或知识产权号直接进行匹配,如果相同判定重复,否则不重复,是本领域常用技术手段,利用存储模块将关键词比较模块及直接匹配模块判定不重复申报项目的信息存储到主计算机的缓存区,将判定重复的申报项目的信息存储到主计算机中的项目申报数据库查重表中,这仅仅涉及项目查重中数据的存储,对本领域技术人员来说是常用技术手段。虽然对比文件3公开了根据关键词匹配进行相似度过滤,但是上述区别技术特征e有关利用关键词匹配模块进行分词、匹配的具体过程以及相似度模块的具体计算过程与对比文件3不同,不宜在没有任何证据的情况下被看做本领域解决相关技术问题的常用技术手段。而且由于对比文件1完全没有公开也不能体现同时审批了多个文件,因而也不具有查重的需求,本领域技术人员不可能在对比文件1的基础上,有动机去检索有关查重的相关文献。
关于区别技术特征f,对于本领域技术人员而言,在进行项目评审过程中,为保证评审项目评判的客观公正性,借助于计算机网络通过采用分级的方式对项目材料遴选相应级别的专家以进行筛选打分、投票、以及表决并将相应级别获奖项目存储是本领域的常用技术手段。
总之,由于对比文件1、2或3至少没有公开:所述关键词比较模块将当前的申报项目的信息的项目名称或论文论著名称与历史项目申报信息中的另一申报项目的项目名称或论文论著名称的关键词比较,如果相似度不低于设定值,判定重复,否则不重复,具体过程为:利用关键词提取模块取出当前申报项目的信息及历史项目申报信息中的一个,对取出的信息进行分词,将分解出的关键词分别存储到主计算机中项目申报数据库对应的两个数组中;利用关键词匹配模块对项目申报数据库对应的两个数组中的关键词进行遍历循环比较,得出相同关键词数及各组关键词数;根据相似度模块得出当前申报项目的信息与历史项目申报信息中的项目信息的相似度,将该相似度与设定值比较,如果相似度不低于设定值,判定重复,否则不重复;所述利用关键词提取模块取出当前申报项目的信息及历史项目申报信息中的一个,对取出的信息进行分词,采用ShootSearch组件分词;所述相似度模块具体用于比较项目申报数据库对应的两个数组中关键词数大小,取出较小关键词数,用相同关键词数除以较小关键词数得出相似度。该区别技术特征也不是本领域的常用技术手段或被其他现有技术所公开。现有技术也没有给出将对比文件1与对比文件2、3或本领域的常用技术手段相结合的技术启示,本领域技术人员没有动机去改进对比文件1公开的方案并获得该权利要求1的技术方案,并且该区别技术特征的存在使得该项权利要求的技术方案具备有益的技术效果:即使得系统自动提取查重因素,进行复杂匹配计算,减少人为因素,提高查重结果的公正和正确性,精确的甄别出重复申报的项目,避免误差和漏查,减轻工作人员工作量,极大提高工作效率。因此,权利要求1具备突出的实质性特点和显著的进步,具备专利法第22条第3款规定的创造性。
2.2.在权利要求1具备创造性的基础上,其从属权利要求2也具备专利法第22条第3款规定的创造性。
2.3.权利要求3-4要求一种产品权利要求,其与作为方法权利要求的权利要求1-2相对应。在权利要求1-2具备创造性的基础上,基于相同的理由和证据,权利要求3-4也具备专利法第22条第3款规定的创造性。
3.关于驳回和前置的评述
合议组认为:对比文件1公开的基于可信计算应用技术的网络多级审批方法及系统涉及文件撰写者撰写文件,提交文件,然后逐级进行各级领导审批,其不涉及申报材料审批前大量数据的查重预处理以及评审环节的多层筛选,即不存在数据查重和多层筛选的技术启示,本领域技术人员没有动机去结合对比文件2、3或本领域的常用技术手段以改进对比文件1的技术方案而获得权利要求1的方案。而且对于权利要求1而言,对比文件1、2或3至少没有公开:所述关键词比较模块将当前的申报项目的信息的项目名称或论文论著名称与历史项目申报信息中的另一申报项目的项目名称或论文论著名称的关键词比较,如果相似度不低于设定值,判定重复,否则不重复,具体过程为:利用关键词提取模块取出当前申报项目的信息及历史项目申报信息中的一个,对取出的信息进行分词,将分解出的关键词分别存储到主计算机中项目申报数据库对应的两个数组中;利用关键词匹配模块对项目申报数据库对应的两个数组中的关键词进行遍历循环比较,得出相同关键词数及各组关键词数;根据相似度模块得出当前申报项目的信息与历史项目申报信息中的项目信息的相似度,将该相似度与设定值比较,如果相似度不低于设定值,判定重复,否则不重复;所述利用关键词提取模块取出当前申报项目的信息及历史项目申报信息中的一个,对取出的信息进行分词,采用ShootSearch组件分词;所述相似度模块具体用于比较项目申报数据库对应的两个数组中关键词数大小,取出较小关键词数,用相同关键词数除以较小关键词数得出相似度。该区别技术特征也不是本领域的常用技术手段或被其他现有技术所公开,并且该区别技术特征的存在使得该项权利要求的技术方案具备有益的技术效果:即使得系统自动提取查重因素,进行复杂匹配计算,减少人为因素,提高查重结果的公正和正确性,精确的甄别出重复申报的项目,避免误差和漏查,减轻工作人员工作量,极大提高工作效率。因此,权利要求1具备突出的实质性特点和显著的进步,具备专利法第22条第3款规定的创造性。
三、决定
撤销国家知识产权局于2018年07月25日对本申请作出的驳回决定。由国家知识产权局原审查部门在以下基础上对本发明专利申请继续进行审查:申请日2014年06月24日提交的说明书第1-162段、说明书附图图1-5、摘要附图,2014年08月29日提交的说明书摘要,2017年08月11日提交的权利要求第1-4项 。
如对本复审请求审查决定不服,根据专利法第41条第2款的规定,复审请求人可自收到本决定之日起三个月内向北京知识产权法院起诉。
郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如作者信息标记有误,请第一时间联系我们修改或删除,多谢。