发明创造名称:一种具有图像识别功能的数据处理方法及系统
外观设计名称:
决定号:192832
决定日:2019-10-22
委内编号:1F249645
优先权日:
申请(专利)号:201410288528.3
申请日:2014-06-24
复审请求人:国家电网公司 国网山东省电力公司电力科学研究院 山东亿云信息技术有限公司
无效请求人:
授权公告日:
审定公告日:
专利权人:
主审员:王燕
合议组组长:李圆
参审员:孙蕾
国际分类号:G06F17/30;G06Q10/06
外观设计分类号:
法律依据:专利法第22条第3款
决定要点
:如果权利要求请求保护的技术方案与作为最接近现有技术的对比文件公开的技术方案相比存在区别技术特征,该区别技术特征未被其他对比文件公开,并且也不是本领域的公知常识,且该区别技术特征的引入使得该权利要求的整体技术方案相对于现有技术而言具有有益的技术效果,那么该权利要求所要求保护的技术方案相对于现有技术具备突出的实质性特点和显著的进步,从而具备创造性。
全文:
本复审请求涉及申请号为201410288528.3,名称为“一种具有图像识别功能的数据处理方法及系统”的发明专利申请(下称本申请)。申请人为国家电网公司、国网山东省电力公司电力科学研究院、山东亿云信息技术有限公司。本申请的申请日为2014年06月24日,公开日为2014年11月19日。
经实质审查,国家知识产权局原审查部门于2018年02月24日发出驳回决定,驳回了本申请,其理由是:权利要求1-4不具备专利法第22条第3款规定的创造性。驳回决定所依据的文本为:申请日2014年06月24日提交的说明书第1-157段、摘要附图、说明书附图图1-5;2014年09月12日提交的说明书摘要;2017年10月12日提交的权利要求第1-4项。
驳回决定所针对的权利要求书如下:
“1. 一种具有图像识别功能的数据处理方法,其特征是,包括如下步骤:
步骤一:采集申报项目的数据;将采集的与项目直接相关的数据存储到项目申报库主数据表中,每条数据对应唯一项目编号,与项目间接相关的数据存储到项目申报库各子数据表中,子数据表中设置项目编号作为外键与主数据表关联;采集的图片、Word和PDF文档数据以文件形式存储至服务器缓存区,将文档相对路径存储至项目申报库附件子数据表中;申报数据库的子数据表中还存储有历史项目申报信息;
步骤二:读取项目申报库主数据表及各子数据表中数据,判断数据是否符合要求;对于图片文档,利用项目申报库附件子数据表中文档路径调用服务器缓存区图片文档,利用图像识别模块读取图片文档内容,识别完成单位盖章与完成单位数据表完成单位名称是否相符,如果项目申报数据表中申报项目的信息及图片文档均符合要求就进入步骤三,如果不符合就返回步骤一;
步骤三:将步骤二中符合要求的项目数据从项目申报数据库同步到评审数据库,该同步过程采取单向同步;对评审数据库的申报信息进行三次筛选,并将最终数据输出在服务器的浏览页面上;
所述步骤二中,对项目申报库各子数据表存储的数据进行分词或者直接匹配,利用判断模块判断当前的申报项目的信息是否为项目名称或论文论著名称,如果是就进入关键词比较模块,如果不是,再进行判断是否为项目的完成人姓名及身份证号或知识产权号,如果是,则进入直接匹配模块;
利用关键词比较模块将当前的申报项目的信息的项目名称或论文论著名称与历史项目申报信息中的另一申报项目的项目名称或论文论著名称的关键词比较,如果相似度不低于设定值,判定重复,否则不重复;
利用直接匹配模块将当前的申报项目的信息项目的完成人姓名及身份证号或知识产权号与历史项目申报信息中的另一申报项目的项目完成人姓名及身份证号或知识产权号直接进行匹配,如果相同判定重复,否则不重复;
利用存储模块将关键词比较模块及直接匹配模块判定不重复申报项目的信息存储到服务器缓存区,将判定重复的申报项目的信息存储到项目申报数据库查重表中;
所述关键词比较模块将当前的申报项目的信息的项目名称或论文论著名称与历史项目申报信息中的另一申报项目的项目名称或论文论著名称的关键词比较,如果相似度不低于设定值,判定重复,否则不重复,具体过程为:
利用关键词提取模块取出当前申报项目的信息及历史项目申报信息中的一个,对取出的信息进行分词,将分解出的关键词分别存储到项目申报数据库对应的两个数组中;
利用关键词匹配模块对项目申报数据库对应的两个数组中的关键词进行遍历循环比较,得出相同关键词数及各组关键词数;
根据相似度模块得出当前申报项目的信息与历史项目申报信息中的项目信息的相似度,将该相似度与设定值比较,如果相似度不低于设定值,判定重复,否则不重复;
所述利用关键词提取模块取出当前申报项目的信息及历史项目申报信息中的一个,对取出的信息进行分词,采用ShootSearch组件分词;
所述相似度模块具体用于比较项目申报数据库对应的两个数组中关键词数大小,取出较小关键词数,用相同关键词数除以较小关键词数得出相似度;
所述利用直接匹配模块将当前的申报项目的信息项目的完成人姓名及身份证号或知识产权号与历史项目申报信息中的另一申报项目的项目完成人姓名及身份证号或知识产权号直接进行匹配,具体为:
将远程数据采集终端采集的申报项目的信息与申报数据库的子数据表中历史项目申报信息直接进行遍历循环匹配,判断是否匹配,如果匹配,则判定重复,否则,不重复;
所述申报项目的信息包括项目名称、论文论著名称、项目的完成人姓名及身份证号及知识产权号,历史项目申报信息包括当前年度其他项目或近三年所有项目中的项目名称、论文论著名称、项目的完成人姓名及身份证号及知识产权号,知识产权号为专利申请号或者专利公开号;
所述步骤三中对评审数据库的申报信息进行三次筛选,具体为:
对符合要求的评审数据库中的项目进行第一次筛选,根据项目信息遴选对应的网络评审专家,通过网络评审对同步到评审数据库中的数据进行筛选;将筛选出的申报项目数据存储到评审数据库中的第三缓存区;
对存储到第三缓存区中的申报项目数据进行第二次筛选;根据项目信息遴选资深专家,对第一次筛选取出的数据进行专家投票,从投票结果中取出初步获奖项目,将初步获奖项目的数据存储到评审数据库中的第四缓存区;
对存储到第四缓存区中的申报项目数据进行第三次筛选;根据项目信息遴选科技委员会专家,对第二次筛选中取出的数据进行专家审核,从审核结果中取出最终获奖项目,将最终获奖项目存储到评审数据库中的第五缓存区;
所述第一次筛选是打分、第二次筛选是投票分等级、第三次筛选是投票表决。
2. 如权利要求1所述一种具有图像识别功能的数据处理方法,其特征是,所述三次筛选中,专家的遴选的过程具体为:
S1:将科技项目学科信息以数据集A的形式存储在评审数据库的子数据表中,评审数据库的子数据表中还存储有以数据集B的形式存储的专家学科信息;
S2:在数据集B中选取专家学科信息并作为条件因素,判断该专家学科信息的条件因素是否为一级学科,如果是,则将该条件因素与以数据集A的形式存储的科技项目学科信息的关键因素匹配,遍历专家学科信息中的条件因素是否包含关键因素,如果包含则匹配,并进入步骤S5,否则不匹配,进入步S3;
S3:判断该专家信息的条件因素是否为二级学科,如果是,则将该条件因素与以数据集A的形式存储的科技项目信息的关键因素匹配,遍历专家信息中的条件因素是否包含关键因素,如果包含则匹配,进入步骤S5,否则不匹配,进入步骤S4;
S4:判断该专家信息的条件因素是否为三级学科,如果是,则将该条件因素与以数据集A的形式存储的科技项目信息的关键因素匹配,遍历专家信息中的条件因素是否包含关键因素,如果包含则匹配,进入S5,否则不匹配;
S5:从存储的专家学科信息的数据集B中随机选取与科技项目相匹配的专家数量,并将取出的数据存储至评审数据库。
3. 一种具有图像识别功能的数据处理系统,其特征是,包括:
远程数据采集终端,用于将采集的申报项目的数据信息存储到网络服务器的缓存区;
主计算机,用于调用网络服务器的缓存区的申报项目的数据信息并存储到主计算机的第一缓存区;采集的图片、Word和PDF文档数据以文件形式存储至主计算机的第二缓存区,将文档相对路径存储至项目申报数据库附件子数据表中;
查重判断模块,用于根据主计算机读取第一缓存区中的申报项目的信息,判断数据是否符合要求;对于图片文档,利用项目申报数据库附件子数据表中文档路径调用主计算机的第二缓存区图片文档,利用图像识别模块读取图片文档内容,判断与相对应数据子集是否相符,如果项目申报数据表中申报项目的信息及图片文档均符合要求就进入筛选模块,如果不符合就重新采集数据;
输出模块,用于将符合要求的项目数据从项目申报数据库同步到评审数据库;对评审数据库的申报信息进行三次筛选,并将最终数据输出在服务器的浏览页面上;
所述数据处理系统还包括数据分配模块,具体用于将与项目直接相关的数据存储到项目申报库主数据表中,与项目间接相关的数据存储到项目申报库各子数据表中,子数据表之间通过项目主键关联;申报数据库的子数据表中还存储有历史项目申报信息;
所述查重判断模块中,具体还包括选择模块,选择模块用于对主计算机读取第一缓存区中的项目申报库各子数据表存储的数据进行分词或者直接匹配,利用判断当前的申报项目的信息是否为项目名称或论文论著名称,如果是就进入关键词比较模块,如果不是,再进行判断是否为项目的完成人姓名及身份证号或知识产权号,如果是,则进入直接匹配模块;
关键词比较模块,用于将当前的申报项目的信息的项目名称或论文论著名称与历史项目申报信息中的另一申报项目的项目名称或论文论著名称的关键词比较,如果相似度不低于设定值,判定重复,否则不重复;
直接匹配模块,用于将当前的申报项目的信息项目的完成人姓名及身份证号或知识产权号与历史项目申报信息中的另一申报项目的项目完成人姓名及身份证号或知识产权号直接进行匹配,如果相同判定重复,否则不重复;
存储模块,用于将关键词比较模块及直接匹配模块判定不重复申报项目的信息存储到主计算机的缓存区,将判定重复的申报项目的信息存储到主计算机中的项目申报数据库查重表中;
所述关键词比较模块,具体包括:
关键词提取模块,用于取出当前申报项目的信息及历史项目申报信息中的一个,对取出的信息进行分词,将分解出的关键词分别存储到主计算机中项目申报数据库对应的两个数组中;
相似度模块,用于得出当前申报项目的信息与历史项目申报信息中的项目信息的相似度,将该相似度与设定值比较,如果相似度不低于设定值,判定重复,否则不重复;
所述利用关键词提取模块取出当前申报项目的信息及历史项目申报信息中的一个,对取出的信息进行分词,采用ShootSearch组件分词;
所述相似度模块具体用于比较项目申报数据库对应的两个数组中关键词数大小,取出较小关键词数,用相同关键词数除以较小关键词数得出相似度;
所述筛选模块包括一次筛选模块、二次筛选模块及三次筛选模块,所述一次筛选模块用于对符合要求的项目进行第一次筛选,根据项目信息遴选对应的网络评审专家,通过网络评审对同步到评审数据库中的数据进行筛选;将筛选出的申报项目数据存储到评审数据库中的第三缓存区;
所述二次筛选模块用于对存储到第三缓存区中的申报项目数据进行第二次筛选;根据项目信息遴选资深专家,对一次筛选模块中取出的数据进行专家投票,从投票结果中取出初步获奖项目,将初步获奖项目的数据存储到评审数据库中的第四缓存区;
所述三次筛选模块用于对存储到第四缓存区中的申报项目数据进行数据第三次筛选;根据项目信息遴选科技委员会专家,对二次筛选模块中取出的数据进行专家审核,从审核结果中取出最终获奖项目,将最终获奖项目存储到评审数据库中的第五缓存区;将存储在评审数据库中的第五缓存区中的最终获奖项目的数据输出;
所述一次筛选模块用于打分、二次筛选模块用于投票分等级、三次筛选模块用于投票表决。
4. 如权利要求3所述一种具有图像识别功能的数据处理系统,其特征是,所述筛选模块,具体包括:
筛选存储模块,用于调用科技项目学科信息并以数据集A的形式存储在评审数据库的子数据表中,评审数据库的子数据表中还存储有以数据集B的形式存储的专家学科信息;
一级学科提取模块,用于在数据集B中选取专家学科信息并作为条件因素,判断该专家学科信息的条件因素是否为一级学科,如果是,则将该条件因素与以数据集A的形式存储的科技项目学科信息的关键因素匹配,遍历专家学科信息中的条件因素是否包含关键因素,如果包含则匹配,否则不匹配;
二级学科提取模块,用于判断该专家信息的条件因素是否为二级学科,如果是,则将该条件因素与以数据集A的形式存储的科技项目信息的关键因素匹配,遍历专家信息中的条件因素是否包含关键因素,如果包含则匹配,否则不匹配;
三级学科提取模块,用于判断该专家信息的条件因素是否为三级学科,如果是,则将该条件因素与以数据集A的形式存储的科技项目信息的关键因素匹配,遍历专家信息中的条件因素是否包含关键因素,如果包含则匹配,否则不匹配;
随机数据生成模块,用于从存储的专家学科信息的数据集B中随机选取与科技项目相匹配的专家数量,并将取出的数据存储至评审数据库。”
驳回决定认为:权利要求1-4相对于对比文件1(CN1928902A,公开日为2007年03月14日)及对比文件2(CN103235774A,公开日为2013年08月07日)不具备创造性,具体为:权利要求1与对比文件1的区别特征在于:(1)数据存储到网络服务器的缓存区,主计算机调用网络服务器的缓存区的申报项目的数据信息并存储到主计算机的第一缓存区;采集的图片、Word和PDF文档数据以文件形式存储至主计算机的第二缓存区,将文档相对路径存储至项目申报数据库附件子数据表中;(2)主计算机读取第一缓存区中的申报项目/图片文档的信息,判断数据是否符合要求;对于图片文档,利用项目申报数据库附件子数据表中文档路径调用主计算机的第二缓存区图片文档,利用图像识别模块读取图片文档内容,完成单位盖章与完成单位数据表完成单位名称是否相符,如果项目申报数据表中申报项目的信息及图片文档均符合要求,将符合要求的项目数据从项目申报数据库同步到评审数据库,该同步过程采取单向同步;所述步骤二中,对项目申报库各子数据表存储的数据进行分词或者直接匹配,利用判断模块判断当前的申报项目的信息是否为项目名称或论文论著名称,如果是就进入关键词比较模块,如果不是,再进行判断是否为项目的完成人姓名及身份证号或知识产权号,如果是,则进入直接匹配模块; 利用关键词比较模块将当前的申报项目的信息的项目名称或论文论著名称与历史项目申报信息中的另一申报项目的项目名称或论文论著名称的关键词比较,如果相似度不低于设定值,判定重复,否则不重复;利用直接匹配模块将当前的申报项目的信息项目的完成人姓名及身份证号或知识产权号与历史项目申报信息中的另一申报项目的项目完成人姓名及身份证号或知识产权号直接进行匹配,如果相同判定重复,否则不重复;利用存储模块将关键词比较模块及直接匹配模块判定不重复申报项目的信息存储到主计算机的缓存区,将判定重复的申报项目的信息存储到主计算机中的项目申报数据库查重表中;所述关键词比较模块将当前的申报项目的信息的项目名称或论文论著名称与历史项目申 报信息中的另一申报项目的项目名称或论文论著名称的关键词比较,如果相似度不低于设定值,判定重复,否则不重复,具体过程为:利用关键词提取模块取出当前申报项目的信息及历史项目申报信息中的一个,对取出的信息进行分词,将分解出的关键词分别存储到主计算机中项目申报数据库对应的两个数组中;利用关键词匹配模块对项目申报数据库对应的两个数组中的关键词进行遍历循环比较,得出相同关键词数及各组关键词数;根据相似度模块得出当前申报项目的信息与历史项目申报信息中的项目信息的相似度,将该相似度与设定值比较,如果相似度不低于设定值,判定重复,否则不重复;所述利用关键词提取模块取出当前申报项目的信息及历史项目申报信息中的一个,对取出的信息进行分词,采用ShootSearch组件分词;所述相似度模块具体用于比较项目申报数据库对应的两个数组中关键词数大小,取出较小关键词数,用相同关键词数除以较小关键词数得出相似度;所述利用直接匹配模块将当前的申报项目的信息项目的完成人姓名及身份证号或知识产权号与历史项目申报信息中的另一申报项目的项目完成人姓名及身份证号或知识产权号直接进行匹配,具体为:将远程数据采集终端采集的申报项目的信息与申报数据库的子数据表中历史项目申报信息直接进行遍历循环匹配,判断是否匹配,如果匹配,则判定重复,否则,不重复;所述申报项目的信息包括项目名称、论文论著名称、项目的完成人姓名及身份证号及知识产权号,历史项目申报信息包括当前年度其他项目或近三年所有项目中的项目名称、论文论著名称、项目的完成人姓名及身份证号及知识产权号,知识产权号为专利申请号或者专利公开号。(3)申报信息进行三次筛选,第一次筛选是打分,第二次筛选是投票分等级,第三次筛选是投票表决,以及三次筛选的流程的具体存储方式;(4)将与项目直接相关的数据存储到项目申报库主数据表中,每条数据对应唯一项目编号,与项目间接相关的数据存储到项目申报库各子数据表中,子数据表中将唯一项目编号设置为外键与主数据表关联;申报数据库的子数据表中还存储有历史项目申报信息。
区别特征(1)、(3)和(4)为本领域公知常识,区别特征(2)部分被对比文件2公开,部分为本领域公知常识,权利要求1相对于对比文件1、对比文件2和本领域公知常识的结合不具备专利法第22条第3款规定的创造性;从属权利要求2的附加特征部分被对比文件1公开,部分为本领域公知常识,也不具备创造性;权利要求3是与权利要求1的方法步骤一一对应的装置权利要求,因此权利要求3相对于对比文件1、对比文件2和本领域公知常识的结合也不具备专利法第22条第3款规定的创造性;权利要求4与权利要求2对应,基于相同的理由和证据,也不具备创造性。
申请人(下称复审请求人)对上述驳回决定不服,于2018年04月20日向国家知识产权局提出了复审请求,但未修改申请文件。复审请求人认为:(1)权利要求1与对比文件1技术领域相同,都属于项目评审领域,但二者总的发明构思不同;本申请侧重于申报材料审批前,对大量申报材料数据预处理以及评审过程中的多级策略,从而减少冗余数据,避免后续对相同材料进行重复审批而导致的资源人力等的浪费,加快审核进度,提高评审质量;而对比文件1是终端接收提交的评审项目信息,根据请求消息选定评审专家进行评审,从而减少人为干预,避免评审之前信息泄露;(2)本申请所要解决的问题是如何对申报材料实现自动查重,即实现申报材料审批前的数据预处理;而对比文件1所要解决的问题是如何减少评审项目信息发送到评审专家之前的人为干预;(3)本申请最终实现“系统自动提取查重因素,进行复杂匹配度计算,减少人为因素,提高查重结果的公正和正确性,减轻工作人员工作量,极大提高工作效率”,而对比文件1是防止项目内容或专家信息被提前泄露。
经形式审查合格,国家知识产权局于2018年05月08日依法受理了该复审请求,并将其转送至原审查部门进行前置审查。
原审查部门在前置审查意见书中认为,对于复审请求人陈述的关于对比文件1的技术领域、解决的技术问题、技术效果与本申请不同的意见,都已在驳回决定的答复意见中进行陈述,参见驳回意见已经进行了充分的说理和现有技术举证,因而坚持原驳回决定。
随后,国家知识产权局成立合议组对本案进行审理。
在上述程序的基础上,合议组认为本案事实已经清楚,可以作出审查决定。
二、决定的理由
1、审查文本的认定
复审请求人在提交复审请求时未对申请文件做出修改,因此本复审决定所依据的审查文本和驳回决定所依据的文本相同,为:申请日2014年06月24日提交的说明书第1-157段、摘要附图、说明书附图图1-5;2014年09月12日提交的说明书摘要;2017年10月12日提交的权利要求第1-4项。
2、关于专利法第22条第3款
专利法第22条第3款规定:“创造性,是指与现有技术相比,该发明具有突出的实质性特点和显著的进步,该实用新型具有实质性特点和进步。”
如果权利要求请求保护的技术方案与作为最接近现有技术的对比文件公开的技术方案相比存在区别技术特征,该区别技术特征未被其他对比文件公开,并且也不是本领域的公知常识,且该区别技术特征的引入使得该权利要求的整体技术方案相对于现有技术而言具有有益的技术效果,那么该权利要求所要求保护的技术方案相对于现有技术具备突出的实质性特点和显著的进步,从而具备创造性。
本复审决定引用的对比文件与驳回决定引用的对比文件相同,即:
对比文件1:CN1928902A,公开日为2007年03月14日,并作为最接近的现有技术;
对比文件2:CN103235774A,公开日为2013年08月07日。
(2-1)权利要求1-2具备专利法第22条第3款规定的创造性。
权利要求1请求保护一种具有图像识别功能的数据处理方法,对比文件1公开了一种项目评审方法及系统,并具体公开了如下特征(说明书第1-5页):企业协作模块26提供企业协作办公平台,主要功能为:项目信息维护、项目申报、通知管理等;通过服务器以及与服务器相连的终端实现项目的评审,包括:通过互联网将待评审项目的信息传输到终端以公示项目信息(隐含公开了采集申报项目的数据,存储项目相关数据);读取来自终端的项目评审请求信息,并根据所述请求信息中的项目专家信息随机选取预定数量的评审专家;通过互联网将通知消息发送到选定的专家;在选定的评审专家身份验证后,服务器记录终端向其发送的项目评审意见信息,并在评审结束后通过网络公示评审结果,公示的方式包括网络个性化办公、电子邮件、办公自动化系统、移动短信等(相当于将最终数据输出在服务器的浏览页面上)。
权利要求1与对比文件1的区别特征在于:
(1)将采集的与项目直接相关的数据存储到项目申报库主数据表中,每条数据对应唯一项目编号,与项目间接相关的数据存储到项目申报库各子数据表中,子数据表中设置项目编号作为外键与主数据表关联;采集的图片、Word和PDF文档数据以文件形式存储至服务器缓存区,将文档相对路径存储至项目申报库附件子数据表中;
(2)步骤二:读取项目申报库主数据表及各子数据表中数据,判断数据是否符合要求;对于图片文档,利用项目申报库附件子数据表中文档路径调用服务器缓存区图片文档,利用图像识别模块读取图片文档内容,识别完成单位盖章与完成单位数据表完成单位名称是否相符,如果项目申报数据表中申报项目的信息及图片文档均符合要求就进入步骤三,如果不符合就返回步骤一;
所述步骤二中,对项目申报库各子数据表存储的数据进行分词或者直接匹配,利用判断模块判断当前的申报项目的信息是否为项目名称或论文论著名称,如果是就进入关键词比较模块,如果不是,再进行判断是否为项目的完成人姓名及身份证号或知识产权号,如果是,则进入直接匹配模块;利用关键词比较模块将当前的申报项目的信息的项目名称或论文论著名称与历史项目申报信息中的另一申报项目的项目名称或论文论著名称的关键词比较,如果相似度不低于设定值,判定重复,否则不重复;利用直接匹配模块将当前的申报项目的信息项目的完成人姓名及身份证号或知识产权号与历史项目申报信息中的另一申报项目的项目完成人姓名及身份证号或知识产权号直接进行匹配,如果相同判定重复,否则不重复;利用存储模块将关键词比较模块及直接匹配模块判定不重复申报项目的信息存储到服务器缓存区,将判定重复的申报项目的信息存储到项目申报数据库查重表中;所述关键词比较模块将当前的申报项目的信息的项目名称或论文论著名称与历史项目申报信息中的另一申报项目的项目名称或论文论著名称的关键词比较,如果相似度不低于设定值,判定重复,否则不重复,具体过程为:利用关键词提取模块取出当前申报项目的信息及历史项目申报信息中的一个,对取出的信息进行分词,将分解出的关键词分别存储到项目申报数据库对应的两个数组中;利用关键词匹配模块对项目申报数据库对应的两个数组中的关键词进行遍历循环比较,得出相同关键词数及各组关键词数;根据相似度模块得出当前申报项目的信息与历史项目申报信息中的项目信息的相似度,将该相似度与设定值比较,如果相似度不低于设定值,判定重复,否则不重复;所述利用关键词提取模块取出当前申报项目的信息及历史项目申报信息中的一个,对取出的信息进行分词,采用ShootSearch组件分词;所述相似度模块具体用于比较项目申报数据库对应的两个数组中关键词数大小,取出较小关键词数,用相同关键词数除以较小关键词数得出相似度;所述利用直接匹配模块将当前的申报项目的信息项目的完成人姓名及身份证号或知识产权号与历史项目申报信息中的另一申报项目的项目完成人姓名及身份证号或知识产权号直接进行匹配,具体为:将远程数据采集终端采集的申报项目的信息与申报数据库的子数据表中历史项目申报信息直接进行遍历循环匹配,判断是否匹配,如果匹配,则判定重复,否则,不重复;所述申报项目的信息包括项目名称、论文论著名称、项目的完成人姓名及身份证号及知识产权号,历史项目申报信息包括当前年度其他项目或近三年所有项目中的项目名称、论文论著名称、项目的完成人姓名及身份证号及知识产权号,知识产权号为专利申请号或者专利公开号;
(3)步骤三:将步骤二中符合要求的项目数据从项目申报数据库同步到评审数据库,该同步过程采取单向同步;对评审数据库的申报信息进行三次筛选;
所述步骤三中对评审数据库的申报信息进行三次筛选,具体为:对符合要求的评审数据库中的项目进行第一次筛选,根据项目信息遴选对应的网络评审专家,通过网络评审对同步到评审数据库中的数据进行筛选;将筛选出的申报项目数据存储到评审数据库中的第三缓存区;对存储到第三缓存区中的申报项目数据进行第二次筛选;根据项目信息遴选资深专家,对第一次筛选取出的数据进行专家投票,从投票结果中取出初步获奖项目,将初步获奖项目的数据存储到评审数据库中的第四缓存区;对存储到第四缓存区中的申报项目数据进行第三次筛选;根据项目信息遴选科技委员会专家,对第二次筛选中取出的数据进行专家审核,从审核结果中取出最终获奖项目,将最终获奖项目存储到评审数据库中的第五缓存区;所述第一次筛选是打分、第二次筛选是投票分等级、第三次筛选是投票表决。
基于上述区别技术特征,本申请实际要解决的技术问题是如何对大量项目评审数据实现查重处理以及多级筛选,减少数据冗余。
对于上述区别技术特征,合议组认为:
关于区别特征(1),将数据按照结构化和非结构化分类存储,以方便后续进行调用和做不同的处理,例如,数据存储至数据表中,文档数据以文件形式存储至服务器缓存区,进行图像识别读取图片文档内容,对项目申报库各子数据表存储的数据进行其他操作,这是本领域技术人员惯用的技术手段;
对于区别特征(3),对比文件1已经公开了进入专家协作模块,进行项目的评审,服务器记录终端向其发送的项目评审意见信息,在项目评审结束后,系统通过网络个性化办公等方式网络公示项目评审结果,根据对比文件1公开的内容,为了进一步提高评审结果的准确性和公平性,本领域技术人员很容易想到可以进行三级或多级评选机制,并采用不同级别专家进行打分、投票分等级和表决等方式,将每次筛选后的数据分别存储到数据库中不同的缓存区中以便于后续调用,这些都属于本领域技术人员惯用的技术手段;
关于区别特征(2),对比文件2公开了一种科技项目申请书特征词提取方法,并具体公开了如下特征(说明书第[0002]-[0003]段,摘要):由于目前科技项目管理信息系统建设的不健全,导致项目重复申报情况十分普遍,为有效杜绝这种现象,针对科技项目申请书信息进行文本相似度研究是非常有必要的;将申请书主要文本切分成子串序列并进行中科院ICTCLAS分词等操作,从而便于实现科技项目相似性检查;因此对比文件2公开了通过分词进行关键词比较的特征;
对本领域技术人员而言,在进行项目评审材料数据处理的过程中,为了实现合法性判断以及进行查重处理,减少冗余数据,避免人力资源浪费,加快审查进步并提高评审质量,判断数据是否符合要求,以及进行图片识别、信息对比这是本领域技术人员惯用手段;此外,项目完成人姓名、身份证号或者知识产权号等也是本领域技术人员进行项目查重时通常使用的关键词,属于本领域公知常识;
但是,对比文件1或对比文件2都没有公开利用关键词比较匹配以及相似度计算的具体过程,即:利用关键词提取模块提取出当前申报项目的信息及历史项目申报信息中的一个,对取出的信息进行分词,将分解出的关键词分别存储到项目申报数据库对应的两个数组中,利用关键词匹配模块对项目申报数据库对应的两个数组中的关键词进行遍历循环比较,得出相同关键词数及各组关键词数,根据相似度模块得出当前申报项目的信息与历史项目申报信息中的项目信息的相似度,将该相似度与设定值比较;并且利用关键词提取模块取出当前申报项目的信息及历史项目申报信息中的一个,对取出的信息进行分词,采用shootsearch组件分词,所述相似度模块具体用于比较项目申报数据库对应的两个数组中关键词大小,取出较小关键词数,用相同关键词数除以较小关键词数得出相似度;且上述利用关键词比较匹配以及相似度计算的具体过程并未被其他现有技术公开,也并非本领域技术人员解决相关技术问题所公知或惯用的技术手段;上述利用关键词比较匹配以及相似度计算的具体过程使得系数自动提取查重因素,进行复杂匹配计算,提高查重结果的公正和准确性,准确识别出重复申报的项目,避免误差和漏查,减轻工作人员工作量,提高工作效率;因此权利要求1请求保护的技术方案相对于对比文件1、对比文件2以及公知常识的结合是非显而易见的,并带来了有益的技术效果,因此具备突出的实质性特点和显著的进步,具备专利法第22条第3款规定的创造性。
权利要求2是权利要求1的从属权利要求,在权利要求1具备创造性的前提下,权利要求2也具备创造性。
(2-2)权利要求3-4具备专利法第22条第3款规定的创造性。
权利要求3是与权利要求1对应的装置权利要求,基于评述权利要求1相同的理由和证据,权利要求3也具备创造性。
权利要求4是权利要求3的从属权利要求,在权利要求3具备创造性的前提下,权利要求4也具备创造性。
3、关于驳回和前置审查意见
对于驳回决定和前置审查中的意见(参见案由部分),合议组认为:对比文件1或对比文件2没有公开利用关键词比较匹配以及相似度计算的过程,并且上述区别技术特征也并非本领域用于解决相应技术问题所惯用的技术手段,上述区别特征的引入使得该权利要求的整体技术方案相对于现有技术而言具有有益的技术效果,因此权利要求1-4具备创造性,符合专利法第22条第3款的规定。
至于本申请是否还存在其他不符合专利法及其实施细则的缺陷,均留待原审查部门继续审查。
三、决定
撤销国家知识产权局于2018年02月24日对本申请作出的驳回决定。由国家知识产权局原审查部门在本决定针对的审查文本的基础上对本申请继续进行审查:申请日2014年06月24日提交的说明书第1-157段、摘要附图、说明书附图图1-5;2014年09月12日提交的说明书摘要;2017年10月12日提交的权利要求第1-4项。
如对本复审请求审查决定不服,根据专利法第41条第2款的规定,复审请求人可以自收到本决定之日起三个月内向北京知识产权法院起诉。
郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如作者信息标记有误,请第一时间联系我们修改或删除,多谢。