发明创造名称:事件序列上频繁闭情节的挖掘方法
外观设计名称:
决定号:194951
决定日:2019-11-11
委内编号:1F272342
优先权日:
申请(专利)号:201711129050.X
申请日:2017-11-14
复审请求人:泰州学院
无效请求人:
授权公告日:
审定公告日:
专利权人:
主审员:李宁
合议组组长:李燕东
参审员:王楠
国际分类号:G06F17/30
外观设计分类号:
法律依据:专利法第22条第3款
决定要点
:如果一项权利要求所要求保护的技术方案与作为最接近的现有技术的对比文件相比存在区别技术特征,但是其他对比文件给出了将该区别技术特征应用到该最接近的现有技术以得到该权利要求的技术方案的技术启示,从而使得本领域技术人员在现有技术的基础上得到该权利要求的技术方案是显而易见的,那么该权利要求所要求保护的技术方案不具备创造性。
全文:
本复审请求涉及申请号为201711129050.X,名称为“事件序列上频繁闭情节的挖掘方法”的发明专利申请(下称本申请)。申请人为泰州学院。本申请的申请日为2017年11月14日,公开日为2018年03月23日。
经实质审查,国家知识产权局原审查部门于2019年01月07日发出驳回决定,驳回了本申请,其理由是:权利要求1不具备专利法第22条第3款规定的创造性。
驳回决定引用以下对比文件,其中对比文件1是最接近的现有技术:
对比文件1:“基于最小且非重叠发生的频繁闭情节挖掘”,朱辉生等,计算机研究与发展,第50卷,第4期,第852-860页,公开日为2013年04月15日;
对比文件2:“基于情节规则匹配的数据流预测研究”,朱辉生,中国博士学位论文全文数据库信息科技辑,第12期,第1-78页,公开日为2011年12月15日。
驳回决定所依据的文本为:申请日2017年11月14日提交的说明书摘要、说明书第1-52段、说明书附图图1-9、摘要附图;2018年07月17日提交的权利要求第1项。
驳回决定认为:
权利要求1要求保护一种事件序列上频繁闭情节的挖掘方法,对比文件1公开了一种基于最小且非重叠发生的频繁闭情节挖掘方法,权利要求1请求保护的技术方案与对比文件1公开的技术内容相比,区别技术特征是:权利要求1中频繁情节集具体为频繁情节前缀树的形式;权利要求1中步骤S1具体为:频繁情节前缀树是一棵有向根树,树中的每个结点Nα表示为一个五元组(label,mo,mano,closed,children),其中:label为结点Nα对应的事件类型,根结点的label为空,从根结点开始按深度遍历到结点Nα的路径上所有label的串接表示频繁情节α;mo为结点Nα对应的频繁情节α的最小发生集,根结点的mo为空;mano为结点Nα对应的频繁情节α的最早出现的最小且非重叠发生集,根结点的mano为空; children为指向结点Nα的孩子结点的指针,且这些指针按照所指孩子结点的lable的字典序排列,所有叶结点的children为空。而上述区别技术特征已被对比文件2公开。因此,在对比文件1的基础上结合对比文件2得到权利要求1所请求保护的技术方案对本领域技术人员来说是显而易见的,权利要求1的技术方案不具有突出的实质性特点和显著的进步,因而不具备创造性。
驳回决定所针对的权利要求书如下:
“1. 一种事件序列上频繁闭情节的挖掘方法,其特征在于:包括以下步骤,
S1、初始化频繁情节前缀树;步骤S1具体为,频繁情节前缀树是一棵有向根树,树中的每个结点Nα表示为一个五元组(label,mo,mano,closed,children),其中:label为结点Nα对应的事件类型,根结点的label为空,从根结点开始按深度遍历到结点Nα的路径上所有label的串接表示频繁情节α;mo为结点Nα对应的频繁情节α的最小发生集,根结点的mo为空;mano为结点Nα对应的频繁情节α的最早出现的最小且非重叠发生集,根结点的mano为空;closed为结点Nα对应的频繁情节α的闭合性,初始时均为0,表示闭合待定;children为指向结点Nα的孩子结点的指针,且这些指针按照所指孩子结点的lable的字典序排列,所有叶结点的children为空;S2、扫描事件序列,计算频繁1-情节,并将相应结点添加至频繁情节前缀树,因为1-情节的最小发生集等于其最小且非重叠发生集,因此求得所有频繁1-情节,在情节前缀树中添加频繁1-情节结点,置各自闭合性标志为0;S3、以每个频繁i-情节α为前缀、每个频繁1-情节e为后缀进行情节增长,从而发现频繁(i 1)-情节concat(α,e),计算concat(α,e)的闭合性,并将相应结点添加至频繁情节前缀树,再以concat(α,e)为前缀、每个频繁1-情节e为后缀进行情节增长,直至不能发现新的频繁情节为止;S4、引入非闭合一致性,若情节α存在一个与其最小发生集相同的中间扩展,则α及以α为前缀的所有情节均为非闭合情节,进一步压缩频繁闭情节的搜索空间。”
申请人(下称复审请求人)对上述驳回决定不服,于2019年01月28日向国家知识产权局提出了复审请求,未提交修改文件。复审请求人认为:(1)权利要求1相对于最接近的现有技术对比文件1的区别特征为:初始化频繁情节前缀树;步骤S1具体为,频繁情节前缀树是一棵有向根树,树中的每个结点Na表示为一个五元组(label,mo,mano,closed,children),其中:label为结点Na对应的事件类型,根结点的label为空,从根结点开始按深度遍历到结点Na的路径上所有label的串接表示频繁情节a;mo为结点Na对应的频繁情节a的最小发生集,根结点的mo为空;mano为结点Na对应的频繁情节a的最早出现的最小且非重叠发生集,根结点的mano为空;closed为结点Na对应的频繁情节a的闭合性,初始时均为0,表示闭合待定;children为指向结点Na的孩子结点的指针,且这些指针按照所指孩子结点的lable的字典序排列,所有叶结点的children为空。(2)频繁情节和频繁闭情节,是不同的两个概念,对应的树的结点形式完全不同,树的维护过程更不相同,尤其是进一步压缩树的搜索空间的优化技术也不相同。复审请求人认为,对比文件1使用一个集合来存储发现的所有频繁闭情节,对比文件2中是用频繁情节前缀树存储发现的所有频繁情节,而到目前为止,尚未有文献报道使用频繁情节前缀树来存储发现的所有频繁闭情节。对比文件1使用一个集合来存储发现的所有频繁闭情节,对比文件2与对比文件1采用不同的存储形式,并且存储不同内容,解决技术问题不同,也不是解决本申请所需要克服的挖掘质量,挖掘效率等问题。
经形式审查合格,国家知识产权局于2019年02月11日依法受理了该复审请求,并将其转送至原审查部门进行前置审查。
原审查部门在前置审查意见书中认为:
复审请求人认定的区别特征与在驳回决定中认定的区别技术特征一致:(1)至于本申请中频繁闭情节与对比文件2中频繁情节之间的差异,实际上体现在对比文件2中频繁情节前缀树的结点表示为四元组(label,mo,mano,children),相对于本申请中的五元组(label,mo,mano,closed,children),缺少一个closed字段,除此之外本申请与对比文件2中频繁情节前缀树的结点形式基本一致,因此原审查部门无法认同复审请求人所述的“频繁情节和频繁闭情节,是不同的两个概念,对应的树的结点形式完全不同”。而closed字段已由对比文件1公开,该字段包含在对比文件1的频繁情节集中(参见驳回决定中对于权利要求1的驳回理由)。由于对比文件2公开的频繁情节前缀树及其结构在对比文件2中所起的作用与其在本申请中为解决其技术问题所起的作用相同,都是通过构建前缀树来维护挖掘过程中的必须信息,由此可见,对比文件2给出了将频繁情节前缀树及其结构应用到对比文件1中频繁情节集以及其中包括的closed字段中的启示,从而得到频繁情节集具体为频繁情节前缀树的形式,且树中的每个结点表示为一个五元组(label,mo,mano,closed,children)。根据上述分析,复审请求人所述尚未有文献报道的“使用频繁情节前缀树来存储发现的所有频繁闭情节”实际上已由对比文件1结合对比文件2公开。至于具体的“维护过程”以及“搜索空间的优化技术”则都已由对比文件1公开。(2)对比文件2与对比文件1虽然采用不同的存储形式、存储不同内容,但这并不能说明解决的技术问题不同、没有结合启示。权利要求1相对于对比文件1的区别技术特征为对比文件2中披露的相关技术手段,该技术手段在对比文件2中所起的作用与该区别技术特征在本发明中为解决其技术问题所起的作用相同,都是通过构建前缀树来维护挖掘过程中的必须信息,这正是《审查指南》第二部分第四章3.2.1.1关于如何判断要求保护的发明相对于现有技术是否显而易见的判断方法中明确规定的能够确定现有技术整体上存在技术启示的情况。
根据上述分析,本领域技术人员可以预期,对比文件1结合对比文件2所形成的方案能够达到复审请求人所述的降低内存开销、保证挖掘质量、提高挖掘效率、压缩频繁闭情节的搜索空间的技术效果。综上,权利要求1不符合专利法第22条第3款的规定,不具备创造性。因而原审查部门坚持原驳回决定。
随后,国家知识产权局会成立合议组对本案进行审理。
合议组于2019 年06月26日向复审请求人发出复审通知书,指出:权利要求1请求保护的技术方案与对比文件1公开的技术内容相比,其区别技术特征为:权利要求1中频繁情节集为频繁情节前缀树的形式,初始化频繁情节前缀树具体为:频繁情节前缀树是一棵有向根树,树中的每个结点Nα表示为一个五元组 (label,mo,mano,closed,children),其中:label为结点Nα对应的事件类型,根结点的label为空,从根结点开始按深度遍历到结点Nα的路径上所有label的串接表示频繁情节α;mo为结点Nα对应的频繁情节α的最小发生集,根结点的mo为空;mano为结点Nα对应的频繁情节α的最早出现的最小且非重叠发生集,根结点的mano为空;closed为结点Na对应的频繁情节a的闭合性,初始时均为0,表示闭合待定;children为指向结点Nα的孩子结点的指针,且这些指针按照所指孩子结点的lable的字典序排列,所有叶结点的children为空。对于上述区别技术特征,对比文件2已经公开了相关内容,基于对比文件2公开的内容,本领域技术人员容易想到将频繁情节前缀树及其结构应用到对比文件1中频繁情节集,并同时采用字段closed来判断频繁情节是否为频繁闭情节,从而得到频繁情节集具体为频繁情节前缀树的形式,且树中的每个结点Nα表示为一个五元组(label,mo,mano,closed,children),即上述区别技术特征中所限定的处理方式。由此可知,在对比文件1的基础上结合对比文件2得到权利要求1请求保护的技术方案对本领域技术人员来说是显而易见的,因此权利要求1不具有突出的实质性特点和显著的进步,不具备创造性。
复审请求人于2019年08月07日提交了意见陈述书,未提交修改文件。复审请求人认为:
(1)相对于最接近的现有技术对比文件1的区别特征为:初始化频繁情节前缀树;步骤S1具体为,频繁情节前缀树是一棵有向根树,树中的每个结点Na表示为一个五元组(label,mo,mano,closed,children),其中:label为结点Na对应的事件类型,根结点的label为空,从根结点开始按深度遍历到结点Na的路径上所有label的串接表示频繁情节a;mo为结点Na对应的频繁情节a的最小发生集,根结点的mo为空;mano为结点Na对应的频繁情节a的最早出现的最小且非重叠发生集,根结点的mano为空;closed为结点Na对应的频繁情节a的闭合性,初始时均为0,表示闭合待定;children为指向结点Na的孩子结点的指针,且这些指针按照所指孩子结点的lable的字典序排列,所有叶结点的children为空。
(2)频繁情节和频繁闭情节,是不同的两个概念,对应的树的结点形式完全不同,树的维护过程更不相同,尤其是进一步压缩树的搜索空间的优化技术也不相同。复审请求人认为,对比文件1使用一个集合来存储发现的所有频繁闭情节,对比文件2中是用频繁情节前缀树存储发现的所有频繁情节,而到目前为止,尚未有文献报道使用频繁情节前缀树来存储发现的所有频繁闭情节。对比文件1使用一个集合来存储发现的所有频繁闭情节,对比文件2与对比文件1采用不同的存储形式,并且存储不同的内容,解决的技术问题不同,也不是解决本申请所需要克服的挖掘质量,挖掘效率等问题。本申请的有益效果是:该种事件序列上频繁闭情节的挖掘方法,基于最小且非重叠发生计数的情节支持度定义,采用情节前缀树的数据结构和深度优先的搜索策略,降低了内存开销,保证了挖掘质量,提高了挖掘效率,引入了非闭合一致性的优化技术,进一步压缩了频繁闭情节的搜索空间。
在上述程序的基础上,合议组认为本案事实已经清楚,可以作出审查决定。
二、决定的理由
1.审查文本的认定
复审请求人在答复复审通知书时未提交修改文件,因此本审查决定所针对的文本为:申请日2017年11月14日提交的说明书摘要、说明书第1-52段、说明书附图图1-9、摘要附图;2018年07月17日提交的权利要求第1项。
2、关于专利法第22条第3款
专利法第22条第3款规定:创造性,是指与现有技术相比,该发明具有突出的实质性特点和显著的进步,该实用新型具有实质性特点和进步。
如果一项权利要求所要求保护的技术方案与作为最接近的现有技术的对比文件相比存在区别技术特征,但是其他对比文件给出了将该区别技术特征应用到该最接近的现有技术以得到该权利要求的技术方案的技术启示,从而使得本领域技术人员在现有技术的基础上得到该权利要求的技术方案是显而易见的,那么该权利要求所要求保护的技术方案不具备创造性。
本复审决定引用的对比文件与驳回决定及复审通知书中引用的对比文件相同,即:
对比文件1:“基于最小且非重叠发生的频繁闭情节挖掘”,朱辉生等,计算机研究与发展,第50卷,第4期,第852-860页,公开日为2013年04月15日;
对比文件2:“基于情节规则匹配的数据流预测研究”,朱辉生,中国博士学位论文全文数据库信息科技辑,第12期,第1-78页,公开日为2011年12月15日。
其中对比文件1为最接近的现有技术。
权利要求1不具备专利法第22条第3款规定的创造性。
权利要求1要求保护一种事件序列上频繁闭情节的挖掘方法。对比文件1公开了一种基于最小且非重叠发生的频繁闭情节挖掘方法,用于有效地发现一个给定事件序列上的频繁闭情节(参见第853页左栏第3段,相当于事件序列上频繁闭情节的挖掘),并具体公开了(参见第852-860页):事件序列S上的频繁闭情节集FCE;Let FE=FCE=Φ(参见第854页左栏第4段,相当于S1、初始化频繁情节集);单遍扫描事件序列S,以发现所有频繁1-情节,置其的闭合性标志closed为0,并将所有频繁1-情节按字典序存储在FE中;α的闭合性待定,其闭合性标志为0(参见第854页左栏第4段、右栏第2段,相当于频繁情节集中包括closed,closed为频繁情节α的闭合性,初始时均为0,表示闭合待定)。
Clo_episode算法基于最小发生来计算一个情节的支持度,由于最小发生之间可能会产生重叠,因此,该算法容易导致情节发生的“过计数”问题;本文提出了一个频繁闭情节挖掘算法FCEMiner,采用最小且非重叠的发生来计算一个情节的支持度,避免了情节发生的“过计数”问题,保证了频繁闭情节的挖掘质量;单遍扫描事件序列S,以发现所有频繁1-情节,置其的闭合性标志closed为0,并将所有频繁1-情节按字典序存储在FE中(参见第853页左栏第2-3段、第854页左栏第3-4段,相当于S2、扫描事件序列,计算频繁1-情节,并将相应结点添加至频繁情节集,因为1-情节的最小发生集等于其最小且非重叠发生集,因此求得所有频繁1-情节,在情节集中添加频繁1-情节结点,置各自闭合性标志为0)。
然后以已发现的一个频繁i-情节α为前缀、一个频繁1-情节e为后缀进行情节增长;若concat(α,e)为非频繁情节,则无需以concat(α,e)为前缀进行情节增长;若concat(α,e)为频繁情节,置其闭合性标志为0,然后进行α的一次闭合性检查;算法接着以concat(α,e)为前缀递归地进行下一层次的情节增长,直至没有任何情节可以增长;IF α.closed=0,Let FCE=FCE∪α(参见第854页左栏第3-4段,相当于S3、以每个频繁i-情节α为前缀、每个频繁1-情节e为后缀进行情节增长,从而发现频繁(i 1)-情节concat(α,e),计算concat(α,e)的闭合性,并将相应结点添加至频繁情节集,再以concat(α,e)为前缀、每个频繁1-情节e为后缀进行情节增长,直至不能发现新的频繁情节为止)。
特殊前向扩展的非闭一致性:若情节α存在一个与其最小发生集相同的中间扩展,则α及以α为前缀的所有情节均为非闭情节;FCEMiner采用深度优先的搜索策略并结合特殊前向扩展的非闭一致性,缩小了频繁闭情节的搜索空间,提高了频繁闭情节的挖掘效率(参见第853页左栏第3段、第856页左栏第4段,相当于S4、引入非闭合一致性,若情节α存在一个与其最小发生集相同的中间扩展,则α及以α为前缀的所有情节均为非闭合情节,进一步压缩频繁闭情节的搜索空间)。
权利要求1所要保护的技术方案与对比文件1所公开的内容相比,区别技术特征在于:权利要求1中频繁情节集为频繁情节前缀树的形式,初始化频繁情节前缀树具体为:频繁情节前缀树是一棵有向根树,树中的每个结点Nα表示为一个五元组 (label,mo,mano,closed,children),其中:label为结点Nα对应的事件类型,根结点的label为空,从根结点开始按深度遍历到结点Nα的路径上所有label的串接表示频繁情节α;mo为结点Nα对应的频繁情节α的最小发生集,根结点的mo为空;mano为结点Nα对应的频繁情节α的最早出现的最小且非重叠发生集,根结点的mano为空;closed为结点Na对应的频繁情节a的闭合性,初始时均为0,表示闭合待定;children为指向结点Nα的孩子结点的指针,且这些指针按照所指孩子结点的lable的字典序排列,所有叶结点的children为空。基于上述区别技术特征,权利要求1实际解决的技术问题是:如何维护数据挖掘过程中的相关信息。
对于上述区别技术特征,对比文件2公开了一种基于情节规则匹配的数据流预测方法,并具体公开了(参见第19-20页):我们提出的算法MANEPI使用了频繁情节前缀树这种数据结构来存储已发现的频繁情节;频繁情节前缀树FEPT是一棵有向根树,树中的每个结点Nα表示为一个四元组(label,mo,mano,children),其中label为结点Nα对应的事件类型,根结点的label为空,从根结点开始按深度遍历到结点Nα的路径上所有label的串接表示频繁情节α;mo为结点Nα对应的频繁情节α的最小发生集,根结点的mo为空;mano为结点Nα对应的频繁情节α的最早出现的最小且非重叠发生集,根结点的mano为空;children为指向结点Nα的孩子结点的指针,且这些指针按照所指孩子结点的lable的字典序排列,所有叶结点的children为空(相当于频繁情节前缀树是一棵有向根树,树中的每个结点Nα表示为一个四元组 (label,mo,mano,children),其中:label为结点Nα对应的事件类型,根结点的label为空,从根结点开始按深度遍历到结点Nα的路径上所有label的串接表示频繁情节α;mo为结点Nα对应的频繁情节α的最小发生集,根结点的mo为空;mano为结点Nα对应的频繁情节α的最早出现的最小且非重叠发生集,根结点的mano为空;children为指向结点Nα的孩子结点的指针,且这些指针按照所指孩子结点的lable的字典序排列,所有叶结点的children为空)。上述特征在对比文件2中所起的作用与其在本发明中为解决其技术问题所起作用相同,都是通过构建前缀树来维护数据挖掘过程中的频繁情节信息的。对比文件2中公开的是用频繁情节前缀树这种数据结构来存储已发现的频繁情节、且其中树中的每个结点Nα表示为一个四元组;而对比文件1中已经公开了采用闭合性标志closed来判断频繁情节的闭合性,为了同时存储所发现的频繁情节的闭合性信息,由对比文件2前文所公开的内容,本领域技术人员容易想到将频繁情节前缀树及其结构应用到对比文件1中频繁情节集,并同时采用字段closed来判断频繁情节是否为频繁闭情节,从而得到频繁情节集具体为频繁情节前缀树的形式,且树中的每个结点Nα表示为一个五元组(label,mo,mano,closed,children),即上述区别技术特征中所限定的处理方式。
由上可知,在对比文件1的基础上结合对比文件2从而得到该权利要求的技术方案,对本领域技术人员来说是显而易见的,因此该权利要求不具有突出的实质性特点和显著的进步,不符合专利法第22条第3款有关创造性的规定。
3.对复审请求人相关意见的评述
针对复审请求人的相关意见,合议组认为:
(1)复审请求人所认定的区别技术特征与前文评述部分认定的区别技术特征实质相同。对于上述区别特征,对比文件2公开了一种基于情节规则匹配的数据流预测方法,并具体公开了:“我们提出的算法MANEPI使用了频繁情节前缀树这种数据结构来存储已发现的频繁情节;频繁情节前缀树FEPT是一棵有向根树,树中的每个结点Nα表示为一个四元组(label,mo,mano,children),其中label为结点Nα对应的事件类型,根结点的label为空,从根结点开始按深度遍历到结点Nα的路径上所有label的串接表示频繁情节α;mo为结点Nα对应的频繁情节α的最小发生集,根结点的mo为空;mano为结点Nα对应的频繁情节α的最早出现的最小且非重叠发生集,根结点的mano为空;children为指向结点Nα的孩子结点的指针,且这些指针按照所指孩子结点的lable的字典序排列,所有叶结点的children为空(相当于频繁情节前缀树是一棵有向根树,树中的每个结点Nα表示为一个四元组 (label,mo,mano,children),其中:label为结点Nα对应的事件类型,根结点的label为空,从根结点开始按深度遍历到结点Nα的路径上所有label的串接表示频繁情节α;mo为结点Nα对应的频繁情节α的最小发生集,根结点的mo为空;mano为结点Nα对应的频繁情节α的最早出现的最小且非重叠发生集,根结点的mano为空;children为指向结点Nα的孩子结点的指针,且这些指针按照所指孩子结点的lable的字典序排列,所有叶结点的children为空)。”上述特征在对比文件2中所起的作用与其在本发明中为解决其技术问题所起作用相同,都是通过构建前缀树来维护数据挖掘过程中的频繁情节信息的。对比文件2中公开的是用频繁情节前缀树这种数据结构来存储已发现的频繁情节、且其中树中的每个结点Nα表示为一个四元组;而对比文件1中已经公开了采用闭合性标志closed来判断频繁情节的闭合性,为了同时存储所发现的频繁情节的闭合性信息,由对比文件2前文所公开的内容,本领域技术人员容易想到将频繁情节前缀树及其结构应用到对比文件1中频繁情节集,并同时采用字段closed来判断频繁情节是否为频繁闭情节,从而得到频繁情节集具体为频繁情节前缀树的形式,且树中的每个结点Nα表示为一个五元组(label,mo,mano,closed,children),即上述区别技术特征中所限定的处理方式。
(2)频繁情节与频繁闭情节虽然是不同的两个概念,但权利要求1也是采用频繁情节前缀树来存储发现的所有频繁情节,只不过相对于对比文件2的四元组多采用了一个closed字段来标识频繁情节的闭合性,而对比文件1已经公开了该字段,结合对比文件1公开的closed字段是容易得到权利要求1中的每个节点的五元组表示方式的。如前文评述部分,对比文件1结合对比文件2 容易得到权利要求1的技术方案,从而能够达到复审请求人所述的降低内存开销、保证挖掘质量、提高挖掘效率、压缩频繁闭情节的搜索空间的技术效果。
综上,对于复审请求人的陈述意见,合议组不予接受。
三、决定
维持国家知识产权局于2019年01月07日对本申请作出的驳回决定。
如对本复审请求审查决定不服,根据专利法第41条第2款的规定,复审请求人可自收到本审查决定之日起三个月内向北京知识产权法院起诉。
郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如作者信息标记有误,请第一时间联系我们修改或删除,多谢。