发明创造名称:一种基于压缩感知的人脸识别方法
外观设计名称:
决定号:183704
决定日:2019-07-15
委内编号:1F268752
优先权日:
申请(专利)号:201510309822.2
申请日:2015-06-08
复审请求人:浙江科技学院
无效请求人:
授权公告日:
审定公告日:
专利权人:
主审员:郑嘉青
合议组组长:朱晓莉
参审员:宋芸芸
国际分类号:G06K9/00
外观设计分类号:
法律依据:专利法第22条第3款
决定要点
:如果一项权利要求的技术方案与作为最接近现有技术的对比文件相比存在区别技术特征,其中上述区别技术特征的一部分不是本领域公知常识,并且上述区别技术特征的存在使得该项权利要求具备有益的技术效果,则该项权利要求相对于该对比文件和本领域公知常识的结合具备创造性。
全文:
本复审请求涉及申请号为201510309822.2,名称为“一种基于压缩感知的人脸识别方法”的发明专利申请(下称本申请)。申请人为浙江科技学院。本申请的申请日为2015年06月08日,公开日为2015年09月30日。
经实质审查,国家知识产权局原审查部门于2018年11月01日发出驳回决定,驳回了本申请,其理由是:权利要求1与对比文件1(“Alternating Optimization of Sensing Matrix and Sparsifying Dictionary for Compressed Sensing”,Huang Bai et al,IEEE TRANSACTIONS OF SIGNAL PROCESSING,第63卷,第6期,2015年03月15日,第1581-1593页)的区别技术特征在于:(1)对比文件1应用于图像识别中,而本申请应用在人脸图像的识别中;(2)在步骤S1之前还包括:S0、输入初始条件,所述初始条件包括P个人人脸部样本构成的脸库样本以及测试人脸图像x0;上述区别技术特征为本领域惯用手段,因此权利要求1相对于对比文件1和本领域惯用手段的结合不具备专利法第22条第3款所规定的创造性。
驳回决定所依据的文本为:2018年03月03日提交的权利要求第1项,申请日2015年06月08日提交的说明书第1-134段、说明书附图图1-4、说明书摘要和摘要附图。驳回决定所针对的权利要求书如下:
“1. 一种基于压缩感知的人脸识别方法,其特征在于,包括以下步骤:
S1、根据人脸样本,按照设定要求构造字典库Ψ=[Ψ1,...,Ψp,...,ΨP],将测试人脸图像x0预处理形成列向量x;
S2、根据构造字典库Ψ设计投影矩阵Φ;
S3、将列向量x在投影矩阵Φ下的投影值y输入函数 求解当p从1遍历到P后,求得所有的其中,P为个人脸部样本的数量,Vp、∑p和由投影矩阵Φ、字典库Ψ及输入投影值y求得,为任意尺寸为的向量;通过函数 对进行判别,输出判别类型其中,其中称为投影矩阵;是第p个人的样本集合, 是字典子块p的稀疏系数;
S4、根据所述输出判别类型重建图像数据为重排列得到重构图像;
在步骤S1之前还包括
S0、输入初始条件,所述初始条件包括P个人人脸部样本构成的脸库样本以及测试人脸图像x0;
步骤S1中,所述字典库是的构造过程包括以下步骤:
假设一个人脸库中存储有P个人脸部样本,其中,每个人又都有许多不同角度、不同表情、不同光照的样本,每个样本的尺寸均相同;
对每个人随机选中其Q个不同的样本,每个样本图像按照同样的排列规则形成一个列向量并分别做l2范数归一化处理,尺寸设为N×1,作为字典库中的一个原子,形成字典库:
对任意的1≤p≤P,字典子块是第p个人的样本集合,其中,L=PQ;对1≤l≤L,且||ψl||2=1是字典的一个列向量;
步骤S2中,所述投影矩阵Φ用函数定义为:
其中,U是任意尺寸为M×M的正交矩阵;V22是任意尺寸为的正交矩阵;UΨ是对Ψ的SVD分解的U矩阵,对W11分解特征值V11。”
申请人(下称复审请求人)对上述驳回决定不服,于2018年12月05日向国家知识产权局提出了复审请求,未修改权利要求书。复审请求人认为:1、字典利用训练样本进行构造确实容易想到,但是本申请的创造性在构造的目标函数Gt上,不同的目标函数Gt,会得到不同的φ。并且目标函数Gt是影响优化识别性能的主要因素。基于该目标函数优化的人脸识别性能有明显提升。如果说目标函数构造目标函数没有创新性,那么现在各类科研工作者的算法研究就没有任何意义,因为他们的算法都是针对目标函数优化的具体实施过程。2、驳回决定在错误确定技术问题的基础上,用本申请说明书中记载的解决问题的技术手段来否定本申请的创造性,充当“事后诸葛亮”;根据对比文件,并不能显而易见地得到本申请技术方案。3、驳回决定把权利要求书中的不可或缺和预料不到的技术效果和区别技术特征予以刻意的回避,对不属于权利要求书的已有的公知常识却大写特写,硬说成是构成“该权利要求所要求保护的技术方案”的内容。
经形式审查合格,国家知识产权局于2019年02月12日依法受理了该复审请求,并将其转送至原审查部门进行前置审查。
原审查部门在前置审查意见书中认为,第一:复审请求中陈述的:本申请和对比文件1的目标优化函数不一样,本申请以训练样本相关性为基础,调整类内与类间相关性得到Φ,对比文件1中Φ是随机矩阵。由于在目前权利要求1中并未限定目标优化函数的具体内容,因此,在评述其技术方案的创造性时不予考虑。第二:在确定技术问题时,是基于区别技术特征的技术效果来确定的,则依据权利要求1与对比文件1之间的区别技术特征:(1)对比文件1应用于图像识别中,而本申请应用在人脸图像的识别中;(2)在步骤S1之前还包括 :S0、输入初始条件,所述初始条件包括P个人人脸部样本构成的脸库样本以及测试人脸图像x0。确定其要解决的技术问题:如何给出一种人脸图像识别方式。第三:由于在上述意见陈述中,并未指出权利要求书中的不可或缺和预料不到的技术效果和区别技术特征的具体内容,也未具体指出不属于权利要求书的已有的公知常识的具体内容,因此,审查员对上述意见陈述第3点的内容不予考虑。因而坚持原驳回决定。
随后,国家知识产权局成立合议组对本案进行审理。
在上述程序的基础上,合议组认为本案事实已经清楚,可以作出审查决定。
二、决定的理由
审查文本的认定
复审请求人在提交复审请求时未修改申请文件,本复审请求审查决定所针对的审查文本为:2018年03月03日提交的权利要求第1项,申请日2015年06月08日提交的说明书第1-134段、说明书附图图1-4、说明书摘要和摘要附图。
具体理由的阐述
专利法第22条第3款规定:“创造性,是指与现有技术相比,该发明有突出的实质性特点和显著的进步,该实用新型有实质性特点和进步。”
如果一项权利要求的技术方案与作为最接近现有技术的对比文件相比存在区别技术特征,其中上述区别技术特征的一部分不是本领域公知常识,并且上述区别技术特征的存在使得该项权利要求具备有益的技术效果,则该项权利要求相对于该对比文件和本领域公知常识的结合具备创造性。
本复审决定评述权利要求的创造性所引用的对比文件与驳回决定所引用的对比文件相同,即:
对比文件1:“Alternating Optimization of Sensing Matrix and Sparsifying Dictionary for Compressed Sensing”, Huang Bai et al, IEEE TRANSACTIONS OF SIGNAL PROCESSING,第63卷,第6期,第1581-1593页,公开日为:2015年03月15日。
权利要求1请求保护一种基于压缩感知的人脸识别方法。对比文件1公开了一种针对压缩感知的感应矩阵和稀疏字典的交叉优化,并公开了如下技术特征(参见对比文件1第1581页左栏第1行-右栏第20行,第1583页左栏第27-54行,第1586页左栏倒数第2行-右栏18行):
压缩感知(CS)为对从测量向量中准确恢复信号向量进行处理的数学框架,,并且其中,测量范例包括通过仔细挑选的感应矩阵对信号向量进行线性投影:
因为,所以公式(1)给出的从测量值y对原始信号x的恢复为一欠定问题,其有无穷解。因此,添加求解x的额外约束,以使其唯一。x的稀疏性为CS理论中的这样一种约束,其可以保证y与x之间的映射为一对一。
令,为其第k个元素,向量v的lp范数被定义为:
注意到并非为严格意义上的的范数。为方便起见,用来指代v中的非零元素。令,在CS框架下,原始信号被假定为如下形式:
其中,Ψ被称为字典,其列为,称为原子。若,公式(2)给出的向量x即为所谓的Ψ中的K-稀疏.
用公式(2)中的x带入(1)中,y可以被重写为:
信号重构即为在给定y和D的情况下找到s。该问题常采用正交匹配追踪(OMP)技术来求解。矩阵时长被称为CS系统的等价字典。
传统地,稀疏字典学习的目的为设计一个字典Ψ以及一个矩阵S,以使得在约束下的特定范数对误差或稀疏表征误差的建模为最小。在设计CS系统时,除去字典Ψ,还需要考虑如何选择感知矩阵,以使得原始信号可以从测量值中被以较高的准确性恢复。
在CS框架中,x被从重建(相当于权利要求1中的步骤S4,根据所述输出判别类型重建图像数据为重排列得到重构图像),其中为以下公式的解:
(相当于权利要求1中的步骤S3中的部分特征“通过函数 对进行判别,输出判别类型”)
测量值信号矩阵如下:
为Ψ的SVD。
定义如下:
(相当于权利要求1中的步骤S2,根据构造字典库Ψ设计投影矩阵)
其中,和为两个任意正交矩阵。
由此可见,对比文件1公开了与权利要求1中相同的构造投影矩阵的方式、相似的求解最小误差的的方式、以及相同的重构图像的方式。但是,权利要求1与对比文件1存在区别如下:对比文件1涉及针对压缩感知的感应矩阵和稀疏字典的交叉优化方法,而权利要求1是将压缩感知应用于人脸识别方法中;权利要求1中还包括如下步骤:S0、输入初始条件,所述初始条件包括P个人人脸部样本构成的脸库样本以及测试人脸图像x0;S1、根据人脸样本,按照设定要求构造字典库Ψ=[Ψ1,...,Ψp,...,ΨP],将测试人脸图像x0预处理形成列向量x;步骤S1中,所述字典库的构造过程包括以下步骤:假设一个人脸库中存储有P个人脸部样本,其中,每个人又都有许多不同角度、不同表情、不同光照的样本,每个样本的尺寸均相同;对每个人随机选中其Q个不同的样本,每个样本图像按照同样的排列规则形成一个列向量并分别做l2范数归一化处理,尺寸设为N×1,作为字典库中的一个原子,形成字典库: 对任意的1≤p≤P,字典子块是第p个人的样本集合,其中,L=PQ;对1≤l≤L,且||ψl||2=1是字典的一个列向量;此外,权利要求1的步骤S3中首先将列向量x在投影矩阵Φ下的投影值y输入函数 求解当p从1遍历到P后,求得所有的其中,P为个人脸部样本的数量,Vp、∑p和由投影矩阵Φ、字典库Ψ及输入投影值y求得,为任意尺寸为的向量字典库Ψ及输入投影值y求得,为任意尺寸为的向量。
基于以上区别技术特征,该权利要求1请求保护的技术方案所要解决的技术问题是如何使用压缩感知的算法具体实现人脸识别。
对比文件1公开的针对压缩感知的感应矩阵和稀疏字典的交叉优化方法,虽然其公开了与权利要求1中相同的构造投影矩阵的方式、相似的求解最小误差的的方式、以及相同的重构图像的方式,但是对比文件1所公开的内容是图像压缩领域的底层理论算法,并未公开其具体的应用环境,即,对比文件1没有给出将其所公开的算法应用于图像识别、尤其是人脸识别的相关启示。而虽然步骤S0中输入包括P个人脸脸部样本构成的脸库样本以及测试人脸图像X0是在人脸识别过程中用于构建人脸样本库中的常规技术手段,但是将构造出的样本人脸库来构造出压缩感知中的字典库 (即,以上区别技术特征中的步骤S1),并将该字典库Ψ参与到后续的构造投影矩阵(步骤S2)、求解最小误差的(步骤S3)的算法步骤中从而实现人脸识别的完整步骤,并不属于本领域的公知常识。
此外,步骤S3中对的求解方式,决定了如何能够精确地求解。从步骤S2构建的投影矩阵Φ、步骤S1构建的字典库Ψ及输入投影值y求得Vp、∑p和,而后,当p从1遍历到P后,利用公式求解所有的,同样在的求解过程中利用了步骤S1中由人脸库构造的字典库Ψ;对该特定的求解公式,对比文件1既没有给出相关启示,也并非是本领域的常规技术手段。
基于以上全部区别技术特征,权利要求1的方案能够利用针对压缩感知的感应矩阵和稀疏字典的方法整体上实现完整的人脸识别算法,在人脸识别过程中,只需传输投影值,而不是测试图像本身,即可在多个人脸样本中识别出人脸并对图像进行重构,从而缓解信道传输大量数据的带宽压力,即权利要求1的方案获得了有益的技术效果。
因此权利要求1相对于对比文件1以及本领域的公知常识,具有突出的实质性特点和显著的进步,具备专利法第22条第3款所规定的创造性。
对原审查部门相关意见的评述
针对原审查部门的意见(详情参见案由部分,此处不再赘述),合议组认为:对比文件1公开的针对压缩感知的感应矩阵和稀疏字典的交叉优化方法,虽然其公开了与权利要求1中相同的构造投影矩阵的方式、相似的求解最小误差的的方式、以及相同的重构图像的方式,但是对比文件1所公开的内容是图像压缩领域的底层理论算法,并未公开其具体的应用环境,即,对比文件1没有给出将其所公开的算法应用于图像识别、尤其是人脸识别的相关启示;并且,对比文件1没有公开利用人脸样本构造字典库,并利用该字典库作为重要参数参与后续步骤,也没有公开求解的具体计算公式,而这些未公开的特征也并非本领域公知常识。因此,权利要求1所请求保护的基于压缩感知的人脸识别方法,相对于对比文件1与本领域公知常识的结合,并非是显而易见的,因此具备创造性。
基于上述理由,本案合议组做出以下决定。至于本申请是否存在其他缺陷,留待后续程序继续审查。
三、决定
撤销国家知识产权局于2018年11月01日对本申请作出的驳回决定。由国家知识产权局原审查部门在本复审请求审查决定所针对的文本的基础上对本发明专利申请继续进行审查。
如对本复审请求审查决定不服,根据专利法第41条第2款的规定,复审请求人可以自收到本决定之日起三个月内向北京知识产权法院起诉。
郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如作者信息标记有误,请第一时间联系我们修改或删除,多谢。