基于对数梯度直方图的广义光照不变人脸特征描述方法-复审决定


发明创造名称:基于对数梯度直方图的广义光照不变人脸特征描述方法
外观设计名称:
决定号:191918
决定日:2019-10-08
委内编号:1F276195
优先权日:
申请(专利)号:201510901669.2
申请日:2015-12-08
复审请求人:中山大学
无效请求人:
授权公告日:
审定公告日:
专利权人:
主审员:孙韬敏
合议组组长:杜婧子
参审员:金霞
国际分类号:G06K9/00
外观设计分类号:
法律依据:专利法第22条第3款
决定要点
:如果一项权利要求请求保护的技术方案与作为最接近的现有技术的对比文件相比存在区别技术特征,其中部分区别技术特征不是所属技术领域的公知常识,该部分区别技术特征的引入使得该项权利要求请求保护的技术方案具有有益的技术效果,那么该项权利要求请求保护的技术方案具备创造性。
全文:
本复审请求涉及申请号为201510901669.2,名称为“基于对数梯度直方图的广义光照不变人脸特征描述方法”的发明专利申请(下称本申请)。本申请的申请人为中山大学,申请日为2015年12月08日,公开日为2016年05月04日。
经实质审查,国家知识产权局实质审查部门于2018年11月27日发出驳回决定,驳回了本申请,其理由是:权利要求1-7不具备专利法第22条第3款规定的创造性。驳回决定所依据的文本为:申请日2015年12月08日提交的权利要求第1-7项、说明书摘要、说明书附图第1-2页、摘要附图,以及2016年03月04日提交的说明书第1-8页。
驳回决定所针对的权利要求书的内容如下:
“1. 基于对数梯度直方图的广义光照不变人脸特征描述方法,其特征在于,包括以下步骤:
(1)将人脸图像做预处理,通过双眼中心坐标进行对齐、裁剪并归一化成固定大小;
(2)对步骤(1)的人脸图像作对数域的带通滤波处理,得到滤波后人脸图像;
(3)根据步骤(2)所得到的滤波后人脸图像,分别计算其梯度幅值和梯度方向;
(4)对步骤(3)的梯度幅值和梯度方向作后处理;
(5)根据步骤(4)得到的处理后的梯度幅值和梯度方向,分块计算梯度直方图,最终将所有分块的直方图合并作为人脸的光照不变特征。
2. 根据权利要求1所述的基于对数梯度直方图的广义光照不变人脸特征描述方法,所述步骤(2)中的对数域带通滤波处理是指:

其中,I(x,y)为输入图像,D(x,y,σ0,σ1)为带通滤波函数,Log(·)为对数变换。
3. 根据权利要求1所述的基于对数梯度直方图的广义光照不变人脸特征描述方法,所述步骤(3)中,梯度幅值和梯度方向分别记为Mag和Ori,其计算方法如下:

其中,和分别表示对求x方向和y方向的偏导。
4. 根据权利要求1所述的基于对数梯度直方图的广义光照不变人脸特征描述方法,所述步骤(4)中,对梯度幅值和梯度方向作后处理的方法如下:
(41)对步骤(3)得到的梯度幅值作阈值判断,当其局部均值大于某阈值T时结合近邻像素点的信息对其作正则化处理;
(42)对步骤(3)得到的梯度方向使用高斯滤波作进一步平滑,进而将其作数值量化,均匀地划分成K个量化级。
5. 根据权利要求1所述的基于对数梯度直方图的广义光照不变人脸特征描述方法,所述步骤(5)中,人脸图像的梯度直方图的计算方法如下:
(51)将人脸图像均匀分割成若干小块,每个小块的大小为A×A;
(52)在每个小块中生成梯度直方图;
(53)将每个小块的直方图合并成一个长向量,作为人脸光照不变特征的最终表达。
6. 根据权利要求5所述的基于对数梯度直方图的广义光照不变人脸特征描述方法,所述步骤(52)中,每个小块的梯度直方图的计算方法如下:

其中,Bi为第i个子块,Hi表示第i个子块的直方图,u为直方图的位序号。
7. 根据权利要求6所述的基于对数梯度直方图的广义光照不变人脸特征描述方法,所述步骤(53)中,梯度直方图合并的方法如下:
H=[H1(1),…,H1(K),…,Hb(1),…,Hb(K)]
其中,b为每张图像中分块的总数。”
驳回决定中引用了如下对比文件:
对比文件1:“用于人脸识别的相对梯度直方图特征描述”,杨利平等,《光学精密工程》,第22卷第1期,第152-159页,公开日为2014年01月31日。
驳回决定中引入了如下书籍作为公知常识性证据:
证据1:《数字图像处理》,禹晶等,第309页,机械工业出版社,公开日为2015年09月30日;
证据2:《基于几何特征的图像处理与质量评价》,程光权等,第209页,国防工业出版社,公开日为2013年08月31日。
驳回决定的具体理由是:1.权利要求1与对比文件1的区别技术特征在于:本申请权利要求1是基于对数梯度直方图,对比文件1已经公开了梯度直方图,仅未公开将梯度直方图进行对数计算;权利要求1中(1)将人脸图像做预处理,通过双眼中心坐标进行对齐、裁剪并归一化成固定大小,(2)对步骤(1)的人脸图像作对数域的带通滤波处理,得到滤波后人脸图像;(3)根据步骤(2)所得到的滤波后人脸图像,分别计算其梯度幅值和梯度方向。但上述区别技术特征是在对比文件1和本领域公知常识的技术启示下容易想到的。2.权利要求2-7的附加技术特征或被对比文件1公开,或属于本领域的惯用技术手段。因此,权利要求1-7不具备创造性。同时,在驳回决定中的针对申请人意见的答复部分引入了证据1和证据2,佐证对梯度直方图进行对数变换得到对数梯度直方图属于本领域的惯用技术手段。
申请人(下称复审请求人)对上述驳回决定不服,于2019年03月12日向国家知识产权局提出了复审请求,未修改申请文件。复审请求人认为:1. 驳回决定中的“对梯度直方图进行对数变换得到对数梯度直方图”,是指先提取梯度直方图再将直方图的数值作对数变换,而根据本申请所提及的步骤(1)-(5)可知,本申请的对数梯度直方图是先对图像作对数变换,再实施带通滤波,续而提取对数梯度幅值和对数梯度方向,最终融合两者信息生成二元直方图,并不涉及“对梯度直方图进行对数变换”这一操作,可见证据1、证据2所述的“对梯度直方图进行对数变换得到对数梯度直方图”并不是本申请所指代的方法。对数变换、带通滤波、梯度计算确实均是本领域的惯用技术手段,但本申请的方法区别于对比文件1、证据1和证据2关于“对梯度直方图进行对数变换”的现有技术,通过创新性地整合图像对数变换、带通滤波、梯度计算,得到具有光照鲁棒性的对数梯度幅值和对数梯度方向,并在此基础上进一步融合二者信息得到对数梯度直方图的特征表示。即使证据1和证据2证明“对梯度直方图进行对数变换得到对数梯度直方图属于本领域技术人员在更好地进行图像显示时的惯用技术手段”,本领域技术人员也不容易得到基于对数梯度直方图来进行人脸特征描述。2. 根据对比文件1的图2可知,按梯度方向进行分解是生成梯度直方图的必要过程,不分解则意味着完全舍弃梯度方向信息,而本申请的方法无需分解,综合利用了对数梯度幅值和对数梯度方向信息;本申请所涉及的后处理方式与对比文件1有显著的区别,本申请方法包括对数梯度幅值和对数梯度方向的提取、后处理,以及对数梯度直方图的生成,其整体方法与现有技术不相同,并且解决了波长不同引起的异质光照问题。因此,本申请权利要求1-7均具备创造性。
经形式审查合格,国家知识产权局于2019年03月19日依法受理了该复审请求,并将其传送至实质审查部门进行前置审查。
实质审查部门在前置审查意见书中认为:(1)基于对比文件1公开的内容,在纠正光照不均影响时对图像作对数域的带通滤波处理是本领域的惯用技术手段,例如:证据3“MATLAB 6.x图像处理,孙兆林,清华大学出版社,第231页,2002年05月31日”记载了“假设图像是由光的反射形成的,如果光源照射到景物上是照度不均匀,那么照度较强的部分将较亮,照度较弱的部分就较暗,并且由此引起较暗部分的图像细节不易看清。通常,对光照不均图像的校正要采用同态滤波的方法。我们知道,由光的反射形成的图像的数学模型为:f(x,y)=r(x,y)i(x,y),一般照度分量i(x,y)是均匀的或者缓变的,其频谱分量落在低频区域,反射分量r(x,y)反映图像的细节内容,它的频谱有较大的部分落在高频区域,同态滤波就是对图像取对数运算,将乘积模型转化为加性模型,经过分析,取对数运算后,照度分量和反射分量所处区域不变,从而对数域将照度分量和反射分量区分开来,这时就可以根据需要对照度分量和反射分量进行调整”。对对数域图像求取梯度幅值和对数梯度方向属于本领域技术人员的惯用技术手段,例如:证据4“数字图像处理基础与应用,朱虹,清华大学出版社,第180-181页,2013年01月31日”记载了“本征图像是指一幅图像被分解成的反射图和照射图,进行过本征图像提取后的反射图中,因为去除了照射变化所带来的阴影干扰,即使最原始简单的分割算法也可以正确地将图中的圆筒分割为一个独立的目标,拍摄得到的原图与其反射分量、照射分量的关系可以描述为式(11-86),对式(11-86)两端同时取对数,将一幅图像表示为反射分量和照射分量之和,即IL(x,y),将对数域图像IL(x,y)与水平梯度算子和垂直梯度算子进行卷积,得到水平方向和垂直方向的梯度图像”。本领域技术人员容易想到对图像作对数域的带通滤波处理,然后提取对数梯度幅值和对数梯度方向,从而进行人脸特征描述。(2)本领域所公知的带通滤波器是一个允许特定频段的波通过同时屏蔽其他频段的设备。对人脸图像进行带通滤波处理是本领域技术人员在计算图像梯度幅值和梯度方向的惯用技术手段,而对图像进行对数变换属于本领域技术人员的惯用技术手段。对比文件1已经公开了对人脸图像,分别计算其梯度幅值和梯度方向,为了更好地计算人脸图像的梯度幅值和梯度方向,在对比文件1公开内容的基础上,本领域技术人员容易想到对对数带通滤波后的人脸图像计算对数域的梯度,得到对数梯度幅值和对数梯度方向,本领域技术人员可以根据需求选择直接根据后处理的相对梯度幅值和相对梯度方向生成梯度直方图,而不对梯度幅值和梯度方向生成梯度进行分解。因此,本申请权利要求均不具备创造性,因而坚持驳回决定。
随后,国家知识产权局成立合议组对本案进行审理。
在充分阅卷并仔细合议的基础上,合议组认为本案事实已经清楚,可以依法作出审查决定。
二、决定的理由
1. 审查文本的认定
复审请求人在提交复审请求时未修改申请文件。本复审请求审查决定所依据的审查文本与驳回决定所针对的审查文本相同,即:申请日2015年12月08日提交的权利要求第1-7项、说明书摘要、说明书附图第1-2页、摘要附图,以及2016年03月04日提交的说明书第1-8页。
2. 关于专利法第22条第3款
专利法第22条第3款规定:创造性,是指与现有技术相比,该发明具有突出的实质性特点和显著的进步,该实用新型具有实质性特点和进步。
如果一项权利要求请求保护的技术方案与作为最接近的现有技术的对比文件相比存在区别技术特征,其中部分区别技术特征不是所属技术领域的公知常识,该部分区别技术特征的引入使得该项权利要求请求保护的技术方案具有有益的技术效果,那么该项权利要求请求保护的技术方案具备创造性。
本复审请求审查决定引用的对比文件与驳回决定中所引用的对比文件相同,即:
对比文件1:“用于人脸识别的相对梯度直方图特征描述”,杨利平等,《光学精密工程》,第22卷第1期,第152-159页,公开日为2014年01月31日。
同时引用如下公知常识性证据:
证据1:《数字图像处理》,禹晶等,第309页,机械工业出版社,公开日为2015年09月30日;
证据2:《基于几何特征的图像处理与质量评价》,程光权等,第209页,国防工业出版社,公开日为2013年08月31日;
证据3:《MATLAB 6.x图像处理》,孙兆林,第231页,清华大学出版社,公开日为2002年05月31日;
证据4:《数字图像处理基础与应用》,朱虹,第180-181页,清华大学出版社,公开日为2013年01月31日。
2.1 权利要求1请求保护基于对数梯度直方图的广义光照不变人脸特征描述方法,对比文件1公开了用于人脸识别的相对梯度直方图特征描述方法,并具体公开了以下技术特征(参见第153-156页):
选择了229人的1131幅正面不同光照人脸图像(每人至少4幅图像)构成一个FERET子集进行实验;所有图像均根据眼睛坐标进行旋转、剪切和缩放到大小为128 pixel×128 pixel(相当于步骤(1)中的将人脸图像做预处理,裁剪并归一化成固定大小);给定一幅图像I(x,y),其梯度一般表示图像的边缘特征,如图1(b)所示,梯度的幅值可表示为:
(2),
梯度方向表示为:(3);
从图1(b)可以看出,图像的梯度信息受不均匀光照的影响较大,为了克服光照,尤其是非均匀光照对人脸图像的影响,引入图像的相对梯度,其梯度方向的计算与(3)式相同,幅值的计算则采用如下计算公式:(4);定理1:如果图像I(x,y)的光照分量L(x,y)是缓慢变化的,则其相对梯度幅值与反射分量R(x,y)的相对梯度幅值近似相等;
对相对梯度幅值图像进行处理,图2为具体的处理流程图;首先按照梯度方向对相对梯度幅值图像进行分解;对分解在m个方向上的相对梯度幅值进行高斯滤波,这样,原始的相对梯度幅值图像被分解成了m个分量,记为;将每个分量分成n×n块;利用均匀模式LBP计算每个分块的LBP直方图特征;所有的n×n个直方图向量首尾相接形成的直方图特征,记为Hi, i=1,…,m,则整幅人脸图像的相对梯度直方图特征表示为:(5);利用白化主成分分析对相对梯度直方图特征进行特征降维,获得最终的人脸图像低维特征描述。
权利要求1与对比文件1相比,区别技术特征在于:A.步骤(1)还包括通过双眼中心坐标进行对齐;B.步骤(2)对步骤(1)的人脸图像作对数域的带通滤波处理,得到滤波后人脸图像;步骤(3)根据步骤(2)所得到的滤波后人脸图像,分别计算其梯度幅值和梯度方向;步骤(4)对步骤(3)的梯度幅值和梯度方向作后处理;步骤(5)根据步骤(4)得到的处理后的梯度幅值和梯度方向,分块计算梯度直方图,最终将所有分块的直方图合并作为人脸的光照不变特征。
基于上述区别技术特征,权利要求1实际解决的技术问题为:如何对图像预处理以及如何有效地区分人脸的关键特征。
对于区别技术特征A,该区别技术特征属于图像技术领域的惯用技术手段:在图像技术领域中,通常处理人脸图像时,截取特征明显的人脸区域进行特征分析,以便于后续进行人脸识别,同时以双眼连线的中心为基准点选取的人脸区域是常见的关键特征区域,基于对比文件1公开了所有图像均根据眼睛坐标进行旋转、剪切和缩放(参见第156页左栏第1段),本领域技术人员容易想到对比文件1选择的眼睛坐标可以是双眼之间的中心坐标,以该坐标作为基准点,截取出包括双眼在内的特征明显的人脸区域。
对于区别技术特征B,本申请为了解决现有光照不变人脸特征描述方法存在的适用光照环境受限、识别性能易受环境干扰的问题,提出基于对数梯度直方图的广义光照不变人脸特征描述方法,其采用对数域的带通滤波处理,根据得到的滤波后人脸图像分别计算其梯度幅值和梯度方向,提取出对数梯度幅值和对数梯度方向作为光照不变特征,然后采用对数梯度直方图的特征表达方式,从而使所述方法适用于传统的同态光照环境以及可见光与近红外的异质光照环境,并提高了特征表达的鲁棒性以及人脸识别的精度。而对比文件1为了解决方向边缘幅值模式(POEM)在剧烈光照变化情况下无法获得足够的特征描述信息的问题,首先假设图像光照分量L(x,y)是缓慢变化的,这样计算出的图像I(x,y)的相对梯度幅值与反射分量R(x,y)的相对梯度幅值近似相等(参见第154页右栏“定理1”),然后采用相对梯度直方图特征的处理流程(参见第155页第3节),从而获得对非均匀光照变化具有健壮性的低维直方图特征的描述信息。
由对比文件1公开的内容可知,对比文件1通过假设L(x,y)分量是缓慢变化的,结合关于相对梯度幅值的处理,提取出反射分量R(x,y)即光照不变特征,其并未给出通过对数域的带通滤波处理的方式提取出光照不变特征R(x,y)的技术启示;并且,对比文件1需按照梯度方向对相对梯度幅值图像进行分解,将分解得到的每个分量分成n×n个分块,计算每个分块的LBP直方图特征,所有n×n个直方图向量首尾相接,得到人脸图像的相对梯度直方图特征表示。在对比文件1的基础上,本领域技术人员没有将对比文件1中公开的基于相对梯度幅值的处理方式,替换为计算梯度幅值并利用梯度幅值作后续处理的技术启示,进而也没有给出本领域技术人员基于对数梯度幅值和对数梯度方向进行处理,以获得对数梯度直方图的光照不变特征的技术启示。
并且,该区别技术特征B整体上也不属于本领域的公知常识。
基于上述区别技术特征B,权利要求1请求保护的技术方案获得了如下有益的技术效果:适用于光照强度和光照方向的变化,以及可见光至近红外波段涉及光源波长的变化,能够有效地区分人脸的关键特征,并提高识别性能和鲁棒性。
因此,权利要求1请求保护的技术方案相对于对比文件1和本领域公知常识的结合具有突出的实质性特点和显著的进步,具备专利法第22条第3款规定的创造性。
2.2 权利要求2-7直接或间接地引用权利要求1,由于权利要求1具备创造性,因而权利要求2-7请求保护的技术方案也具备专利法第22条第3款规定的创造性。
3. 关于驳回决定以及前置审查意见书中的相关意见
合议组认为:
首先,本申请权利要求1中的步骤(2)-(5)相互关联,形成一个完整的技术方案。虽然对数域变换、带通滤波处理、梯度变换分别是图像领域的常见技术,然而本申请权利要求1的步骤(2)-(5)作为一个整体先采用对数域的带通滤波处理,再根据得到的滤波后人脸图像分别计算其梯度幅值和梯度方向,从而将提取出的对数梯度幅值和对数梯度方向作为光照不变特征,最后采用对数梯度直方图的特征表达方式,解决了现有光照不变人脸特征描述方法存在的适用光照环境受限、识别性能易受环境干扰的问题,即权利要求1的步骤(2)-(5)作为一个整体并不属于本领域的公知常识。
其次,对比文件1没有给出通过对数域的带通滤波处理的方式提取出光照不变特征R(x,y)的技术启示,也没有给出将基于相对梯度幅值的处理方式,替换为计算梯度幅值并利用梯度幅值作后续处理的技术启示,进而也没有给出本领域技术人员基于对数梯度幅值和对数梯度方向进行处理,以获得对数梯度直方图的光照不变特征的技术启示。
再次,证据1和证据2中记载的内容是先获得梯度直方图、再作对数变换,而证据3和证据4中记载的内容可以证明对图像作对数变换这一过程本身,以及对数变换后获得梯度图像这一过程本身,属于本领域的公知常识。证据1-4仅说明本申请权利要求1中的部分技术特征为本领域的公知常识,而本申请权利要求1的步骤(2)-(5)作为一个相互关联的整体,证据1-4均不能证明其整体上属于本领域的公知常识。
基于上述事实和理由,合议组依法作出如下审查决定。至于本申请中是否存在其他不符合专利法以及专利法实施细则的规定的缺陷,留待后续程序继续审查。
三、决定
撤销国家知识产权局于2018年11月27日对本申请作出的驳回决定。由国家知识产权局实质审查部门在本复审请求审查决定针对的文本的基础上对本申请继续进行审查。
如对本复审请求审查决定不服,根据专利法第41条第2款的规定,复审请求人可以自收到本复审请求审查决定之日起三个月内向北京知识产权法院起诉。



郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如作者信息标记有误,请第一时间联系我们修改或删除,多谢。

留言与评论(共有 0 条评论)
   
验证码: