图像编码和解码的方法、编码和解码设备以及计算机程序-复审决定


发明创造名称:图像编码和解码的方法、编码和解码设备以及计算机程序
外观设计名称:
决定号:189249
决定日:2019-09-09
委内编号:1F275625
优先权日:2011-06-24
申请(专利)号:201510562762.5
申请日:2012-06-20
复审请求人:杜比国际公司
无效请求人:
授权公告日:
审定公告日:
专利权人:
主审员:严佳琳
合议组组长:田华
参审员:李笑
国际分类号:H04N19/13,H04N19/174,H04N19/176,H04N19/196,H04N19/436
外观设计分类号:
法律依据:专利法第22条第3款
决定要点:若权利要求所要求保护的技术方案相对于现有技术是显而易见的,并且也未取得预料不到的技术效果,则该权利要求不具备创造性。
全文:
本复审请求涉及申请号为201510562762.5,名称为“图像编码和解码的方法、编码和解码设备以及计算机程序”的发明专利申请(下称本申请)。申请人为杜比国际公司。本申请是201280031335.9的分案申请,本申请的申请日为2012年06月20日,优先权日为2011年06月24日,公开日为2015年12月02日。
经实质审查,国家知识产权局原审查部门于2018年11月27日发出驳回决定,驳回了本申请,其理由是:权利要求1-14相对于对比文件1和本领域公知常识的结合不具备专利法第22条第3款规定的创造性。驳回决定所依据的文本为:2018年10月30日提交的权利要求第1-16项,2018年01月05日提交的说明书第1-23页,分案申请日2015年09月07日提交的说明书附图第1-9页、说明书摘要和摘要附图。驳回决定所引用的对比文件为:对比文件1:JCTVC-E196“Wavefront Parallel Processing”,Félix Henry (Orange Labs)等,Joint Collaborative Team on Video Coding (JCT-VC) of ITU-T SG16 WP3 and ISO/IEC JTC1/SC29/WG11 5th Meeting: Geneva, CH, 16-23 March, 2011,公开日为2011年03月31日。
申请人(下称复审请求人)对上述驳回决定不服,于2019年03月07日向国家知识产权局提出了复审请求,同时修改了权利要求书。复审请求人认为:(1)权利要求1的重新初始化是在一行的最后一个块时执行的,旨在预先初始化后续行的第一个块,解码器在每行开始时处于初始化状态,由此从选择解码的并行级别以及优化解码的处理时间的角度来看允许更大的灵活性(参见本申请的说明书附图5B以及相关的步骤D35的记载)。而对比文件1当一行的第一个LCU被处理器时,通过从缓冲器进行读取而进行初始化,当一行的最后一个LCU被处理时,其概率将被写入缓冲区以便由下一行的第一个LCU读取,而没有执行初始化。也就是说,对比文件1的上述处理最多对应于对行的第一块执行的初始化,类似于本申请所记载的步骤D23的操作,而这明显不同于权利要求1中所限定的本发明的重新初始化特征。(2)当要编码的块子集预期以预定顺序并行编码时,通过对每个块子集进行编码而得到的数据子流可在被发送用于解码之前按预定顺序预先排序,使得编码数据子流可以符合特定类型的编码,并且可以降低编码/编码处理的复杂度,此外,不需要在比特流中插入子流标识符,并且可以降低与数据流的比特率相关的成本。相反,对比文件1中所公开的技术方案涉及插入子流标识符,这一点明显与本申请的技术方案不同甚至相反,而根本无法公开或启示本发明的权利要求1所限定的技术特征“每一行的上下文适应熵编码的子流在数据流中与该行的显示次序不同地被排序”。
经形式审查合格,国家知识产权局于2019年03月15日依法受理了该复审请求,并将其转送至原审查部门进行前置审查。
原审查部门在前置审查意见书中坚持驳回决定。
随后,国家知识产权局成立合议组对本案进行审理。
合议组于2019年06月04日向复审请求人发出复审通知书,引用了驳回决定中的对比文件1。通知书中指出:权利要求1-14相对于对比文件1和本领域公知常识的结合不具备创造性,并针对复审请求的意见进行了答复。
复审请求人于2019年07月10日提交了意见陈述书,修改了权利要求书,在权利要求1和权利要求7中增加特征“并且其中,块解码的进展被同步化以确保在当前块解码时分别位于当前块的上方和右上方的两个块的可用性”。2019年07月10日修改的权利要求书的内容如下:
“1. 一种用于熵解码的计算机实现的方法,该方法包括:
由解码器接收代表编码图像的数据流;
在数据流中识别编码图像的变换后的残留值的量化系数的连续块的多个行;
对用于对所述多个行中的当前行中的当前块进行熵解码的一个或多个状态变量进行初始化;
基于用于对当前块进行熵解码的一个或多个状态变量来对当前块进行熵解码;
其中,在当前块是当前行中的用于对编码图像进行解码的解码次序中的第一块并且当前行不是所述多个行中的解码次序中的第一行时,基于预定熵解码块的一个或多个状态变量来对用于对当前块进行解码的一个或多个状态变量进行初始化;
其中,所述预定熵解码块是除了当前行之外的连续块的一个行中的解码次序中的第二块,
其中,对块进行熵解码包括将间隔划分为多个子间隔,其中子间隔表示符号的出现的概率,
其中,在当前块是当前行中的解码次序中的最后一块时,间隔被重新初始化,
其中,代表编码图像的数据流包括至少一个编码图像的每一行的上下文适应熵编码的子流,并且其中,每一行的上下文适应熵编码的子流在数据流中与该行的显示次序不同地被排序,并且
其中,块解码的进展被同步化以确保在当前块解码时分别位于当前块的上方和右上方的两个块的可用性。
2. 如权利要求1所述的计算机实现的方法,其中,所述一个或多个状态变量代表与编码图像的变换后的残留值的量化系数的块相关联的符号出现概率。
3. 如权利要求1所述的计算机实现的方法,还包括:在对每一行进行熵 解码时修改所述一个或多个状态变量。
4. 如权利要求3所述的计算机实现的方法,还包括:
向第一存储器单元存储用于给定行中的编码图像的变换后的残留值的量化系数的连续块的子集的修改后的一个或多个状态变量,其中,第一存储器单元不经历初始化。
5. 如权利要求1所述的计算机实现的方法,其中,在数据流中识别编码图像的变换后的残留值的量化系数的连续块的多个行包括:识别包括在每一行的上下文适应熵编码的子流中的指示符,该指示符代表该行的在显示次序中的相应位置。
6. 如权利要求1所述的计算机实现的方法,其中,代表编码图像的数据流是从第一数量的编码单元接收的,并且其中,解码器包括第二数量的解码单元,编码单元的第一数量不同于解码单元的第二数量。
7. 一种解码器,包括:
一个或多个处理器,和存储有指令的一个或多个存储设备,所述指令在被一个或多个处理器执行时使得这一个或多个处理器执行包括以下项的操作:
接收代表编码图像的数据流;
在数据流中识别编码图像的变换后的残留值的量化系数的连续块的多个行;
对用于对所述多个行中的当前行中的当前块进行熵解码的一个或多个状态变量进行初始化;
基于用于对当前块进行熵解码的一个或多个状态变量来对当前块进行熵解码;
其中,在当前块是当前行中的用于对编码图像进行解码的解码次序中的第一块并且当前行不是所述多个行中的解码次序中的第一行时,基于预定熵解码块的一个或多个状态变量来对用于对当前块进行解码的一个或多个状态变量进行初始化;
其中,所述预定熵解码块是除了当前行之外的连续块的一个行中的解码次序中的第二块,
其中,对块进行熵解码包括将间隔划分为多个子间隔,其中子间隔表示符号的出现的概率,
其中,在当前块是当前行中的解码次序中的最后一块时,间隔被重新初始化,
其中,代表编码图像的数据流包括至少一个编码图像的每一行的上下文适应熵编码的子流,并且其中,每一行的上下文适应熵编码的子流在数据流中与该行的显示次序不同地被排序,并且
其中,块解码的进展被同步化以确保在当前块解码时分别位于当前块的上方和右上方的两个块的可用性。
8. 如权利要求7所述的解码器,其中,所述一个或多个状态变量代表与编码图像的变换后的残留值的量化系数的块相关联的符号出现概率。
9. 如权利要求7所述的解码器,还包括如下操作:在对每一行进行熵解码时修改所述一个或多个状态变量。
10. 如权利要求9所述的解码器,还包括如下操作:
向第一存储器单元存储用于给定行中的编码图像的变换后的残留值的量化系数的连续块的子集的修改后的一个或多个状态变量,其中,第一存储器单元不经历初始化。
11. 如权利要求7所述的解码器,其中,在数据流中识别编码图像的变换后的残留值的量化系数的连续块的多个行包括:识别包括在每一行的上下文适应熵编码的子流中的指示符,该指示符代表该行的在显示次序中的相应位置。
12. 如权利要求7所述的解码器,其中,代表编码图像的数据流是从第一数量的编码单元接收的,并且其中,解码器包括第二数量的解码单元,编码单元的第一数量不同于解码单元的第二数量。
13. 一种存储设备,存储有指令,所述指令在被一个或多个处理器执行时使得所述一个或多个处理器执行如权利要求1-6中任一项所述的方法。
14. 一种用于熵解码的装置,包括用于执行如权利要求1-6中任一项所述的方法的部件。”
在上述程序的基础上,合议组认为本案事实已经清楚,可以作出审查决定。
决定的理由
审查文本的认定
复审请求人于2019年07月10日提交了权利要求书的全文修改替换页。本复审请求审查决定所针对的文本为:复审请求人于2019年07月10日提交的权利要求第1-14项,2018年01月05日提交的说明书第1-23页,分案申请日2015年09月07日提交的说明书附图第1-9页、说明书摘要和摘要附图。经审查,复审请求人于2019年07月10日对权利要求的修改符合专利法第33条的规定。
(二)专利法第22条第3款
专利法第22条第3款规定:“创造性,是指与现有技术相比,该发明具有突出的实质性特点和显著的进步,该实用新型具有实质性特点和进步”。
本复审请求审查决定所引用的对比文件与驳回决定和复审通知书中所引用的对比文件相同,即对比文件1。
1)、权利要求1请求保护一种用于熵解码的计算机实现的方法,对比文件1公开了一种可应用于HEVC解码器的波前并行处理方法,并具体公开了如下特征(参见第1-6部分,第1-5页,图1-3): 1.介绍,HEVC视频编码器和解码器的高效并行能力对于未来的HEVC标准是很重要的。我们提出将波前处理模式扩展到熵编码以实现最大编码单元LCUs的全波前并行处理,熵解码后无需缓存符号的步骤。
2.HEVC中顺序LCU处理,在HEVC编码和解码中,对LCUs进行光栅扫描顺序处理,使用CABAC熵编码器更新概率。图1示出,为了编码当前的LCU,需要其左侧、上方、左上方和右上方LCUs是已解码的可用状态,从而可以使用空间和运动信息进行帧内和帧间编码(公开了块解码的进展被同步化以确保在当前块解码时分别位于当前块的上方和右上方的两个块的可用性)。当开始熵编码符号时,可以使用先前处理过的LCU(左侧的LCU)的CABAC概率。在特殊情况下,由于光栅扫描顺序,每行第一个LCU使用前一行最后一个LCU的CABAC概率。LCU的波前式处理实现并行编码和解码,如图2所示,LCUs的波前式处理具有4个线程。由于每行第一个LCU的CABAC概率依赖性(依赖前一行最后一个LCU的处理),如果上一行没有处理结束无法开始线程2、3或4的处理,这样就阻碍了并行效率。
3.LCUs波前处理,为解决这个问题,需要在LCUs每行开始的时候再初始化CABAC概率,这通过文件JCTVC-D073“用于波前编码功能的周期性初始化”提出。
4.波前并行处理,我们提出在对每一行的第一块LCU的CABAC概率进行初始化时,利用该行上面一行的第二块处理过的LCU的CABAC概率进行初始化,如图3所示,除了第一行,线程2、3或4的第一块LCU的概率使用上一行第二块LCU的概率。这允许第一列的LCUs快速学习概率。而且无需改变波前处理架构,因为上一行第二 LUC总是可用的。为此,需要设置概率缓冲器,当一个线程处理已经结束了对该行的第二块LCU的编码后,将概率写入到该缓冲器中,当一个线程开始处理一行的第一块LCU时,从该概率缓冲器中读取存储的上一行第二块LCU的概率。
5.优势,对LCUs进行交错行处理。
6.结果,因为每个线程产生独立的子流,有必要在比特流中提供子流指针,使得解码器可以找到每个比特流的开始从而快速解码。
可见,对比文件1公开了“对用于对所述多个行中的当前行中的当前块进行熵解码的一个或多个状态变量进行初始化;基于用于对当前块进行熵解码的一个或多个状态变量来对当前块进行熵解码;其中,在当前块是当前行中的用于对编码图像进行解码的解码次序中的第一块并且当前行不是所述多个行中的解码次序中的第一行时,基于预定熵解码块的一个或多个状态变量来对用于对当前块进行解码的一个或多个状态变量进行初始化;其中,所述预定熵解码块是除了当前行之外的连续块的一个行中的解码次序中的第二块”。此外,隐含公开了计算机实现熵解码的方法;解码前必然要接收编码比特流,隐含公开了由解码器接收代表编码图像的数据流;HEVC在编码时是对编码图像的变换后的残留值的量化系数进行编码,隐含公开了在数据流中识别的连续块的多个行是编码图像的变换后的残留值的量化系数的连续块的多个行。
权利要求1与对比文件1相比区别特征在于:(1)对块进行熵解码包括将间隔划分为多个子间隔,其中子间隔表示符号的出现的概率;(2)在当前块是当前行中的解码次序中的最后一块时,间隔被重新初始化;(3)代表编码图像的数据流包括至少一个编码图像的每一行的上下文适应熵编码的子流,并且其中,每一行的上下文适应熵编码的子流在数据流中与该行的显示次序不同地被排序。基于上述区别特征权利要求的技术方案所要解决的技术问题是如何实现算术编码,如何进一步提高并行处理效率,以及如何排序子流发送。
对于上述区别特征(1),本技术领域中,在进行熵编码方法中,算术编码是把整个输入的消息编码为一个满足大于等于零且小于等于1的小数,也就是说用间隔表示预定符号集中包含的符号的出现的概率,而将间隔进一步划分为多个预定的子间隔来表示预定符号集中的符号的出现的概率,这是本领域的公知技术。
对于上述区别特征(2),对比文件1公开的采用文件JCTVC-D073“用于波前编码功能的周期性初始化”所提出的方法在每行LCUs的最开始重新初始化CABAC概率其目的同样是为了实现最大化的并行处理,对于需求更高阶并行处理的场景,可对先前处理过的LCU行进行设置。而对于本领域技术人员而言,为了进一步提高并行处理效率,使CABAC概率在一行最开始时已处于重新初始化状态,容易想到在编码完前一行最后一块时就进行初始化,也就是说在一行的最后一块编码完成后,在下一行的第一块编码前进行初始化。
对于上述区别特征(3),对比文件1公开了可以对LCUs进行交错行处理,这与本申请产生包括在数据流中的排序与显示次序不同的子流的数据流的方案是一致的,即不同的编码单元分别对奇数行和偶数行进行编码(参见本申请说明书0110段和0226段,附图7B)。通过对LCUs进行交错行处理,得到的数据流包括的子流在数据流中与该行的显示次序不同地被排序是本领域的惯用手段。
因此,在对比文件1的基础上,结合上述公知常识来得到权利要求1请求保护的技术方案对于本领域技术人员来说是显而易见的,权利要求1请求保护的技术方案不具备突出的实质性特点和显著的进步,不具备专利法第22条第3款规定的创造性。
2)、从属权利要求2对权利要求1作了进一步限定,对比文件1还公开了如下特征(参见第2-3部分):为了保证并行处理的可行性,在对每一行(除了第一行)的第一块LCU的CABAC概率进行初始化时,利用该行上面一行的第二块LCU的CABAC概率进行初始化。因此,在其引用的权利要求不具备创造性的前提下,其也不具备创造性,不符合专利法第22条第3款的规定。
3)、从属权利要求3对权利要求1作了进一步限定,对比文件1还公开了如下特征(参见第2-6部分,第1-5页,图1-3):2.HEVC中顺序LCU处理,在HEVC编码和解码中,对LCUs进行光栅扫描顺序处理,使用CABAC熵编码器更新概率。当开始熵编码符号时,可以使用先前处理过的LCU(左侧的LCU)的CABAC概率。解码时CABAC更新概率公开了进行熵解码时修改所述一个或多个状态变量。因此,在其引用的权利要求不具备创造性的前提下,其也不具备创造性,不符合专利法第22条第3款的规定。
4)、从属权利要求4对权利要求3作了进一步限定,对比文件1还公开了如下特征(参见第2-6部分,第1-5页,图1-3):设计一概率缓冲器(相当于第一存储器),当一个线程处理已经结束了对该行的第二块LCU的编码后,将更新概率写入到该缓冲器中(公开了向第一存储器单元存储用于给定行中的编码图像的变换后的残留值的量化系数的连续块的子集的修改后的一个或多个状态变量),当一个线程开始处理一行的第一块LCU时,从该概率缓冲器中读取存储的上一行第二块LCU的概率对第一块LCU的CABAC编码的概率进行初始化。另外,由于接下来对行进行编码时需要用到概率缓冲器中的概率,因此,本领域技人员容易想到使得第一存储器单元不经历初始化。因此,在其引用的权利要求不具备创造性的前提下,其也不具备创造性,不符合专利法第22条第3款的规定。
5)、从属权利要求5对权利要求1作了进一步限定,对比文件1还公开了如下特征(参见第6部分):由于每个线程都生成自己的子流,所以需要在比特流中提供子流指针,以便解码器能够找到每个比特流的相应位置并立即开始解码(公开了在数据流中识别编码图像的变换后的残留值的量化系数的连续块的多个行包括:识别包括在每一行的上下文适应熵编码的子流中的指示符,该指示符代表该行的在显示次序中的相应位置)。因此,在其引用的权利要求不具备创造性的前提下,其也不具备创造性,不符合专利法第22条第3款的规定。
6)、从属权利要求6对权利要求1作了进一步限定,对于本领域技术人员来说,在对数据流进行并行编解码时,具体选择利用几个编码装置进行并行编码,利用几个解码装置进行解码是本领域技术人员根据实际的应用场景能够灵活设定的,也就是说,使得接收图像数据流的编码单元的数量不同于对该数据流进行解码单元的数量是本领域技术人员的惯用手段。因此,在其引用的权利要求不具备创造性的前提下,其也不具备创造性,不符合专利法第22条第3款的规定。
7)、权利要求7请求保护一种解码器,包括:一个或多个处理器,和存储有指令的一个或多个存储设备,所述指令在被一个或多个处理器执行时使得这一个或多个处理器执行权利要求1所述方法,在权利要求1所述方法不具备创造性的前提下,用包括一个或多个处理器和存储有指令的一个或多个存储设备的解码器实现权利要求1所述方法步骤是本领域技术人员不需要付出创造性劳动的。因此,该权利要求不具备突出的实质性特点和显著的进步,不符合专利法第22条第3款规定的创造性。
8)、从属权利要8-12的附加技术特征分别与从属权利要求2-6的附加技术特征一一对应,在权利要求2-6所述方法不具备创造性的前提下,用对应的模块实现所述方法步骤也是本领域技术人员容易想到的。基于同样的评述理由,权利要求8-12也不具备创造性,不符合专利法第22条第3款的规定。
9)、权利要求13请求保护一种存储设备,存储有指令,所述指令在被一个或多个处理器执行时使得所述一个或多个处理器执行如权利要求1-6中任一项所述的方法。在权利要求1-6所述方法不具备创造性的前提下,存储设备存储有指令使得一个或多个处理器执行权利要求1-6所述方法步骤是本领域技术人员不需要付出创造性劳动的。因此,该权利要求不具备突出的实质性特点和显著的进步,不符合专利法第22条第3款规定的创造性。
10)、权利要求14请求保护一种用于熵解码的装置,包括用于执行如权利要求1-6中任一项所述的方法的部件。在权利要求1-6所述方法不具备创造性的前提下,用于熵解码的装置包括部件执行权利要求1-6所述方法是本领域技术人员不需要付出创造性劳动的。因此,该权利要求不具备突出的实质性特点和显著的进步,不符合专利法第22条第3款规定的创造性。
(三)对复审请求人相关意见的评述
复审请求人认为:(1)本申请的区别特征还包括“块解码的进展被同步化以确保在当前块解码时分别位于当前块的上方和右上方的两个块的可用性”,使得在处理过程中不需要验证这两个块的可用性,加快处理时间;(2)对比文件1中JCTVC-D073中所描述的重新初始化CABAC仅是在每一行的开端,而没有扩展到上一行的最后一个块,也无法扩展到上一行的最后一块。具体为,对比文件1并未教导JCTVC-D073与第4节内容组合使用;即使能够将重新初始化扩展到上一行的最后一块,将不清楚要利用上一行中的最后一个块的重新初始化结果和处理结果中的哪一个;(3)本申请不需要在比特流中插入子流标识符,并且可以降低与数据流的比特率相关的成本。
合议组认为:对于意见(1),对比文件1公开的方案是基于顺序LCU处理,在顺序LCU处理中,为了编码当前的LCU,其左侧、上方、左上方和右上方LCUs是已解码的可用状态,从而可以使用空间和运动信息进行帧内和帧间编码。另外,图3示出并行LCU处理进程中,CABAC概率与上一行右侧LCU的概率同步,在线程1-4的进程中,X标记的当前块可以使用位于当前块左侧、左上、上方和右上的LCU。可见,对比文件1也不需要验证这当前块的上方块和右上方块的可用性,基于对比文件1已经公开的相关技术内容, 技术特征“块解码的进展被同步化以确保在当前块解码时分别位于当前块的上方和右上方的两个块的可用性” 被对比文件1公开。
对于意见(2),首先,基于对比文件1摘要,本文所公开的方案即使用了JCTVC-D073中的在每行LCU的开始处初始化CABAC概率,又使用附加概率缓存存储上一行第二个LCU概率。在对比文件1第3节和第4节还公开了,为了减小在每次重新初始化后再次习得CABAC概率的损失,提出在对每一行的第一块LCU的CABAC概率进行初始化时,利用该行上面一行的第二块处理过的LCU的CABAC概率进行初始化,可见,对比文件1公开的是JCTVC-D073与第4节波前并行处理组合使用的方案;其次,本领域技术人员基于对对比文件1的理解,如果将行开始处执行的初始化提前到前续行最后一块执行,处理该行第一块时其已经处于初始化状态,直接读取缓冲存储器中的前续行的第二块的概率,从而实现对比文件1的技术方案。
对于意见(3),如上文对权利要求1区别特征(3)的评述,对比文件1给出了交错行处理LCUs的技术启示,此外,还公开了由于在比特流中提供子流指针会造成损失,因此通过更好的子流指示方案以减少损失(参见对比文件1第5页倒数第2段),对于本领域技术人员来说不提供子流指针能够达到最小的损失,而采用和解码器事先约定的排序发送子流可以不需要提供子流指针,这属于本领域的惯用手段。
综上合议组对于复审请求人的意见不予支持。
三、决定
维持国家知识产权局于2018年11月27日对本申请作出的驳回决定。
如对本复审请求审查决定不服,根据专利法第41条第2款的规定,复审请求人可以自收到本决定之日起三个月内向北京知识产权法院起诉。



郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如作者信息标记有误,请第一时间联系我们修改或删除,多谢。

留言与评论(共有 0 条评论)
   
验证码: