一种数据存储方法及装置-复审决定


发明创造名称:一种数据存储方法及装置
外观设计名称:
决定号:189483
决定日:2019-09-11
委内编号:1F267601
优先权日:
申请(专利)号:201210314126.7
申请日:2012-08-29
复审请求人:百度在线网络技术(北京)有限公司
无效请求人:
授权公告日:
审定公告日:
专利权人:
主审员:张颖
合议组组长:王志宇
参审员:薛霏
国际分类号:G06F17/30
外观设计分类号:
法律依据:专利法第22条第3款
决定要点
:如果一项权利要求与作为最接近现有技术的对比文件相比存在多个区别技术特征,部分区别技术特征被其他对比文件公开,部分区别技术特征未被该其他对比文件公开,也不是本领域公知常识,同时由于该部分区别技术特征的存在使得该权利要求的技术方案获得了有益的技术效果,则该权利要求相对于上述对比文件和公知常识的结合具备创造性。
全文:
本复审请求涉及申请号为201210314126.7,名称为“一种数据存储方法及装置”的发明专利申请(下称“本申请”)。申请人为百度在线网络技术(北京)有限公司。本申请的申请日为2012年08月29日,公开日为2014年03月26日。
经实质审查,国家知识产权局原审查部门于2018年08月28日发出驳回决定,驳回了本申请,其理由是:权利要求1-18不符合专利法第22条第3款规定的创造性。驳回的具体理由是:权利要求1要求保护一种数据存储方法,对比文件1(CN101854388A,公开日为2010年10月06日)公开了一种集群存储中并行访问大量小文件的方法。权利要求1与对比文件1的区别技术特征在于:权利要求1获得用于整合的多个数据文件的方法为:预先选取编码算法,并对编码的取值区间进行分段,利用所述编码算法,对目标数据文件的标识信息进行编码,根据编码结果,选取编码值位于相同分段的文件作为所述多个数据文件。基于上述区别技术特征,本申请实际解决的技术问题是:如何对多个数据文件进行划分。对比文件2(“Linux下海量小文件存储及检索优化技术的研究与应用”,王晨,中国优秀硕士学位论文全文数据库信息科技辑,第9期,第I138-588页,公开日为:2011年09月15日;)公开了上述区别技术特征,且给出了相应的技术启示。因此,权利要求1相对于对比文件1和2的结合不具备创造性。从属权利要求2-5的附加技术特征或被对比文件1、对比文件2公开,或为本领域公知常识,因此,也不具备创造性。从属权利要求6和7的附加技术特征或被对比文件3(CN101373473A,公开日为2009年02月25日)公开,或为本领域公知常识,因此,权利要求6和7也不具备创造性。权利要求8和9的附加技术特征是本领域公知常识,因此,权利要求8和9也不具备创造性。权利要求10-18是权利要求1-9所对应的装置,其限定部分的技术特征一一对应,由于权利要求1-9不具备创造性,权利要求10-18也不具备创造性。驳回决定所依据的文本为2018年01月08日提交的权利要求第1-18项,2012年11月08日提交的说明书第1-215段,初审审查员依职权修改的申请日2012年08月29日提交的说明书附图1-11,申请日2012年08月29日提交的说明书摘要以及摘要附图。驳回决定所针对的权利要求书如下:
“1. 一种数据存储方法,其特征在于,包括:
预先选取编码算法,并对编码的取值区间进行分段;
利用所述编码算法,对目标数据文件的标识信息进行编码;
根据编码结果,对编码值位于相同分段的多个数据文件进行整合存储;
所述对编码值位于相同分段的多个数据文件进行整合存储,包括:
将编码值位于相同分段的多个数据文件整合存储为一个或多个文件数据包。
2. 根据权利要求1所述的方法,其特征在于,所述将编码值位于相同分段的多个数据文件整合存储为一个文件数据包,包括:
在文件数据包大小超过预设阈值的情况下,对当前文件数据包所对应的分段进行再次划分;
在新划分得到的分段中,分别生成新的文件数据包并存储。
3. 根据权利要求1所述的方法,其特征在于,所述将编码值位于相同分段的多个数据文件整合存储为一个文件数据包,包括:
在文件数据包所包含的数据文件数量超过预设阈值的情况下,对当前文件数据包所对应的分段进行再次划分;
在新划分得到的分段中,分别生成新的文件数据包并存储。
4. 根据权利要求1所述的方法,其特征在于,所述将编码值位于相同分段的多个数据文件整合存储为多个文件数据包,包括:
在文件数据包大小超过预设阈值的情况下,在当前文件数据包所对应的分段中生成新的文件数据包并存储。
5. 根据权利要求1所述的方法,其特征在于,所述将编码值位于相同分段的多个数据文件整合存储多个文件数据包,包括:
在文件数据包所包含的数据文件数量超过预设阈值的情况下,在当前文件数据包所对应的分段中生成新的文件数据包并存储。
6. 根据权利要求1所述的方法,其特征在于,所述方法还包括:
为所述文件数据包生成索引信息,所述索引信息中至少包括:数据文件的索引键值、以及数据文件在文件数据包中的存储地址。
7. 根据权利要求1所述的方法,其特征在于,所述数据文件的索引键值为:
该数据文件的标识信息、或者标识信息的编码值。
8. 根据权利要求6所述的方法,其特征在于,所述方法还包括:
在生成索引信息后,根据数据文件的索引键值,对当前的索引信息进行排序。
9. 根据权利要求1所述的方法,其特征在于,所述方法还包括:
根据编码取值空间的分段结果以及对目标数据文件的编码结果,生成针对目标文件的多个任务包,所述任务包用于分配给不同的分布式任务执行模块。
10. 一种数据存储装置,其特征在于,包括:
分段单元,用于预先选取编码算法,并对编码的取值区间进行分段;
编码单元,用于利用所述编码算法,对目标数据文件的标识信息进行编码;
存储单元,用于根据编码结果,对编码值位于相同分段的多个数据文件进行整合存储;所述存储单元,具体用于:
将编码值位于相同分段的多个数据文件整合存储为一个或多个文件数据包。
11. 根据权利要求10所述的装置,其特征在于,
所述分段单元具体用于:在文件数据包大小超过预设阈值的情况下,对当前文件数据包所对应的分段进行再次划分;
所述存储单元具体用于:在新划分得到的分段中,分别生成新的文件数据包并存储。
12. 根据权利要求10所述的装置,其特征在于,
所述分段单元具体用于:在文件数据包所包含的数据文件数量超过预设阈值的情况下,对当前文件数据包所对应的分段进行再次划分;
所述存储单元具体用于:在新划分得到的分段中,分别生成新的文件数据包并存储。
13. 根据权利要求10所述的装置,其特征在于,
所述存储单元具体用于:在文件数据包大小超过预设阈值的情况下,在当前文件数据包所对应的分段中生成新的文件数据包并存储。
14. 根据权利要求10所述的装置,其特征在于,
所述存储单元具体用于:在文件数据包所包含的数据文件数量超过预设阈值的情况下,在当前文件数据包所对应的分段中生成新的文件数据包并存储。
15. 根据权利要求10所述的装置,其特征在于,所述装置还包括:
索引信息生成单元,用于为所述文件数据包生成索引信息,所述索引信息中至少包括:数据文件的索引键值、以及数据文件在文件数据包中的存储地址。
16. 根据权利要求10所述的装置,其特征在于,所述数据文件的索引键值为:
该数据文件的标识信息、或者标识信息的编码值。
17. 根据权利要求15所述的装置,其特征在于,
所述索引信息生成单元,还用于在生成索引信息后,根据数据文件的索引键值,对当前的索引信息进行排序。
18. 根据权利要求10所述的装置,其特征在于,所述装置还包括:
任务分配单元,用于根据编码取值空间的分段结果以及对目标数据文件的编码结果,生成针对目标文件的多个任务包,所述任务包用于分配给不同的分布式任务执行模块。”
申请人(下称“复审请求人”)对上述驳回决定不服,于2018年12月03日向国家知识产权局提出了复审请求,但没有修改申请文件。复审请求人认为:对比文件2公开的是纵向的两级维度的小文件整合存储的技术方案,与权利要求1的先确定编码算法、对编码算法的编码取值区间进行分段,再将小文件的标识信息的编码值位于相同分段的小文件整合存储的方案不同。对比文件1按照写入顺序缓存小文件,对比文件2按照小文件hash值整合小文件,都没有公开如果临时文件的小文件hash值的前6位不同该如何处理,或如果临时文件的大小已经达到第2预设值,临时文件中包括的小文件的hash值没有前6位相同的该如何处理。
经形式审查合格,国家知识产权局于2018年12月12日依法受理了该复审请求,并将其转送至原审查部门进行前置审查。
原审查部门在前置审查意见书中认为,权利要求1只限定了“对编码值位于相同分段的多个数据文件进行整合存储”,对于具体的编码方式以及分段方式没有进行限定,对比文件2公开了对小文件的文件名进行哈希编码,并将编码值处于相同段的文件存储在一个文件夹下。对比文件2的技术方案存在“大量小文件存储导致碎片化”的技术问题。对比文件1解决了此技术问题,因而坚持原驳回决定。
随后,国家知识产权局成立合议组对本案进行审理。
合议组于2019年05月17日向复审请求人发出复审通知书,指出:权利要求1-18不具备专利法第22条第3款规定的创造性。针对复审请求人的意见陈述指出:本申请权利要求1只限定了“对编码值位于相同分段的多个数据文件进行整合存储”,没有限定编码方式以及分段方式,对比文件2公开了一种编码方式,在权利要求1要求保护的范围之内。基于权利要求1与对比文件1的区别技术特征,本申请实际所要解决的技术问题是:如何对多个数据文件进行划分编码,对比文件2恰恰解决了该技术问题。而复审请求人提出的技术问题并不是本申请权利要求1涉及的。
复审请求人于2019年05月30日提交了意见陈述书,同时提交了权利要求书的修改替换页。将权利要求1和10中的“并对编码的取值区间进行分段”修改为“并对编码的取值区间进行平均分段,每个分段对应的至少一个整合存储的文件数据包”,将权利要求9和18中涉及的“取值空间”修改为“取值区间”,以与其引用的权利要求中的表述一致。复审请求人认为:对比文件2公开了一种海量小文件存储方法,但对比文件2中存储文件的方式是将文件名的hash值分成两部分,前一部分用来分配文件夹,后一部分用来分配某一文件夹。本申请中对编码的取值区间进行平均分段,每个分段对应至少一个整合存储的文件数据包。
复审请求人新修改的权利要求书如下:“
1. 一种数据存储方法,其特征在于,包括:
预先选取编码算法,并对编码的取值区间进行平均分段,每个分段对应至少一个整合存储的文件数据包;
利用所述编码算法,对目标数据文件的标识信息进行编码;
根据编码结果,对编码值位于相同分段的多个数据文件进行整合存储;
所述对编码值位于相同分段的多个数据文件进行整合存储,包括:
将编码值位于相同分段的多个数据文件整合存储为一个或多个文件数据包。
2. 根据权利要求1所述的方法,其特征在于,所述将编码值位于相同分段的多个数据文件整合存储为一个文件数据包,包括:
在文件数据包大小超过预设阈值的情况下,对当前文件数据包所对应的分段进行再次划分;
在新划分得到的分段中,分别生成新的文件数据包并存储。
3. 根据权利要求1所述的方法,其特征在于,所述将编码值位于相同分段的多个数据文件整合存储为一个文件数据包,包括:
在文件数据包所包含的数据文件数量超过预设阈值的情况下,对当前文件数据包所对应的分段进行再次划分;
在新划分得到的分段中,分别生成新的文件数据包并存储。
4. 根据权利要求1所述的方法,其特征在于,所述将编码值位于相同分段的多个数据文件整合存储为多个文件数据包,包括:
在文件数据包大小超过预设阈值的情况下,在当前文件数据包所对应的分段中生成新的文件数据包并存储。
5. 根据权利要求1所述的方法,其特征在于,所述将编码值位于相同分段的多个数据文件整合存储多个文件数据包,包括:
在文件数据包所包含的数据文件数量超过预设阈值的情况下,在当前文 件数据包所对应的分段中生成新的文件数据包并存储。
6. 根据权利要求1所述的方法,其特征在于,所述方法还包括:
为所述文件数据包生成索引信息,所述索引信息中至少包括:数据文件的索引键值、以及数据文件在文件数据包中的存储地址。
7. 根据权利要求1所述的方法,其特征在于,所述数据文件的索引键值为:
该数据文件的标识信息、或者标识信息的编码值。
8. 根据权利要求6所述的方法,其特征在于,所述方法还包括:
在生成索引信息后,根据数据文件的索引键值,对当前的索引信息进行排序。
9. 根据权利要求1所述的方法,其特征在于,所述方法还包括:
根据编码取值区间的分段结果以及对目标数据文件的编码结果,生成针对目标文件的多个任务包,所述任务包用于分配给不同的分布式任务执行模块。
10. 一种数据存储装置,其特征在于,包括:
分段单元,用于预先选取编码算法,并对编码的取值区间进行平均分段,每个分段对应至少一个整合存储的文件数据包;
编码单元,用于利用所述编码算法,对目标数据文件的标识信息进行编码;
存储单元,用于根据编码结果,对编码值位于相同分段的多个数据文件进行整合存储;所述存储单元,具体用于:
将编码值位于相同分段的多个数据文件整合存储为一个或多个文件数据包。
11. 根据权利要求10所述的装置,其特征在于,
所述分段单元具体用于:在文件数据包大小超过预设阈值的情况下,对当前文件数据包所对应的分段进行再次划分;
所述存储单元具体用于:在新划分得到的分段中,分别生成新的文件数 据包并存储。
12. 根据权利要求10所述的装置,其特征在于,
所述分段单元具体用于:在文件数据包所包含的数据文件数量超过预设阈值的情况下,对当前文件数据包所对应的分段进行再次划分;
所述存储单元具体用于:在新划分得到的分段中,分别生成新的文件数据包并存储。
13. 根据权利要求10所述的装置,其特征在于,
所述存储单元具体用于:在文件数据包大小超过预设阈值的情况下,在当前文件数据包所对应的分段中生成新的文件数据包并存储。
14. 根据权利要求10所述的装置,其特征在于,
所述存储单元具体用于:在文件数据包所包含的数据文件数量超过预设阈值的情况下,在当前文件数据包所对应的分段中生成新的文件数据包并存储。
15. 根据权利要求10所述的装置,其特征在于,所述装置还包括:
索引信息生成单元,用于为所述文件数据包生成索引信息,所述索引信息中至少包括:数据文件的索引键值、以及数据文件在文件数据包中的存储地址。
16. 根据权利要求10所述的装置,其特征在于,所述数据文件的索引键值为:
该数据文件的标识信息、或者标识信息的编码值。
17. 根据权利要求15所述的装置,其特征在于,
所述索引信息生成单元,还用于在生成索引信息后,根据数据文件的索引键值,对当前的索引信息进行排序。
18. 根据权利要求10所述的装置,其特征在于,所述装置还包括:
任务分配单元,用于根据编码取值区间的分段结果以及对目标数据文件的编码结果,生成针对目标文件的多个任务包,所述任务包用于分配给不同的分布式任务执行模块。”
在上述程序的基础上,合议组认为本案事实已经清楚,可以作出审查决定。
二、决定的理由
1.审查文本的认定
复审请求人在答复复审通知书时修改了权利要求书,经过审查,该修改符合专利法第33条和专利法实施细则第61条第1款的规定。本复审决定所依据的文本为:复审请求人于2019年05月30日提交的权利要求第1-18项;申请日2012年08月29日提交的说明书摘要、摘要附图;初审审查员依职权修改的申请日2012年08月29日提交的说明书附图图1-11;2012年11月08日提交的说明书第1-215段。
2.具体理由的阐述
创造性,是指与现有技术相比,该发明具有突出的实质性特点和显著的进步,该实用新型具有实质性特点和进步。
如果一项权利要求与作为最接近现有技术的对比文件相比存在多个区别技术特征,部分区别技术特征被其他对比文件公开,部分区别技术特征未被该其他对比文件公开,也不是本领域公知常识,同时由于该部分区别技术特征的存在使得该权利要求的技术方案获得了有益的技术效果,则该权利要求相对于上述对比文件和公知常识的结合具备创造性。
本复审决定引用驳回决定以及复审通知书中引用的对比文件1-3作为现有技术,即:
对比文件1:CN101854388A,公开日为:2010年10月06日;
对比文件2:“Linux下海量小文件存储及检索优化技术的研究与应用”,王晨,中国优秀硕士学位论文全文数据库信息科技辑,第9期,第I138-588页,公开日为:2011年09月15日;
对比文件3:CN 101373473A,公开日2009年02月25日。
权利要求1-9符合专利法第22条第3款有关创造性的规定。
权利要求1请求保护一种数据存储方法,对比文件1公开了一种集群存储中并行访问大量小文件的方法,具体公开了以下技术特征(参见说明书第23-31段):包括:对写入的小文件进行缓存;将缓存的多个小文件合并为一个临时文件,具体为当缓存的小文件的大小的总和达到一第一预设值时,将所述缓存的小文件合并成一个临时文件,存放在缓存中;将所述临时文件的元数据和数据对象存储至元数据服务器节点和数据服务器节点的后端存储中(相当于“一种数据存储方法,对多个数据文件进行整合存储,包括将多个数据文件整合存储为一个或多个文件数据包”)。
权利要求1所请求保护的技术方案与对比文件1所公开的内容相比,区别技术特征为:用于整合的多个数据文件的方法为:预先选取编码算法,并对编码的取值区间进行平均分段,每个分段对应至少一个整合存储的文件数据包;利用所述编码算法,对目标数据文件的标识信息进行编码,根据编码结果,选取编码值位于相同分段的文件作为所述多个数据文件。基于上述区别技术特征,本申请实际解决的技术问题是:如何对多个数据文件进行划分编码。
对比文件2公开了一种海量小文件存储方法,具体公开了以下技术特征(参见第4.1节,第4.2节,第4.3.2节,图4-3):把原来在一个目录下的大量小文件按照一定的规则分别存储于不同的目录中,子目录分装算法:由图4-3可知,对给定待创建的文件名进行Hash运算(相当于“预先选取编码算法”),得到32bit的hash值(相当于“利用所述编码算法,对目标数据文件的标识信息进行编码”),用 16 进制的 char型数据来保存这个结果,也就是有 8 个 16 进制的 char 型字符,将这 8 个字符一分为二,前 6 个字符位用来分配文件夹,而后 2 个字符位用来分配某一文件夹下的文件,只要是根据文件名所得到的 hash 值的前 6 个 16 进制字符位,也就是前24 个 bit 相同的文件(相当于“对编码的取值区间进行分段”),分配到同一个文件夹下面(相当于将编码值位于相同分段的多个数据文件存储在同一个文件夹下面)。
对比文件2没有公开“对编码的取值区间进行平均分段,每个分段对应至少一个整合存储的文件数据包”的技术特征。上述技术特征也不是公知常识。基于上述区别技术特征,无论是怎样的目标数据文件,一旦编码算法确定了,其对应的编码取值空间就确定了,对该取值空间进行分段后,各数据文件的编码值必然落入其中一个分段中且分布状况基本平均,使得本申请的技术方案具有可以更合理地对数据文件进行整合存储的有益效果。
对比文件3公开了一种一种嵌入式系统闪存中文件存储方法。但也未公开权利要求1的上述区别技术特征,也未给出相应的技术启示。
因此,在对比文件1的基础上结合对比文件2、对比文件3和公知常识得到权利要求1要求保护的技术方案是非显而易见的,权利要求1所要求保护的技术方案具备突出的实质性特点和显著的进步,因而具备创造性。
权利要求10-18符合专利法第22条第3款规定的创造性。
权利要求10-18是权利要求1-9所对应的装置,其限定部分的技术特征一一对应,由上所述对权利要求1-9具备创造性的评述,权利要求10-18也具备创造性。
对驳回和前置相关意见的评述
复审请求人在答复复审通知书时对权利要求进行了修改,其新增加的技术特征,对比文件1-3均未公开,也不是本领域公知常识。新增加的技术特征进一步限定了编码的取值区间的分配方式以及整合方式,使得数据文件的整合存储更加合理。因此,修改后的权利要求具备创造性。
三、决定
撤销国家知识产权局于2018年08月28日对本申请作出的驳回决定。由国家知识产权局原审查部门以下述文本为基础继续进行审批程序:复审请求人于2019年05月30日提交的权利要求第1-18项;申请日2012年08月29日提交的说明书摘要、摘要附图;初审审查员依职权修改的申请日2012年08月29日提交的说明书附图图1-11;2012年11月08日提交的说明书第1-215段。
如对本复审请求审查决定不服,根据专利法第41条第2款的规定,复审请求人可自收到本决定之日起三个月内向北京知识产权法院起诉。


郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如作者信息标记有误,请第一时间联系我们修改或删除,多谢。

留言与评论(共有 0 条评论)
   
验证码: