发明创造名称:版式文档的处理方法及装置
外观设计名称:
决定号:182442
决定日:2019-06-28
委内编号:1F258854
优先权日:
申请(专利)号:201410753650.3
申请日:2014-12-10
复审请求人:百度在线网络技术(北京)有限公司
无效请求人:
授权公告日:
审定公告日:
专利权人:
主审员:张焰
合议组组长:韩燕
参审员:吴敏
国际分类号:G06F17/24
外观设计分类号:
法律依据:专利法第二十二条第三款
决定要点:
全文:
本复审请求涉及申请号为201410753650.3、名称为“版式文档的处理方法及装置”的发明专利申请(下称本申请)。本申请的申请人为百度在线网络技术(北京)有限公司,申请日为2014年12月10日,公开日为2015年04月22日。
国家知识产权局原审查部门于2018年05月03日对本申请发出了驳回决定,指出权利要求1-10相对于对比文件1(CN101206639A,公开日为2008年06月25日)、对比文件2(CN101923723A,公开日为2010年12月22日)和本领域常用技术手段的结合不具备专利法第二十二条第三款规定的创造性。
驳回决定所依据的文本是:申请日2014年12月10日提交的说明书摘要,摘要附图,说明书第0001-0119段,说明书附图图1-2;2017年05月03日提交的权利要求第1-10项。
驳回决定所针对的权利要求第1-10项如下:
“1. 一种版式文档的处理方法,其特征在于,包括:
获取版式文档中所包括的文本内容的元数据;
对所述文本内容的元数据进行合并处理,以获得至少一个行的展现行数据,所述至少一个行中每个行的展现行数据包括该行的行标识信息和该行所包括的文本内容的元数据;
根据所述每个行的展现行数据,以流式展现方式,展现所述版式文档;
其中,所述根据所述每个行的展现行数据,以流式展现方式,展现所述版式文档,包括:
对所述至少一个行的展现行数据进行合并处理,以获得至少一个模块的展现模块数据,所述至少一个模块中每个模块的展现模块数据包括该模块的模块标识信息和该模块所包括的行的展现行数据;
根据所述每个模块的展现模块数据,以流式展现方式,展现所述版式文档。
2. 根据权利要求1所述的方法,其特征在于,所述对所述文本内容的元数据进行合并处理,以获得至少一个行的展现行数据,包括:
对所述文本内容的元数据进行合并处理,以获得至少一个行的初始行数据,所述至少一个行中每个行的初始行数据包括该行的行标识信息和该行所包括的文本内容的元数据;
对所述每个行的初始行数据中所包括的文本内容的元数据的顺序进行调整,以获得所述每个行的展现行数据。
3. 根据权利要求1所述的方法,其特征在于,所述对所述至少一个行的展现行数据进行合并处理,以获得至少一个模块的展现模块数据,包括:
对所述至少一个行的展现行数据进行合并处理,以获得至少一个模块的初始模块数据,所述至少一个模块中每个模块的初始模块数据包括该模块的模块标识信息和该模块所包括的行的展现行数据;
对所述每个模块所包括的行的展现行数据的顺序进行调整,以获得所述每个模块的展现模块数据。
4. 根据权利要求1所述的方法,其特征在于,所述根据所述每个模块的展现模块数据,以流式展现方式,展现所述版式文档,包括:
获取所述版式文档中所包括的图片内容的元数据;
根据所述每个模块的展现模块数据和所述图片内容的元数据,将所述图片内容的元数据插入对应模块的展现模块数据,以获得所述对应模块的绑定模块数据;
根据所述对应模块的绑定模块数据,以及所述至少一个模块中除了所述对应模块之外的其他模块的展现模块数据,以流式展现方式,展现所述版式文档。
5. 根据权利要求1所述的方法,其特征在于,所述根据所述每个模块的展现模块数据,以流式展现方式,展现所述版式文档之前,还包括:
对用于描述所述版式文档的外围属性的模块的展现模块数据进行调整处理。
6. 一种版式文档的处理装置,其特征在于,包括:
获取单元,用于获取版式文档中所包括的文本内容的元数据;
合并单元,用于对所述文本内容的元数据进行合并处理,以获得至少一个行的展现行数据,所述至少一个行中每个行的展现行数据包括该行的行标识信息和该行所包括的文本内容的元数据;
展现单元,用于根据所述每个行的展现行数据,以流式展现方式,展现所述版式文档;
其中,所述展现单元,具体用于
对所述至少一个行的展现行数据进行合并处理,以获得至少一个模块的展现模块数据,所述至少一个模块中每个模块的展现模块数据包括该模块的模块标识信息和该模块所包括的行的展现行数据;以及
根据所述每个模块的展现模块数据,以流式展现方式,展现所述版式文档。
7. 根据权利要求6所述的装置,其特征在于,所述合并单元,具体用于
对所述文本内容的元数据进行合并处理,以获得至少一个行的初始行数据,所述至少一个行中每个行的初始行数据包括该行的行标识信息和该行所包括的文本内容的元数据;以及
对所述每个行的初始行数据中所包括的文本内容的元数据的顺序进行调整,以获得所述每个行的展现行数据。
8. 根据权利要求6所述的装置,其特征在于,所述展现单元,具体用于
对所述至少一个行的展现行数据进行合并处理,以获得至少一个模块的初始模块数据,所述至少一个模块中每个模块的初始模块数据包括该模块的模块标识信息和该模块所包括的行的展现行数据;以及
对所述每个模块所包括的行的展现行数据的顺序进行调整,以获得所述每个模块的展现模块数据。
9. 根据权利要求6所述的装置,其特征在于,所述展现单元,具体用于
获取所述版式文档中所包括的图片内容的元数据;
根据所述每个模块的展现模块数据和所述图片内容的元数据,将所述图片内容的元数据插入对应模块的展现模块数据,以获得所述对应模块的绑定模块数据;以及
根据所述对应模块的绑定模块数据,以及所述至少一个模块中除了所述对应模块之外的其他模块的展现模块数据,以流式展现方式,展现所述版式文档。
10. 根据权利要求6所述的装置,其特征在于,所述展现单元,还用于
对用于描述所述版式文档的外围属性的模块的展现模块数据进行调整处理。”
申请人(下称复审请求人)对上述驳回决定不服,于2018年08月20日向国家知识产权局提出复审请求,没有提交修改文本。复审请求人认为:(a)权利要求1与对比文件1的区别在于:“1、对所述文本内容的元数据进行合并处理,以获得至少一个行的展现行数据,所述至少一个行中每个行的展现行数据包括该行的行标识信息和该行所包括的文本内容的元数据;2、对所述至少一个行的展现行数据进行合并处理,以获得至少一个模块的展现模块数据,所述至少一个模块中每个模块的展现模块数据包括该模块的模块标识信息和该模块所包括的行的展现行数据;根据所述每个模块的展现模块数据,以流式展现方式,展现所述版式文档”,权利要求1相对于对比文件1实际解决的问题在于如何根据终端显示设备的尺寸灵活显示版式文档,从而提高版式文档处理的效率和灵活性。(b)对比文件1的方案中只需要对文章进行标引,而无需受限于终端显示设备的尺寸,因此对比文件1中不存在以上实际解决的技术问题,不存在这种改进任务,本领域技术人员不可能想到使用以上区别特征对对比文件1进行改进。综上,权利要求相对于以上对比文件具备创造性。
经形式审查合格,国家知识产权局于2018年08月29日依法受理了该复审请求,并将其转送至原审查部门进行前置审查。
原审查部门在前置审查意见书中坚持驳回意见。
随后,国家知识产权局成立合议组对本案进行审理。
本案合议组于2019年02月03日发出复审通知书,指出权利要求1-10不具备专利法第二十二条第三款规定的创造性。
复审请求人于2019年03月07日提交了意见陈述,并未提交修改文本。复审请求人认为:(a)权利要求1与对比文件2的区别包括“(1)获取版式文档中所包括的文本内容的元数据;(2)对所述文本内容的元数据进行合并处理,以获得至少一个行的展现行数据,所述至少一个行中每个行的展现行数据包括该行的行标识信息和该行所包括的文本内容的元数据”。(b)权利要求1中是获取版式文档中所包括文本内容的元数据、而对比文件2中是获取非版式文档中对象的属性,两者是不同的。虽然对比文件2中公开了对页面进行排版,但是其排版方式并未公开如何基于各行的展现行数据重新对页面进行排版的具体实现。因此,对比文件2并未公开解析获取文本内容的元数据、而是版式文档中对象的属性;其次,对比文件2只是展示了一个段落展示效果,并未公开如何实现该段落展示效果的具体实现手段,本领域技术人员基于对比文件2的记载无法确定可以实现其段落展示效果;另外,“设置行标识信息与行展示数据的对应,以及模块标识信息与模块展示数据的对应”并非本领域常用技术手段。综上,权利要求相对于以上对比文件具备创造性。
在上述程序的基础上,合议组认为本案事实已经清楚,可以作出审查决定。
二、决定的理由
(一)审查文本的认定
复审请求人于复审程序阶段并未提交修改的申请文件。因此,本复审决定所依据的审查文本与驳回文本相同,即:申请日2014年12月10日提交的说明书摘要,摘要附图,说明书第0001-0119段,说明书附图图1-2;2017年05月03日提交的权利要求第1-10项。
(二)关于专利法第二十二条第三款
专利法第二十二条第三款规定:创造性,是指与现有技术相比,该发明具有突出的实质性特点和显著的进步,该实用新型具有实质性特点和进步。
如果一项权利要求与最接近的现有技术存在区别,而以上区别是本领域技术人员基于已有其他对比文件和本领域常用技术手段的启示容易想到的,那么该权利要求不具备创造性。
本复审决定引用了驳回决定和复审通知书中的对比文件:
对比文件1:CN101206639A,公开日为2008年06月25日;
对比文件2:CN101923723A,公开日为2010年12月22日。
独立权利要求1不具备专利法第二十二条第三款规定的创造性。
权利要求1请求保护一种版式文档的处理方法。
对比文件2涉及一种实现电子文档显示的方法,并具体公开了以下内容(参见说明书第0002-0007、0047-0077段,图1、9-20):
(参见说明书第0002-0008段)PDF的版式模式中,文字显示位置对于文件的位置已经明确,与文字的信息无关,有可能出现一个句子的后半部分比其前半部分现在内容描述流中出现,这给版式文件中数据的提取和检索带来困难。
在电子阅读装置中,由于屏幕分辨率或显示区域的限制,经常出现在阅读PDF文档时显示区域的一部分在显示区域之外的情况。
本发明要解决的问题是提供一种通过标识位对页面进行定位,形成不同放大比例的流式显示页面,利用多模式分别对图片和文字进行处理,而且能够实现在页面之间方便切换,并对页面的版式模式和流式模式进行快速编辑的功能的电子文档显示方法。
(见说明书第0010-0011段)步骤S1,将电子文档按照版式进行解析,将解析得到的内容存储到一存储模块。步骤S2,根据存储模块中的内容对文档进行分类,设定分类后的文档中页面的缩放标志位,根据缩放标志位显示解析出的内容。
(见说明书第0065段)本申请将电子文档按照版式进行解析排版,设定并保存流式显示模式。具体地:若页面为文字页,则解析得到的该对应页面项中的对象的属性为文字(相当于获取版式文档中所包括的文本内容的元数据);根据所述缩放标志位将文字放大相应的倍数,改变对应的字体的属性,计算出待绘制文字的位置,得到绘制文字的坐标,并和页面项中的字体标识生成对应的文字,将其存储到内存中的页面区域中;根据文字的宽度确定每行显示的字数,重新对页面进行了排版(相当于对所述文本内容的元数据进行合并处理,以获得至少一个展现数据),同时设定并保存流式显示模式,使文字能自动换行,并根据缩放标志位定位下一页(相当于根据所述每个展现数据,以流式展现方式,展现所述版式文档)。
根据展现数据,流式展现方式展现所述版式文件,参见下图17-18:
(见说明书第0074-0077段)如图12所示,在页面项中读取图片对象的信息,读取图片对象在页面图片区域中的坐标、显示的宽度和高度;并根据交叉引用表中的对应位置查到图片对象的属性(包换图片的实际的宽、高度、压缩类型、色阶、图片数据的长度等信息),按照用户在屏幕上设置的输出图片的尺寸与PDF存储的实际图片的尺寸,对图片进行缩放,计算输出的图片对象的宽度和高度,确定图片的位置。
本实施例中,根据解析出的对象的坐标位置,对首行数据是文字对象还是图片对象进行判断,如果首行数据为图片对象,则根据设置的缩放的比例而得到的图片坐标和宽度、高度,生成图片,并存储到内存中的页面图片区域中。将页面中的文字根据缩放标志位缩放相应的倍数,在图片余下的空白位置处根据文字的宽度确定该行显示的字数。实施例中,该页面项中的文字对象根据设置的图片的缩放比率计算出首行文字对象绘制的位置,并根据该行文字对象的高度和坐标计算下一行的文字对象的起始坐标,重新对页面进行了排版,同时设定并保存流式显示模式,使文字能够自动换行。如果首行数据不为图片对象,则首先确定页面项中图片对象的坐标和宽度、高度,并根据文字对象的高度和坐标在屏幕上图片对象的余下的位置进行排版,同时设定并保存流式显示模式,使文字能够自动换行。
该页显示完毕后,根据传递的缩放标志位定位下一页。
图13从左至右分别为适应屏宽和适应屏高对文字进行显示的演示图;图14从左至右分别为对文字进行一倍放大和对缩放菜单进行显示的演示图;图15从左至右分别为适应屏宽和适应屏高对图片进行显示的演示图;图16为对图片进行一倍放大的滚动状态图;图17从左至右分别为适应屏宽和适应屏高对图文进行显示的演示图;图18从左至右分别为仅对文字进行一倍放大的演示图和仅对图片进行一倍放大的演示图;图19从左至右分别为对文字和图片进行一倍放大的演示图和仅显示文字的演示图;图20为对缩放菜单进行显示的图文演示图。
由此可见,对比文件2公开了一种发明构思,将PDF为代表的版式文件的元数据读入解析,重新排版,形成流式显示排版,并且流式排版能够自动调整行展示数据和段展示数据的字符大小尺寸和字符数量,并自适应显示器的屏幕。
权利要求1与对比文件2的区别在于:
展现数据为包括行标识信息的行的展现行数据;还包括:对至少所述一个行的展现行数据进行合并处理,以获得至少一个模块的展现模块数据,所述至少一个模块中每个模块的展现模块数据包括该模块标识信息和该模块所包括的行的展现行数据。
基于上述区别特征,该权利要求相对于对比文件2实际解决的问题在于:
在流式展现方式之前如何体现排版设定一个展现行/展现模块中显示文本内容元数据与该展现行/展现模块的对应关系标识;以及在流式展现方式中如何基于多个行展示数据来获得更大的展现集合单元,例如句子或段落等。
关于以上区别,
本领域技术人员知晓,权利要求1与对比文件2的区别实质在于权利要求读入版式文档元数据时,给数据分配了“行标识信息”以及“模块表示信息”(即行编号和模块编号),然后再进行流式展现。
基于对比文件2公开的内容——根据文字的宽度确定每行显示的字数,重新对页面进行了排版,同时设定并保存流式显示模式,使文字能自动换行,并根据缩放标志位定位下一页。可见对比文件2已经给出了将展现行与展现文字对应的方式。进一步地,根据对比文件2的图17-20所示,对比文件2不仅对实现了对新生成“行”的页面排版和流式显示模式,而且多个新“行”构成了内容一致的同一主题的句子或段落(类似模块),例如图17中第一行标题“爱动脑筋的小王戎”、第二行“晋朝时候,有”、第三行“个叫王戎的小朋”、第四行“友,那年他11岁”以及第五行“了。”。因此,对比文件2已经实现了自动换行的行展示和自动段落格式的段落展示。可见,基于读取解析元数据的过程,和自动换行、自动成段的流式显示效果,本领域技术人员容易想到设置行标识信息与行展示数据的对应,以及模块表示信息与模块展示数据的对应。这是本领域技术人员可以选择的一种常规设计手段。
同时,对比文件1公开了一种基于PDF的复杂版面的标引方法,具体公开了(参见说明书第3页第3段)(1)导入报刊版面的PDF文件,对PDF进行分析,获取版面上的全部的文字内容、文字的位置、字体、字号和序号信息,得到一个原始文字块的列表L(相当于获取版式文档中所包括的文本内容的元数据)。(参见说明书第3页第4、5段)步骤(2)和步骤(3)对原始文字块进行聚类,聚类的依据是存在临近关系的文字块加入一个集合,按照排版类型和原始文字块的位置对每个集合中的原始文字块进行排序,并合并该集合的所有原始文字块,得到合并文字块(相当于对所述文本内容的元数据进行合并处理);(5)对多个合并文字块进行在合并,构建文章。可见对比文件1给出了对文字元数据进行第一阶段合并后,继续进行第二阶段合并的技术启示。
在本领域中,对文档的元数据进行展现的基本格式就是“行”与“段”(类似模块),因此在对比文件2公开了流式显示模式、重新确定每行显示的字数、自动保持段落对页面进行重新排版的技术启示,以及对比文件1中公开的文字字符2次合并过程的技术启示的情况下,本领域技术人员容易想到给通过设置行标识字段和模块标识字段来进行流式展现方式,从而契合不同显示器的排版显示灵活性。
综上所述,该权利要求相对于对比文件2、对比文件1和本领域常用技术手段的结合是容易想到的,其不具备突出的实质性特点和显著的进步,不具备专利法第二十二条第三款规定的创造性。
从属权利要求2-5不具备专利法第二十二条第三款规定的创造性。
权利要求2:
对比文件1公开了:(参见说明书第3页)对原始文字块进行聚类,聚类的依据是存在临近关系的文字块加入一个集合(类似于初始合并的数据);(参见说明书第3页)按照排版类型和原始文字块的位置对每个集合中的原始文字块进行排序,并合并该集合的所有原始文字块,得到合并文字块(这里排序类似于对初始合并中的元数据进行顺序的调整)。可见对比文件1已经给出了将提取的元数据文字块进行进一步排序调整的技术启示。基于权利要求1的评述可知,将元数据合并处理为行数据并加上行标识信息,从而进行展现,这是本领域技术人员容易想到的。因此该附加特征也是本领域技术人员容易想到的。
权利要求3:
对比文件1公开了:(参见说明书第3页第4段)对原始文字块进行聚类,聚类的依据是存在临近关系的文字块加入一个集合(类似于初始合并的数据),(参见说明书第5页第19段)步骤(5)中,对多个合并文字块进行再合并,采用人工干预的方法,或者根据文字块的位置、排版类型、字体字号、语义和词性信息进行智能分析和合并。对比文件1已经公开了将元数据合并为初始文字块,在进行调整来进一步的合并。则本领域技术同样可以将至少一个行的展现行数据进行合并处理,以获得至少一个模块的初始模块数据(例如对比文件2的图18-20应给出了基于版式数据读取解析后的流式展示自动换行、自动成段的效果),对所述每个模块所包括的行的展现行数据的顺序进行调整,以获得所述每个模块的展现模块数据,同时,所述至少一个模块中每个模块的初始模块数据包括该模块的模块标识信息和该模块所包括的行的展现行数据,这是本领域技术人员容易想到的,无需创造性劳动。
权利要求4:
对比文件2进一步公开了:(参见权利要求10)所述页面为图文页时,分别对所述图片和文字进行处理的步骤包括,提取所述页面中的图片(相当于“获取所述版式文档中所包括的图片内容的元数据”),将所述页面中的文字根据所述缩放标志位缩放相应的倍数,在图片余下的空白位置处根据所述文字的宽度确定该行显示的字数,重新对所述页面进行排版,设定并保存流式显示模式(相当于将图片与文字进行融合显示,并且公开了“根据所述对应模块的绑定模块数据,以及所述至少一个模块中除了所述对应模块之外的其他模块的展现模块数据,以流式展现方式,展现所述版式文档”)。而为了将图片与文字部分进行融合,将所述图片内容的元数据插入对应模块的展现模块数据,以获得所述对应模块的绑定模块数据,这是本领域的常用手段。
权利要求5:
在展示版式文档之前,为了避免外围属性的模块不能进行适应性的展现,同样也需要进行相应的调整,则对用于描述所述版式文档的外围属性的模块的展现模块数据进行调整处理是本领域的常用手段。
综上所述,权利要求2-5也不具备专利法第二十二条第三款规定的创造性。
权利要求6-10不具备专利法第二十二条第三款规定的创造性。
权利要求6-10是方法权利要求1-5所对应的产品权利要求,其技术特征一一对应,基于与权利要求1-5不具备创造性相似的理由,权利要求6-10也不符合专利法第二十二条第三款规定的创造性。
(三)关于复审请求人的意见陈述
合议组认为:
首先,权利要求中限定的“版式文档中所包括的文本内容的元数据”中的“元数据”是限定了一个宽泛的保护范围,而对比文件2的方案中获取了版式文档中的文字、图像等内容、及这些内容对应的属性,这些均是“元数据”的下位概念。
其次,本领域技术人员知晓,权利要求1与对比文件2的区别实质在于权利要求读入版式文档元数据时,给数据分配了“行标识信息”以及“模块表示信息”(即行编号和模块编号),然后再进行流式展现。
基于对比文件2公开的内容——根据文字的宽度确定每行显示的字数,重新对页面进行了排版,同时设定并保存流式显示模式,使文字能自动换行,并根据缩放标志位定位下一页。可见对比文件2已经给出了将展现行与展现文字对应的方式。进一步地,根据对比文件2的图17-20所示,对比文件2不仅对实现了对新生成“行”的页面排版和流式显示模式,而且多个新“行”构成了内容一致的同一主题的句子或段落(类似模块),例如图17中第一行标题“爱动脑筋的小王戎”、第二行“晋朝时候,有”、第三行“个叫王戎的小朋”、第四行“友,那年他11岁”以及第五行“了。”。因此,对比文件2已经实现了自动换行的行展示和自动段落格式的段落展示。可见,基于读取解析元数据的过程,和自动换行、自动成段的流式显示效果,本领域技术人员容易想到设置行标识信息与行展示数据的对应,以及模块表示信息与模块展示数据的对应。这是本领域技术人员可以选择的一种常规设计手段。
同时,对比文件1公开了一种基于PDF的复杂版面的标引方法,具体公开了(参见说明书第3页第3段)(1)导入报刊版面的PDF文件,对PDF进行分析,获取版面上的全部的文字内容、文字的位置、字体、字号和序号信息,得到一个原始文字块的列表L(相当于获取版式文档中所包括的文本内容的元数据。(参见说明书第3页第4、5段)步骤(2)和步骤(3)对原始文字块进行聚类,聚类的依据是存在临近关系的文字块加入一个集合,按照排版类型和原始文字块的位置对每个集合中的原始文字块进行排序,并合并该集合的所有原始文字块,得到合并文字块(相当于对所述文本内容的元数据进行合并处理);(5)对多个合并文字块进行在合并,构建文章。可见对比文件1给出了对文字元数据进行第一阶段合并后,继续进行第二阶段合并的技术启示。
在本领域中,对文档的元数据进行展现的基本格式就是“行”与“段”(类似模块),因此在对比文件2公开了流式显示模式、重新确定每行显示的字数、自动保持段落对页面进行重新排版的技术启示,以及对比文件1中公开的文字字符2次合并过程的技术启示的情况下,本领域技术人员容易想到给通过设置行标识字段和模块标识字段来进行流式展现方式,从而契合不同显示器的排版显示灵活性。
综上,合议组对复审请求人的意见陈述不予支持。
三、决定
维持国家知识产权局于2018年05月03日对本申请作出的驳回决定。
如对本复审请求审查决定不服,根据专利法第四十一条第二款的规定,复审请求人可以自收到本决定之日起三个月内向北京知识产权法院起诉。
郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如作者信息标记有误,请第一时间联系我们修改或删除,多谢。