一种提取页面信息的方法及装置-复审决定


发明创造名称:一种提取页面信息的方法及装置
外观设计名称:
决定号:182077
决定日:2019-06-19
委内编号:1F242416
优先权日:
申请(专利)号:201510335008.8
申请日:2015-06-15
复审请求人:广州市动景计算机科技有限公司
无效请求人:
授权公告日:
审定公告日:
专利权人:
主审员:鞠博
合议组组长:吴少鸿
参审员:杜婧子
国际分类号:G06F17/30
外观设计分类号:
法律依据:专利法第22条第3款
决定要点:如果一项权利要求请求保护的技术方案相对于作为最接近的现有技术的对比文件存在多个区别技术特征,上述多个区别技术特征部分被其他对比文件公开且所起作用相同,其余部分属于本领域的惯用技术手段,则该项权利要求请求保护的技术方案不具备创造性。
全文:
本复审请求涉及申请号为201510335008.8,名称为“一种提取页面信息的方法及装置”的发明专利申请(下称本申请)。本申请的申请人为广州市动景计算机科技有限公司,申请日为2015年06月15日,公开日为2016年05月18日。
经实质审查,国家知识产权局实质审查部门于2017年09月28日发出驳回决定,驳回了本申请,其理由是:权利要求1-20不具备专利法第22条第3款规定的创造性。驳回决定所依据的文本为:2017年01月16日提交的权利要求第1-20项;申请日2015年06月15日提交的说明书第1-33页、说明书附图第1-4页、说明书摘要、摘要附图。
驳回决定所针对的权利要求书的内容如下:
“1. 一种提取页面信息的方法,其特征在于,所述方法包括:
获取网页中待处理的源代码;
根据预设的过滤特征字符串和预设的标签匹配模式,获取所述源代码中不是与所述过滤特征字符串相匹配的标签信息,若所述标签信息符合所述标签匹配模式,将该标签信息确定为目标信息,提取所述目标信息,其中,所述过滤特征字符串根据不同的移动终端定义设置;
根据提取的所述目标信息生成指定格式的页面信息。
2. 根据权利要求1所述的方法,其特征在于,所述获取所述源代码中不是与所述过滤特征字符串相匹配的标签信息,若所述标签信息符合所述标签匹配模式,将该标签信息确定为目标信息,提取所述目标信息,包括:
对所述源代码进行词法分析,得到所述源代码的每个标签信息;
从所述每个标签信息中,删除与预设的过滤特征字符串相匹配的标签信息;
从未删除的标签信息中,提取符合预设的标签匹配模式的标签信息作为目标信息。
3. 根据权利要求2所述的方法,其特征在于,所述从所述每个标签信息中,删除与预设的过滤特征字符串相匹配的标签信息,包括:
读取所述标签信息的开标签字符串;判断所述开标签字符串中是否包含预设的过滤特征字符串;
若所述开标签字符串中包含所述预设的过滤特征字符串,则确定所述标签信息为与所述预设的过滤特征字符串相匹配的标签信息,从所述源代码中删除所述标签信息。
4. 根据权利要求2所述的方法,其特征在于,所述预设的标签匹配模式为单一匹配模式;所述从未删除的标签信息中,提取符合预设的标签匹配模式的标签信息作为目标信息,包括:
根据所述单一匹配模式依次对所述未删除的标签信息进行模式匹配;
提取符合所述单一匹配模式的标签信息作为目标信息。
5. 根据权利要求2所述的方法,其特征在于,所述预设的标签匹配模式为组合匹配模式;所述从未删除的标签信息中,提取符合预设的标签匹配模式的标签信息作为目标信息,包括:
根据所述组合配模式依次对所述未删除的标签信息进行模式匹配;
提取顺序分布且其组合能够满足所述组合匹配模式的多个标签信息作为目标信息。
6. 根据权利要求1-5任一项所述的方法,其特征在于,所述获取网页中待处理的源代码,包括:
根据预设的分段特征字符串将网页的源代码划分为多个代码段,分别获取每个所述代码段作为待处理的源代码;
相应地,所述根据预设的过滤特征字符串和预设的标签匹配模式,从所述源代码中提取目标信息,包括:根据预设的过滤特征字符串和预设的标签匹配模式分别从所述多个代码段中提取目标信息。
7. 根据权利要求1-5任一项所述的方法,其特征在于,所述获取网页中待处理的源代码,包括:
根据预设的起始字符串和结束字符串,从网页的源代码中划分出至少一个代码段,分别获取划分出的每个代码段作为待处理的源代码;
相应地,所述根据预设的过滤特征字符串和预设的标签匹配模式,从所述源代码中提取目标信息,包括:
根据预设的过滤特征字符串和预设的标签匹配模式分别从所述划分出的每个代码段中提取目标信息。
8. 根据权利要求1所述的方法,其特征在于,所述方法还包括:
获取用户的移动终端的信息,所述移动终端的信息至少包括以下中的一种或多种:所述移动终端的型号、显示屏参数和硬件性能参数;根据所述移动终端的信息,设定所述过滤特征字符串和所述标签匹配模式。
9. 根据权利要求1所述的方法,其特征在于,所述获取网页中待处理的源代码,包括:
接收用户的网页获取请求,将所述网页获取请求发送至相应的网站服务器;
接收所述网站服务器以流式传输方式发送的网页源代码,将当前接收到的流式传输的源代码作为待处理的源代码。
10. 根据权利要求1所述的方法,其特征在于,所述根据提取的所述目标信息生成指定格式的页面信息,包括:
根据提取的所述目标信息,生成相应的页面显示代码,所述页面显示代码用于使浏览器加载以显示所述目标信息对应的页面信息。
11. 一种提取页面信息的装置,其特征在于,所述装置包括:
获取模块,用于获取网页中待处理的源代码;
提取模块,用于根据预设的过滤特征字符串和预设的标签匹配模式,获取所述源代码中不是与所述过滤特征字符串相匹配的标签信息,若所述标签信息符合所述标签匹配模式,将该标签信息确定为目标信息,提取所述目标信息,其中,所述过滤特征字符串根据不同的移动终端定义设置;
生成模块,用于根据提取的所述目标信息生成指定格式的页面信息。
12. 根据权利要求11所述的装置,其特征在于,所述提取模块包括:
词法分析单元,用于对所述源代码进行词法分析,得到所述源代码的每个标签信息;
过滤单元,用于从所述每个标签信息中,删除与预设的过滤特征字符串相匹配的标签信息;
提取单元,用于从未删除的标签信息中,提取符合预设的标签匹配模式的标签信息作为目标信息。
13. 根据权利要求12所述的装置,其特征在于,所述过滤单元包括:
读取子单元,用于读取所述标签信息的开标签字符串;
判断子单元,用于判断所述开标签字符串中是否包含预设的过滤特征字符串;
删除子单元,用于若所述开标签字符串中包含所述预设的过滤特征字符串,则确定所述标签信息为与所述预设的过滤特征字符串相匹配的标签信息,从所述源代码中删除所述标签信息。
14. 根据权利要求12所述的装置,其特征在于,所述预设的标签匹配模式为单一匹配模式;所述提取单元包括:
第一模式匹配子单元,用于根据所述单一匹配模式依次对所述未删除的标签信息进行模式匹配;
第一提取子单元,用于提取符合所述单一匹配模式的标签信息作为目标信息。
15. 根据权利要求12所述的装置,其特征在于,所述预设的标签匹配模式为组合匹配模式;所述提取单元包括:
第二模式匹配子单元,用于根据所述组合匹配模式依次对所述未删除的标签信息进行模式匹配;
第二提取子单元,用于提取顺序分布且其组合能够满足所述组合匹配模式的多个标签信息作为目标信息。
16. 根据权利要求11-15任一项所述的装置,其特征在于,所述获取模块,用于根据预设的分段特征字符串将网页的源代码划分为多个代码段,分别获取每个所述代码段作为待处理的源代码;相应地,所述提取模块,用于根据预设的过滤特征字符串和预设的标签匹配模式分别从所述多个代码段中提取目标信息。
17. 根据权利要求11-15任一项所述的装置,其特征在于,所述获取模块,用于根据预设的起始字符串和结束字符串,从网页的源代码中划分出至少一个代码段,分别获取划分出的每个代码段作为待处理的源代码;
相应地,所述提取模块,用于根据预设的过滤特征字符串和预设的标签匹配模式分别从所述划分出的每个代码段中提取目标信息。
18. 根据权利要求11所述的装置,其特征在于,所述装置还包括:
设定模块,用于获取用户的移动终端的信息,所述移动终端的信息至少包括以下中的一种或多种:所述移动终端的型号、显示屏参数和硬件性能参数;根据所述移动终端的信息,设定所述过滤特征字符串和所述标签匹配模式。
19. 根据权利要求11所述的装置,其特征在于,所述获取模块包括:
发送单元,用于接收用户的网页获取请求,将所述网页获取请求发送至相应的网站服务器;
接收单元,用于接收所述网站服务器以流式传输方式发送的网页源代码,将当前接收到的流式传输的源代码作为待处理的源代码。
20. 根据权利要求11所述的装置,其特征在于,所述生成模块,用于根据提取的所述目标信息,生成相应的页面显示代码,所述页面显示代码用于使浏览器加载以显示所述目标信息对应的页面信息。”
驳回决定中引用了如下对比文件:
对比文件1:CN102955827A,公开日为2013年03月06日;
对比文件2:CN103440315A,公开日为2013年12月11日;
对比文件3:CN102567530A,公开日为2012年07月11日;
对比文件4:CN103412928A,公开日为2013年11月27日;
对比文件5:CN103136259A,公开日为2013年06月05日。
驳回决定的具体理由是:(1)权利要求1与对比文件1的区别技术特征在于:过滤特征字符串根据不同的移动终端定义设置。该区别技术特征是本领域技术人员在对比文件5的基础上结合本领域的公知常识容易想到的。(2)权利要求2-10的附加技术特征或被对比文件1-4公开,或属于本领域的惯用技术手段。(3)权利要求11-20是与方法权利要求1-10一一对应的装置权利要求。因此,权利要求1-20不具备创造性。
申请人(下称复审请求人)对上述驳回决定不服,于2018年01月12日向国家知识产权局提出了复审请求,未修改申请文件。复审请求人认为:对比文件1没有公开权利要求1中的技术特征“若标签信息符合标签匹配模式,将标签信息确定为目标信息”,同时对比文件1中技术方案的目的是完成WAP网页的创建,而本申请权利要求1中技术方案的目的是网页信息的抽取,二者过程不同,因此对比文件1不能给出技术启示。对比文件5也没有公开技术特征“若标签信息符合标签匹配模式,将标签信息确定为目标信息”,且对比文件5中也没有给出技术启示。因此,权利要求1相对于对比文件1、对比文件5以及本领域的惯用技术手段的结合具备创造性。
经形式审查合格,国家知识产权局于2018年02月05日依法受理了该复审请求,并将其转送至实质审查部门进行前置审查。
实质审查部门在前置审查意见书中坚持驳回决定。
随后,国家知识产权局成立合议组对本案进行审理。
合议组于2019年01月22日向复审请求人发出复审通知书,指出权利要求1-20相对于对比文件2、对比文件5以及本领域的惯用技术手段的结合不具备专利法第22条第3款规定的创造性。其中,权利要求1与对比文件2的区别技术特征在于:(1)根据预设的过滤特征字符串来获取所述源代码中不是与所述过滤特征字符串相匹配的标签信息;(2)过滤特征字符串根据不同的移动终端定义设置。区别技术特征(1)被对比文件5公开且作用相同,区别技术特征(2)属于本领域的惯用技术手段。权利要求2-10的附加技术特征或被对比文件2或5公开,或属于本领域的惯用技术手段。权利要求11-20是与方法权利要求1-10相对应的装置权利要求。因此,权利要求1-20不具备创造性。
复审请求人于2019年03月06日提交了意见陈述书以及权利要求书的全文修改替换页(包括权利要求第1-16项)。其中,所作的修改为:修改了权利要求1、11,删除了权利要求2-3、12-13,并对修改后的权利要求序号以及引用关系做适应性修改。复审请求人认为:修改后的权利要求1与对比文件2相比,至少具有区别技术特征:(1)从所述每个标签信息中,删除与预设的过滤特征字符串相匹配的标签信息;所述过滤特征字符串根据不同的移动终端定义设置;(2)对于闭合类型的标签,若标签信息的开标签包含过滤特征字符串,读取之后的所有字符串直到读取到对应的闭标签,将读取的所有字符串连通开标签和闭标签均从源代码中删除;对于自闭合类型的标签信息,若标签信息的开标签包含过滤特征字符串,则直接从源代码中删除该开标签,其中,自闭合类型的标签信息的全部字符串为开标签字符串。针对上述区别技术特征(1),对比文件5进行字符串匹配是为了提取出内容块的块标识信息,而不是进行字符串匹配,将匹配的内容块直接删除。本申请进行字符串匹配是为了删除与字符串直接匹配的标签信息,可见二者进行字符串匹配的目的不同。同时本申请直接通过匹配过滤特征字符串,删除与过滤特征字符串匹配的标签信息,并不是根据过滤特征字符串与查询处理规则,再确定是否删除。可见对比文件5删除内容块的方式与本申请进行过滤特征字符串匹配删除标签信息的方式不同。针对上述区别技术特征(2),对比文件2、5均未公开并且也没有提及开标签,所以没有动机和理由去判断开标签对应的标签信息是否满足删除要求。对比文件2、5均未公开判断标签信息的开标签中是否包含过滤特征字符串,来确定是否删除该标签信息。本申请单纯匹配开标签是否包含过滤特征字符串,可以节省匹配时间,提高提取页面信息的效率,快速实现移动终端页面的显示,避免页面卡顿等。并且区别技术特征(2)不是本领域的惯用技术手段,因此,本申请修改后的权利要求1-16均具备创造性。
复审请求人答复复审通知书时提交的修改后的权利要求1、9的内容如下:
“1. 一种提取页面信息的方法,其特征在于,所述方法包括:
获取网页中待处理的源代码;
对所述源代码进行词法分析,得到所述源代码的每个标签信息;
从所述每个标签信息中,删除与预设的过滤特征字符串相匹配的标签信息;其中,对于闭合类型的标签,若标签信息的开标签包含过滤特征字符串,读取之后的所有字符串直到读取到对应的闭标签,将读取的所有字符串连通开标签和闭标签均从源代码中删除;对于自闭合类型的标签信息,若标签信息的开标签包含过滤特征字符串,则直接从源代码中删除该开标签,其中,自闭合类型的标签信息的全部字符串为开标签字符串;所述过滤特征字符串根据不同的移动终端定义设置;
从未删除的标签信息中,提取符合预设的标签匹配模式的标签信息作为目标信息;
根据提取的所述目标信息生成指定格式的页面信息。”
“9. 一种提取页面信息的装置,其特征在于,所述装置包括:
获取模块,用于获取网页中待处理的源代码;
提取模块,包括:词法分析单元、过滤单元和提取单元;
其中,词法分析单元,用于对所述源代码进行词法分析,得到所述源代码的每个标签信息;
过滤单元,用于从所述每个标签信息中,删除与预设的过滤特征字符串相匹配的标签信息;其中,对于闭合类型的标签,若标签信息的开标签包含过滤特征字符串,读取之后的所有字符串直到读取到对应的闭标签,将读取的所有字符串连通开标签和闭标签均从源代码中删除;对于自闭合类型的标签信息,若标签信息的开标签包含过滤特征字符串,则直接从源代码中删除该开标签,其中,自闭合类型的标签信息的全部字符串为开标签字符串;所述过滤特征字符串根据不同的移动终端定义设置;
提取单元,用于从未删除的标签信息中,提取符合预设的标签匹配模式的标签信息作为目标信息;
生成模块,用于根据提取的所述目标信息生成指定格式的页面信息。”
在上述程序的基础上,合议组认为本案事实已经清楚,可以作出审查决定。
二、决定的理由
1、审查文本的认定
复审请求人在答复复审通知书时提交了权利要求书的全文修改替换页。经审查,所作修改符合专利法实施细则第61条第1款及专利法第33条的规定。本复审请求审查决定所依据的文本为:2019年03月06日提交的权利要求第1-16项;申请日2015年06月15日提交的说明书第1-33页、说明书附图第1-4页、说明书摘要、摘要附图。
2、关于专利法第22条第3款
专利法第22条第3款规定:创造性,是指与现有技术相比,该发明具有突出的实质性特点和显著的进步,该实用新型具有实质性特点和进步。
如果一项权利要求请求保护的技术方案相对于作为最接近的现有技术的对比文件存在多个区别技术特征,上述多个区别技术特征部分被其他对比文件公开且所起作用相同,其余部分属于本领域的惯用技术手段,则该项权利要求请求保护的技术方案不具备创造性。
本复审请求审查决定与复审通知书中所引用的对比文件相同,为驳回决定中引用的对比文件2和对比文件5,即:
对比文件2:CN103440315A,公开日为2013年12月11日;
对比文件5:CN103136259A,公开日为2013年06月05日。
2.1、权利要求1要求保护一种提取页面信息的方法,对比文件2公开了一种基于主题的Web页面清洗方法(参见说明书第[0023]-[0068]段、附图1-5),包括:步骤二,采集样本页面,并对样本页面的网页结构进行分析,确定页面元素树形结构(即获取网页中待处理的源代码);步骤四,根据标签边界定义正则表达式匹配规则,利用多个抽取规则组成抽取规则模板,步骤五,对待清洗页面进行清洗预处理,剔除容易分辨的“噪音”内容,其中剔除属于“噪音”内容的页面标签及其内容,步骤六,利用已生成的抽取规则模板进行页面清洗,得到清洗后的页面。经过两步匹配,剩下的〈ul〉结构包含的内容即为待抽取信息块,如果像示例一样,网页的结构比较简单,标签不复杂,完全可以在进行页面清洗的时候直接匹配出需要采集的信息块数据,合并后续的信息抽取工作(即对所述源代码进行分析,得到所述源代码的每个标签信息;从未删除的标签信息中,提取符合预设的标签匹配模式的标签信息作为目标信息,根据提取的所述目标信息生成指定格式的页面信息)。由此可见,对比文件2公开的方案中也涉及了先对网页内容进行过滤,再针对过滤后的内容进行标签信息的匹配,与本申请的权利要求1所限定的技术方案的不同之处仅在于过滤时使用的删除规则不同。
因此,权利要求1与对比文件2相比,区别技术特征在于:(1)对源代码进行的分析是词法分析;(2)从所述每个标签信息中,删除与预设的过滤特征字符串相匹配的标签信息;其中,对于闭合类型的标签,若标签信息的开标签包含过滤特征字符串,读取之后的所有字符串直到读取到对应的闭标签,将读取的所有字符串连通开标签和闭标签均从源代码中删除;对于自闭合类型的标签信息,若标签信息的开标签包含过滤特征字符串,则直接从源代码中删除该开标签,其中,自闭合类型的标签信息的全部字符串为开标签字符串;(3)所述过滤特征字符串根据不同的移动终端定义设置。
基于上述区别技术特征,本申请权利要求1实际解决的技术问题是:如何对源代码进行分析、如何过滤删除标签信息、如何优化移动终端页面的显示效果。
对于区别技术特征(1),对于本领域技术人员而言,对源代码进行词法分析以获得标签信息属于本领域的惯用文本处理手段。
对于区别技术特征(2),首先,对比文件5公开了以下技术特征(参见说明书第[0024]-[0106]段、附图1-4):标识信息提取装置12从原始网页获取装置11获取的原始网页的标记语言文件中例如利用字符串(即预设的过滤特征字符串)匹配等方式提取块标识信息,在此,所述内容块意为标记语言文件中的由一个或多个标签组成的内容区域,其与网页中显示的特定内容相对应,如,标题内容块、正文内容块、导航内容块等,在此,所述块标识信息在标记语言文件中的存储方式包括但不限于:标记语言文件中的定制标签;例如,在HTML文件中,定制标签可为,标识信息可存储于该定制标签中,在此,所述处理规则包括但不限于:对内容块进行删除(参见说明书第[0033]-[0058]段)(即从所述每个标签信息中,删除与预设的过滤特征字符串相匹配的标签信息)。并且上述技术特征在对比文件5中所起的作用与其在本申请权利要求1中所起的作用相同,都是用于过滤标签信息,因此对比文件5给出了将上述技术特征结合到对比文件2以解决其技术问题的技术启示。其次,闭合类型的标签和自闭合类型的标签均在HTML语言中很常见,例如对比文件5中公开了闭合类型的标签(参见说明书第[0048]段)。本领域技术人员在面对需要过滤删除标签信息时,基于对比文件5公开的上述内容,能够根据实际情况针对闭合、自闭合类型的标签来选择相应的过滤删除规则以执行删除操作,这属于本领域的惯用技术手段。
对于区别技术特征(3),对比文件5(参见说明书第[0101]-[0106]段)还公开了以下技术特征:参数获取装置按照约定的方式通过调用待显示该目标网页的移动终端提供的API(应用编程接口),获取该移动终端的显示参数信息,在此,所述显示参数信息包括但不限于:移动终端的屏幕分辨率,如像素的物理大小,色彩位数。可见,对比文件5公开的方案中考虑到了不同的移动终端可能会对页面显示造成影响,并且对比文件5还公开了对利用字符串(即预设的过滤特征字符串)匹配得到的内容块进行删除,从而改变网页的显示效果。本领域技术人员在面对需要优化移动终端页面的显示效果时,在对比文件5公开的上述内容的启示下,容易想到针对移动终端的不同特性来设置不同的过滤特征字符串进行过滤,这属于本领域的惯用技术手段。
因此,在对比文件2的基础上结合对比文件5以及本领域的惯用技术手段得到权利要求1所要求保护的技术方案对本领域技术人员而言是显而易见的,权利要求1不具备突出的实质性特点,不符合专利法第22条第3款有关创造性的规定。
2.2、权利要求2引用权利要求1。采用单一匹配模式依次对未删除的标签信息进行模式匹配,进而获得合适的匹配结果是本领域技术人员能够根据实际情况做出选择的,这属于本领域的惯用技术手段。在权利要求1不具备创造性的前提下,权利要求2也不符合专利法第22条第3款有关创造性的规定。
2.3、权利要求3引用权利要求1。对比文件2(参见说明书第[0033]-[0046]段)公开了:(a)匹配外层标签,(b)针对第一步的匹配结果匹配内层的标签并抽取其内容(即根据所述组合匹配模式依次对所述未删除的标签信息进行模式匹配;提取顺序分布且其组合能够满足所述组合匹配模式的多个标签信息作为目标信息)。在权利要求1不具备创造性的前提下,权利要求3也不符合专利法第22条第3款有关创造性的规定。
2.4、权利要求4-5引用权利要求1-3的任意一项。对比文件2(参见说明书第[0026]、[0033]-[0057]段)公开了:(a)匹配外层标签,(b)针对第一步的匹配结果匹配内层的
标签并抽取其内容(即根据预设的标签匹配模式从代码段中提取目标信息)。对比文件5(参见说明书第[0033]-[0058]段)公开了:标识信息提取装置12从原始网页获取装置11获取的原始网页的标记语言文件中例如利用字符串匹配等方式提取块标识信息,其中,所述块标识信息用于标识标记语言文件中的各内容块(即根据预设的过滤特征字符串从代码段中提取目标信息)。在本领域中,当代码比较长时,通常将其进行分段处理,对代码进行分段时,所属领域技术人员经常借助分段特征字符串或者开始、结束字符串来实施分段,这属于本领域的惯用技术手段。在权利要求1-3任一项不具备创造性的前提下,权利要求4-5也不符合专利法第22条第3款有关创造性的规定。
2.5、权利要求6引用权利要求1。对比文件5(参见说明书第[0033]-[0058]、[0101]-[0106]段)公开了:标识信息提取装置12从原始网页获取装置11获取的原始网页的标记语言文件中例如利用字符串匹配等方式提取块标识信息(即设定过滤特征字符串匹配模式)以及移动终端的信息包括移动终端的屏幕分辨率(即显示屏参数)。对比文件2(参见说明书第[0026]、[0033]-[0057]段)公开了:(a)匹配外层标签,(b)针对第一步的匹配结果匹配内层的
标签并抽取其内容(即设定标签匹配模式)。本领域技术人员基于对比文件2和对比文件5公开的上述内容,在面对需要设置不同的过滤特征字符串和标签匹配模式以改变页面显示效果时,容易想到基于移动终端的信息来设置。同时,对于本领域技术人员而言,基于移动终端的型号和硬件性能参数设定匹配模式是容易想到的,其属于本领域的惯用技术手段。在权利要求1不具备创造性的前提下,权利要求6也不符合专利法第22条第3款有关创造性的规定。
2.6、权利要求7引用权利要求1。对比文件5(参见说明书第[0027]-[0028]段)公开了:所述获取待处理的原始网页的方式包括但不限于以下情形:根据来自移动终端的页面访问请求,从该页面访问请求中的统一资源定位符(URL)所指向的网站服务器处获取相应的原始网页(即接收用户的网页获取请求,将所述网页获取请求发送至相应的网站服务器;接收所述网站服务器发送的网页源代码,将当前接收到的源代码作为待处理的源代码)。在本领域中,流式传输是常用的数据传输方式,选择其作为传输方式是本领域技术人员容易想到的,属于本领域的惯用技术手段。在权利要求1不具备创造性的前提下,权利要求7也不符合专利法第22条第3款有关创造性的规定。
2.7、权利要求8引用权利要求1。对于本领域技术人员而言,生成页面显示码使得浏览器可以显示相应的页面信息是容易想到的,属于本领域的惯用技术手段。在权利要求1不具备创造性的前提下,权利要求8也不符合专利法第22条第3款有关创造性的规定。
2.8、权利要求9-16是与方法权利要求1-8相对应的装置权利要求,基于本文中针对权利要求1-8的评述可知,权利要求9-16也不符合专利法第22条第3款有关创造性的规定。
3、对复审请求人相关意见的评述
对于复审请求人答复复审通知书时陈述的意见,合议组认为:
针对复审请求人所认定的区别技术特征(1),由本申请说明书公开的内容可知,其同样是利用字符串匹配来找到标签信息中与字符串匹配的关键字,进而删除存在匹配关系的标签。对比文件5的说明书第[0033]段公开了“标识信息提取装置12从原始网页获取装置11获取的原始网页的标记语言文件中例如利用字符串匹配等方式提取块标识信息”,其中该字符串,即为预设的过滤特征字符串。同时对比文件5的说明书第[0041]-[0042]、[0044]、[0052]-[0053]、[0058]段分别公开了“在此,所述内容块意为标记语言文件中的由一个或多个标签组成的内容区域”、“在此,所述块标识信息在标记语言文件中的存储方式包括但不限于:2)标记语言文件中的定制标签;例如,在HTML文件中,定制标签可为,标识信息可存储于该定制标签中”、“以获得与该块标识信息相对应的内容块处理规则”、“在此,所述处理规则包括但不限于:对内容块进行删除”。由上述公开的内容可知,对比文件5也是利用字符串匹配来找到标签信息中与字符串匹配的块标识信息(即关键字),进而删除存在匹配关系的标签。即对比文件5进行字符串匹配也是为了删除与字符串匹配的标签信息,因此对比文件5与本申请进行字符串匹配的目的相同。本申请权利要求1的方案中并未排除采用查询处理规则,因此,基于本文中对于权利要求1的评述可知,对比文件5公开了特征“从所述每个标签信息中,删除与预设的过滤特征字符串相匹配的标签信息”。
针对复审请求人所认定的区别技术特征(2),对比文件5的说明书第[0048]段公开了(即闭合类型的标签)。其中即为开标签,即对比文件5中提及了开标签。在本领域中,闭合类型的标签和自闭合类型的标签均在HTML语言中很常见,本领域技术人员在面对需要过滤删除标签信息时,在对比文件5公开的开标签、闭合类型的标签的基础上,能够根据实际需要基于开标签来对闭合类型的标签和自闭合类型的标签执行相应的过滤删除处理,这属于本领域的惯用技术手段。
因此,复审请求人陈述的理由合议组不予支持。
基于上述事实和理由,合议组依法作出如下复审请求审查决定。
三、决定
维持国家知识产权局于2017年09月28日对本申请作出的驳回决定。
如对本复审请求审查决定不服,根据专利法第41条第2款的规定,复审请求人可以自收到本复审请求审查决定之日起三个月内向北京知识产权法院起诉。


郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如作者信息标记有误,请第一时间联系我们修改或删除,多谢。

留言与评论(共有 0 条评论)
   
验证码: