发明创造名称:一种兴趣标签推荐方法及系统
外观设计名称:
决定号:183413
决定日:2019-07-01
委内编号:1F240671
优先权日:
申请(专利)号:201210385630.6
申请日:2012-10-12
复审请求人:腾讯科技(深圳)有限公司
无效请求人:
授权公告日:
审定公告日:
专利权人:
主审员:胡百乐
合议组组长:杜婧子
参审员:孙国辉
国际分类号:G06F17/30,G06F17/27
外观设计分类号:
法律依据:专利法第22条第3款
决定要点
:如果一项权利要求要求保护的技术方案与作为最接近现有技术的对比文件相比存在区别技术特征,但是该区别技术特征为本领域的公知常识,则该项权利要求要求保护的技术方案不具备创造性。
全文:
本复审请求涉及申请号为201210385630.6,名称为“一种兴趣标签推荐方法及系统”的发明专利申请(下称本申请)。本申请的申请人为腾讯科技(深圳)有限公司,申请日为2012年10月12日,公开日为2014年04月16日。
经实质审查,国家知识产权局实质审查部门于2017年09月07日发出驳回决定,以权利要求1-10不具备专利法第22条第3款规定的创造性为由驳回了本申请。驳回决定所依据的文本为:申请日2012年10月12日提交的说明书第1-7页、说明书附图第1-3页、说明书摘要、摘要附图,2017年01月23日提交的权利要求第1-10项。
驳回决定所引用对比文件为:
对比文件1:CN101546341A,公开日为2009年09月30日。
驳回决定所针对的权利要求书的内容如下:
“1. 一种兴趣标签推荐方法,包括:统计存在的兴趣标签的特征向量;根据存在的兴趣标签的特征向量,计算存在的兴趣标签与推荐的兴趣标签的相似度;统计存在的兴趣标签与推荐的兴趣标签之间的共现关系;根据存在的兴趣标签与推荐的兴趣标签的相似度和共现关系进行兴趣标签的推荐。
2. 根据权利要求1所述的兴趣标签推荐方法,其特征在于,所述统计存在的兴趣标签的特征向量步骤包括:提取互联网相关文件中标题或正文包含所述兴趣标签的所有文章;对包含所述兴趣标签的所有文章切词、提取特征词,统计特征词的词频;对特征词进行相关排序,取一定数量的词,作为兴趣标签的特征向量。
3. 根据权利要求1或2所述的兴趣标签推荐方法,其特征在于,所述统计存在的兴趣标签的特征向量步骤前还包括:准备兴趣标签集,并进行分类;收集互联网相关本文作为语料;确定兴趣标签的特征词词集。
4. 根据权利要求3所述的兴趣标签推荐方法,其特征在于,所述确定兴趣标签的特征词词集步骤包括:对语料切词、统计每个词的文档频率倒数值,去掉高频词、停用词及低频词,将剩下的词作为特征词。
5. 根据权利要求1所述的兴趣标签推荐方法,其特征在于,所述共现关系是指存在的兴趣标签与推荐的兴趣标签在同一篇文档中出现的次数。
6. 一种兴趣标签推荐系统,包括:
特征向量统计模块:用于统计存在的兴趣标签的特征向量;相似度计算模块:用于根据存在的兴趣标签的特征向量,计算存在的兴趣标签与推荐的兴趣标签的相似度;共现关系统计模块,所述共现关系统计模块用于统计存在的兴趣标签与推荐的兴趣标签之间的共现关系;兴趣标签推荐模块:用于跟据存在的兴趣标签与推荐的兴趣标签的相似度进行兴趣标签的推荐。
7. 根据权利要求6所述的兴趣标签推荐系统,其特征在于,所述特征向量统计模块统计兴趣标签的特征向量具体包括:提取互联网相关文件中标题或正文包含所述兴趣标签的所有文章;对包含所述兴趣标签的所有文章切词、提取特征词,统计特征词的词频;对特征词进行相关排序,取一定数量的词,作为兴趣标签的特征向量。
8. 根据权利要求6或7所述的兴趣标签推荐系统,其特征在于,所述兴趣标签推荐系统还包括:
兴趣标签集分类模块:用于准备兴趣标签集,并进行分类;语料收集模块:用于收集互联网相关本文作为语料;特征词词集确定模块:用于确定兴趣标签的特征词词集。
9. 根据权利要求8所述的兴趣标签推荐系统,其特征在于,所述特征词词集确定模块确定兴趣标签的特征词词集包括:对语料切词、统计每个词的文档频率倒数值,去掉高频词、停用词及低频词,将剩下的词作为特征词。
10. 根据权利要求6或7所述的兴趣标签推荐系统,其特征在于,所述共现关系是指存在的兴趣标签与推荐的兴趣标签在同一篇文档中出现的次数。”
驳回决定的具体理由是:1、权利要求1与对比文件1的区别在于:统计存在的兴趣标签与推荐的兴趣标签之间的共现关系,根据存在的兴趣标签与推荐的兴趣标签的相似度和共现关系进行兴趣标签的推荐。而上述区别是本领域惯用技术手段。2、权利要求2、3的附加技术特征被对比文件1公开,权利要求4、5的附加技术特征为本领域惯用技术手段。3、权利要求6-10请求保护一种兴趣标签推荐系统,与权利要求1-5相对应。因此,权利要求1-10不具备创造性。
申请人(下称复审请求人)对上述驳回决定不服,于2017年12月19日向国家知识产权局提出了复审请求,未修改申请文件。复审请求人认为:(1)首先,对比文件1没有公开共现关系,并且共现关系并非本领域公知常识。本申请相似度与共现关系并非简单叠加,而是基于算法的综合运算,其是整体的,不能割裂;通过相似度、共现关系、语料中包含标签词的文档数目三个因素共同作用与阈值比较得到用户的兴趣概率,使推荐结果更加准确。即使共现关系作为兴趣标签的推荐方法为本领域公知常识,但是相似度和共现关系相结合作为兴趣标签的推荐方法并非本领域公知常识。(2)对比文件1没有公开如何确定兴趣标签的特征词词集。现有技术会保留高频词,例如对比文件1中,而本申请去除了高频词是为了根据用户的选择和喜好进行相关推荐。因此,本申请权利要求均具备创造性。
经形式审查合格,国家知识产权局于2018年01月03日依法受理了该复审请求,并将其转送至实质审查部门进行前置审查。
实质审查部门在前置审查意见书中认为:(1)通过“北京”与“奥运”、“文学”与“音乐”举例说明共现关系判定词汇之间的关系属于本领域公知常识。共现关系体现的是相关性在揭示相关性知识方面和挖掘隐性关联知识方面具有实用意义,所以根据共现关系对词汇、标签进行关联属于本领域惯用技术手段。(2)本申请是将相似度和共现关系叠加实现推荐,所以在对比文件1公开了利用相似度进行推荐时,容易想到将共现关系作为筛选条件以实现更精准的推荐。因此坚持驳回决定。
随后,国家知识产权局成立合议组对本案进行审理。
合议组于2019年01月25日向复审请求人发出复审通知书,复审通知书中指出:权利要求1-10相对于对比文件1和本领域惯用技术手段的结合不具备专利法第22条第3款规定的创造性,并在复审通知书中引入公知常识性证据1:《《语言学教程》学习指南 修订版》,湖北科学技术出版社,公开日为2005年01月31日;公知常识性证据2:Bibexcel软件使用指南,https://homepage.univie.ac.at/juan.gorraiz/bibexcel/,Persson,O.,R.Danell等,公开日为2009年12月31日。对于复审请求人陈述的意见,合议组进一步指出:(1)首先,权利要求的保护范围由权利要求中记载的全部内容作为一个整体限定的,在本申请当前的权利要求1中仅记载“根据存在的兴趣标签与推荐的兴趣标签的相似度和共现关系进行兴趣标签的推荐”,其并不能体现出复审请求人所述的相似度、共现关系、语料中包含标签词的文档数目三个因素共同作用与阈值比较得到用户的兴趣概率。其次,根据本申请说明书的记载(参见说明书第[0038]-[0043]段):存在的兴趣标签x与推荐的兴趣标签y的相似度为R(x,y)>K1;M(x,y)=P(x,y)/(P(x)*P(y))>K2;P(x,y)=兴趣标签x、y在语料中的共现次数>K3,上述公式体现了兴趣标签的计算过程,先计算出相似度,进行兴趣标签的筛选,然后再计算共现关系,对筛选结果再次筛选,其中,共现关系的处理只是基于相似度处理的结果进行,两者是先后处理,并未对两者进行结合,因此,本申请是通过增加并列的判断条件进行兴趣标签的推荐。同时,虽然对比文件1没有公开共现关系,然而共现关系是本领域中词语在文献中一种常规的关联关系。例如,《《语言学教程》学习指南 修订版》,湖北科学技术出版社,2005年01月第2版,在第472页10.3.3中记载了“共现关系:计算机具有搜寻语篇中的特定词、词语序列、或者甚至是词类的功能。同样也能计量的是词语出现的数量,因此也便能收集到词语出现频率的信息”。利用共现关系的文献分析方法作为研究文献中词语出现频率信息体现内容主题的方法是本领域中常规的文献计量研究方法,例如Bibexcel软件(https://homepage.univie.ac.at/juan.gorraiz/bibexcel/,Persson,O.,R.Danell等,2009年)在使用指南第15-20页描述了共现分析在Bibexcel软件进行文献计量的使用方法。共现关系广泛应用于知识发现、利用共现分析结果拓展检索领域等,即通过共现关系的统计分析进行兴趣识别及个性化的推荐服务是本领域惯用技术手段。其次,在本领域中,为了提高推荐内容的精准程度,在进行内容的匹配时,选取多种方式和参数进行匹配并根据综合的匹配结果进行内容推荐,属于本领域的惯用技术手段。在上述惯用技术手段的启示下,为了在提高推荐内容的准确性的同时能够使推荐内容更加符合用户的兴趣和喜好,本领域技术人员能够对对比文件1进行改进,采用本领域惯用技术手段,例如基于共现关系的文献分析推荐等手段进行组合,进而对文档进行分析。(2)对比文件1公开了(参见对比文件1说明书第11页、附图11):分析单元通过计算TF和IDF,基于用户的嗜好权衡推荐的文档。即对比文件1所推荐的文档基于用户的嗜好,而用户嗜好取决于用户的浏览和书签历史的记事或话题,所以对于分析单元计算的TF和IDF值,高频词可能仅代表当前热点而并非用户的嗜好。因此,对于本领域技术人员来说,为了基于用户嗜好进行权衡推荐,容易想到舍弃高频词,选用体现用户个人嗜好的关键词,从而获得更加精确的基于用户嗜好推荐。而对于相似度的计算方法,在本申请权利要求中并没有记载,在本申请说明书中所记载的通过两个特征向量的余弦函数计算相似度的计算方法也是本领域公知常识。
复审请求人于2019年02月25 日提交了意见陈述书,同时提交了权利要求书的全文修改替换页(包括权利要求第1-5项)。所作的修改为:将从属权利要求2-4的附加技术特征合并到权利要求1中,并在权利要求1中增加说明书中内容,删除权利要求2-4,对权利要求6-10做了相应的修改,并新增加权利要求5,其请求保护一种计算机可读存储介质,实现如权利要求1至2中任一权利要求所述的兴趣标签推荐方法。复审请求人认为:(1)权利要求1中“去掉高频词”的作用是防止将热点词相关的兴趣标签推荐给用户。(2)对比文件1中“话题群集”不能相当于“兴趣标签集”,因此,对比文件1没有提出本申请要解决的技术问题。(3)在本申请中,通过相似度与共现关系这两个条件共同作用,提高推荐标签的相关度和准确度。相似度是两个特征向量之间进行的相似性评价,而共现关系则是特征向量在同一文档内出现的概率性评价,二者在技术思路上并没有相同或者相似之处,仅根据相似度并没有联想到共现关系的可能性,更无法根据相似度找到二者结合的可能。对于权利要求1新增加的关于相似度的计算以及兴趣标签的推荐进一步限定了相似度和共现关系的结合。因此,本申请权利要求不具备创造性。
复审请求人于2019年02月25日提交的修改后的权利要求1-5的内容如下:
“1. 一种兴趣标签推荐方法,包括:
准备兴趣标签集,并进行分类;
从互联网上收集互联网相关本文作为语料;
确定兴趣标签的特征词词集;所述确定兴趣标签的特征词词集步骤包括:对语料切词、统计每个词的文档频率倒数值,去掉高频词、停用词及低频词,将剩下的词作为特征词;
统计存在的兴趣标签的特征向量;
根据存在的兴趣标签的特征向量,计算存在的兴趣标签与推荐的兴趣标签的相似度;
统计存在的兴趣标签与推荐的兴趣标签之间的共现关系;
根据存在的兴趣标签与推荐的兴趣标签的相似度和共现关系进行兴趣标签的推荐;
所述统计存在的兴趣标签的特征向量,包括:
提取互联网相关文件中标题或正文包含该兴趣标签的所有文章;对包含该兴趣标签的所有文章切词、提取特征词,统计特征词的词频;对特征词进行相关排序,取一定数量的词,作为兴趣标签的特征向量Vx;
所述根据存在的兴趣标签的特征向量,计算存在的兴趣标签与推荐的兴趣标签的相似度,包括:
所述存在的兴趣标签x与推荐的兴趣标签y的相似度定义为:R(x,y)=cos(Vx,Vy),其中,R(x,y)表示存在的兴趣标签x与推荐的兴趣标签y的相似度,cos表示余弦函数,Vx及Vy分别表示存在的兴趣标签x及推荐的兴趣标签y的特征向量;
所述根据存在的兴趣标签与推荐的兴趣标签的相似度和共现关系进行兴趣标签的推荐,具体根据下列方式进行标签推荐:推荐的兴趣标签y满足(K1,K2,K3为设定的阈值);
存在的兴趣标签x与推荐的兴趣标签y的相似度定R(x,y)>K1;
M(x,y)=P(x,y)/(P(x)*P(y))>K2;
P(x,y)=兴趣标签x、y在语料中的共现次数>K3;
若已知用户对已存在的多个X1,X2……Xn感兴趣,则将Xi的相关标签Y推荐给用户,Y在用户的相关标签列表中出现的次数越多,表示用户对Y有兴趣的概率越大。
2. 根据权利要求1所述的兴趣标签推荐方法,其特征在于,所述共现关系是指存在的兴趣标签与推荐的兴趣标签在同一篇文档中出现的次数。
3. 一种兴趣标签推荐系统,包括:
特征向量统计模块:用于统计存在的兴趣标签的特征向量;
相似度计算模块:用于根据存在的兴趣标签的特征向量,计算存在的兴趣标签与推荐的兴趣标签的相似度;
共现关系统计模块,所述共现关系统计模块用于统计存在的兴趣标签与推荐的兴趣标签之间的共现关系;
兴趣标签推荐模块:用于跟据存在的兴趣标签与推荐的兴趣标签的相似度进行兴趣标签的推荐;
所述兴趣标签推荐系统还包括:
兴趣标签集分类模块:用于准备兴趣标签集,并进行分类;
语料收集模块:用于收集互联网相关本文作为语料;
特征词词集确定模块:用于确定兴趣标签的特征词词集;
所述特征词词集确定模块确定兴趣标签的特征词词集包括:对语料切词、统计每个词的文档频率倒数值,去掉高频词、停用词及低频词,将剩下的词作为特征词;
所述特征向量统计模块统计兴趣标签的特征向量具体包括:提取互联网相关文件中标题或正文包含该兴趣标签的所有文章;对包含该兴趣标签的所有文章切词、提取特征词,统计特征词的词频;对特征词进行相关排序,取一定数量的词,作为兴趣标签的特征向量Vx;
所述根据存在的兴趣标签的特征向量,计算存在的兴趣标签与推荐的兴趣标签的相似度,包括:
所述存在的兴趣标签x与推荐的兴趣标签y的相似度定义为:R(x,y)=cos(Vx,Vy),其中,R(x,y)表示存在的兴趣标签x与推荐的兴趣标签y 的相似度,cos表示余弦函数,Vx及Vy分别表示存在的兴趣标签x及推荐的兴趣标签y的特征向量;
所述根据存在的兴趣标签与推荐的兴趣标签的相似度和共现关系进行兴趣标签的推荐,具体根据下列方式进行标签推荐:推荐的兴趣标签y满足(K1,K2,K3为设定的阈值);
存在的兴趣标签x与推荐的兴趣标签y的相似度定R(x,y)>K1;
M(x,y)=P(x,y)/(P(x)*P(y))>K2;
P(x,y)=兴趣标签x、y在语料中的共现次数>K3;
若已知用户对已存在的多个X1,X2……Xn感兴趣,则将Xi的相关标签Y推荐给用户,Y在用户的相关标签列表中出现的次数越多,表示用户对Y有兴趣的概率越大。
4. 根据权利要求3所述的兴趣标签推荐系统,其特征在于,所述共现关系是指存在的兴趣标签与推荐的兴趣标签在同一篇文档中出现的次数。
5. 一种计算机可读存储介质,其特征在于,所述存储介质中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或指令集由处理器加载并执行以实现如权利要求1至2中任一权利要求所述的兴趣标签推荐方法。”
在上述程序的基础上,合议组认为本案事实已经清楚,可以依法作出审查决定。
二、决定的理由
1、审查文本的认定
复审请求人在2019年02月25日答复复审通知书时提交了权利要求书的全文修改替换页。经审查,所作的修改符合专利法实施细则第61条第1款以及专利法第33条的规定。本复审请求审查决定所依据的审查文本为:申请日2012年10月12日提交的说明书第1-7页、说明书附图第1-3页、说明书摘要、摘要附图,2019年02月25日提交的权利要求第1-5项。
2、关于专利法第22条第3款
专利法第22条第3款规定:创造性,是指与现有技术相比,该发明具有突出的实质性特点和显著的进步,该实用新型具有实质性特点和进步。
如果一项权利要求要求保护的技术方案与作为最接近现有技术的对比文件相比存在区别技术特征,但是该区别技术特征为本领域的公知常识,则该项权利要求要求保护的技术方案不具备创造性。
本复审请求审查决定引用的对比文件与复审通知书以及驳回决定中所引用的对比文件相同,即:
对比文件1:CN101546341A, 公开日为:2009年09月30日。
2.1、权利要求1请求保护一种兴趣标签推荐方法。对比文件1公开了一种信息推荐装置和信息推荐方法,并具体公开了以下内容(参见说明书第2、5、6、7页):
文档输入单元输入文档,包括因特网的网页上的新闻记事、丰富的网站摘要以及在电子程序指南上的信息(相当于从互联网上收集互联网相关本文作为语料);结构判定单元15判定显示一个话题群集(相当于兴趣标签集)的话题是否应该被分割成为多个话题或副话题(相当于分类)。因此,生成具有分级结构的副话题群集(相当于准备兴趣标签集,并进行分类);特征属性提取单元16相对于由群集单元13提取的每个话题群集,提取频繁被包含的关键字作为话题关键字(相当于确定兴趣标签的特征词词集)。除去不被用作关键字的诸如助词和符号的不必要的表达(相当于去掉停用词,将剩下的词作为特征词)。
文档输入单元输入文档组,群集单元接收所述文档组,提取属于相同的话题的具有作为要素的一个或多个文档的主题群集;关于主题群集的生成方法,假定每个文档作为一个单词向量(相当于特征向量),假定使得指示各个文档的单词向量的内积最大的文档组作为属于相同的话题的文档(相当于统计存在的兴趣标签的特征向量);特征属性提取单元对由群集单元提取的每个话题群集,提取频繁被包含的关键字作为话题关键字;
历史输入单元接收用户浏览的文档的历史或具有书签操作的文档历史的输入;文档分析单元对输入的每个文档计算特征向量;兴趣群集提取单元判定每个话题群集和副话题群集的每个特征向量和单词向量之间的相似性(相当于根据存在的兴趣标签的特征向量,计算存在的兴趣标签与推荐的兴趣标签的相似度),然后提取与用户保持的书签相关的话题群集或副话题群集作为兴趣群集(相当于根据存在的兴趣标签与推荐的兴趣标签的相似度进行兴趣标签的推荐)。
分析单元14接收来自文档输入单元11或群集单元13的文档,使用现有的自然语言处理技术(例如,形态分析、n-gram提取等等),并且分析包括在网上的文本或EPG的文本中的典型的关键字(相当于提取互联网相关文件中正文包含所述兴趣标签的所有文章)。例如,将形态分析应用到字符串“自然语言处理”,能够断开成诸如“自然”、“语言”、“处理”的单词作为关键字(相当于对包含所述兴趣标签的所有文章切词、提取特征词)。特征属性提取单元计算每个单词的出现频率,并且以出现频率的递减顺序设置当前事件关键字作为话题的关键字的候补(相当于统计特征词的词频,对特征词进行相关排序),当这样获得的关键字的列表成为表示话题的一组话题关键字的时候,如果提取的关键字的数目比指定的阈值大,则提取单元以频率递减顺序的采用与阈值相同数目的关键字(相当于取一定数量的词,作为兴趣标签的特征向量)。
由此可见,权利要求1请求保护的技术方案与对比文件1的区别技术特征在于:(1)所述确定兴趣标签的特征词词集步骤还包括:统计每个词的文档频率倒数值,去掉高频词、及低频词;(2)统计存在的兴趣标签与推荐的兴趣标签之间的共现关系;根据存在的兴趣标签与推荐的兴趣标签的相似度和共现关系进行兴趣标签的推荐;所述根据存在的兴趣标签的特征向量,计算存在的兴趣标签与推荐的兴趣标签的相似度,包括:所述存在的兴趣标签x与推荐的兴趣标签y的相似度定义为:R(x,y)=cos(Vx,Vy),其中,R(x,y)表示存在的兴趣标签x与推荐的兴趣标签y的相似度,cos表示余弦函数,Vx及Vy分别表示存在的兴趣标签x及推荐的兴趣标签y的特征向量;所述根据存在的兴趣标签与推荐的兴趣标签的相似度和共现关系进行兴趣标签的推荐,具体根据下列方式进行标签推荐:推荐的兴趣标签y满足(K1,K2,K3为设定的阈值);存在的兴趣标签x与推荐的兴趣标签y的相似度定R(x,y)>K1; M(x,y)=P(x,y)/(P(x)*P(y))>K2; P(x,y)=兴趣标签x、y在语料中的共现次数>K3;若已知用户对已存在的多个X1,X2……Xn感兴趣,则将Xi的相关标签Y推荐给用户,Y在用户的相关标签列表中出现的次数越多,表示用户对Y有兴趣的概率越大。
基于上述区别技术特征,权利要求1请求保护的技术方案实际要解决的技术问题是:如何使兴趣标签的推荐更加精准。
对于上述区别技术特征(1):对比文件1使用TF-IDF方法进行特征词的选取,其目的是为了确定一些特征词,而这些特征词具有如下特点:在当前文档中出现的频率越高越好,在整个语料库中出现的频率越低越好。由此达到,对当前文档的区别分类效果。由此,本领域技术人员容易想到使用频率倒数值作为词集分类的参数之一。而高频词和低频词作为两种极端词语容易模糊当前文档的分类效果,所以本领域技术人员在实际处理时可以根据分类需要进行筛选,去掉高频词、低频词等影响分类效果的词语,其属于本领域惯用技术手段。
对于上述区别技术特征(2):首先,在本领域中,共现关系是一种普遍的、常规的语法现象,常用于内容分析研究,共现分析法是将各种信息载体中的共现信息定量化的分析方法,广泛应用于文献计量研究中,通过共现关系获取最相近的文献等结果,其应用方向包括通过共现分析结果进行知识发现、利用共现分析结果拓展检索领域等,因此,通过共现关系的统计分析进行兴趣识别及个性化的推荐服务是本领域惯用技术手段;其次,在本领域中,为了提高推荐内容的精准程度,在进行内容的匹配时,选取多种方式和参数进行匹配并根据综合的匹配结果进行内容推荐,属于本领域的惯用技术手段。在上述惯用技术手段的启示下,为了在提高推荐内容的准确性的同时能够使推荐内容更加符合用户的兴趣和喜好,本领域技术人员能够对对比文件1进行改进,根据存在的兴趣标签与推荐的兴趣标签的相似度和共现关系进行兴趣标签的推荐,其属于本领域的惯用技术手段。所以为R(x,y)设置阈值K1,M(x,y)设置阈值K2,P(x,y)设置阈值K3的条件以更加精确推荐是本领域惯用技术手段。此外,对于相似度的具体计算方式,两个词的特征矢量之间的相似度可以根据特征空间中两点之间的距离进行度量。常用的方法包括余弦法、系数法等。因此,在利用词语等作为特征向量判断相似度的计算方法中,通过计算特征向量之间的余弦距离是本领域常见的一种相似度计算方式,例如话题追踪中话题和新闻报道之间的相似度计算。对于共现次数的计算M(x,y)=P(x,y)/(P(x)*P(y)),在本领域中利用公式R=(a and b)/(a or b)计算共现率是本领域公知常识,在信息检索、图书类目更新中已经使用,所以在此基础上构造共现次数的计算公式,是本领域惯用技术手段。
因此,在对比文件1的基础上结合本领域惯用技术手段以获得该项权利要求请求保护的技术方案,对本领域的技术人员来说是显而易见的,权利要求1请求保护的技术方案不具有突出的实质性特点,不具备专利法第22条第3款规定的创造性。
2.2、权利要求2引用权利要求1。共现关系的具体含义为存在的兴趣标签与推荐的兴趣标签在同一篇文档中出现的次数,是本领域惯用技术手段。因此,在其引用的权利要求1不具备创造性的情况下,权利要求2也不具有突出的实质性特点,不具备专利法第22条第3款规定的创造性。
2.3、权利要求3-4请求保护一种兴趣标签推荐系统,其是与权利要求1-2兴趣标签推荐方法相对应的产品权利要求,因此,基于与评述权利要求1-2类似的理由,权利要求3-4不具有突出的实质性特点,不具备专利法第22条第3款规定的创造性。
2.4、权利要求5请求保护一种计算机可读存储介质,其特征在于,所述存储介质中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或指令集由处理器加载并执行以实现如权利要求1至2中任一权利要求所述的兴趣标签推荐方法。对比文件1的说明书第3页中公开了:使用存储介质存储信息,CPU启动存储在存储介质中的程序执行信息推荐。因此,结合上文中针对权利要求1-2的评述,权利要求5不具有突出的实质性特点,不具备专利法第22条第3款规定的创造性。
3、关于复审请求人陈述的意见
对于复审请求人答复复审通知书时陈述的意见,合议组认为:
(1)如果仍然使用高频词会使文档分类或推荐到高频词所代表的临时热门话题,而不是分类或推荐到用户嗜好代表的话题中,这样会使根据用户嗜好推荐的精确度下降。因此,为了使高频词不会影响到基于用户嗜好进行推荐,解决对比文件1的基于用户嗜好进行文档推荐的技术问题,本领域技术人员容易想到将高频词去掉。
(2)对于话题群集的结构,参见对比文件1的附图9,其包含了关键字,即兴趣标签,所以话题群集是包含了兴趣标签的群集。因此,对比文件1公开了兴趣标签,推荐包含了兴趣标签的群集,方法执行的对象相同。并且根据对比文件1说明书第1页背景技术部分以及说明书第11页所公开的技术内容可知,对比文件1是为了更加精确的根据用户嗜好推荐文档,所以与本申请要解决的技术问题相同。
(3)首先,对比文件1所解决的技术问题也是如何使基于用户的使用历史和偏好的推荐更加准确(参见对比文件1说明书第1-2页背景技术部分),并且结合上文中对比文件1公开的内容可知,对比文件1中公开了基于相关度进行兴趣群集的提取;其次,在本领域中,为了提高推荐内容的准确度,通过多个推荐条件的叠加对推荐内容进行筛选以获得更加精确的推荐结果,是本领域的惯用技术手段。而使用共现关系获取最相近的文献等结果(参见《学习指南 修订版》,湖北科学技术出版社,公开日为2005年01月31日;Bibexcel软件使用指南,https://homepage.univie.ac.at/juan.gorraiz/bibexcel/,Persson,O.,R.Danell等,公开日为2009年12月31日)是本领域的公知常识。由此可知,为了提高标签推荐的准确度,在上述对比文件1公开的内容以及本领域公知常识的技术启示下,本领域技术人员能够想到使用共现关系和相关度进行文献的定量分析以得到更高的推荐准确率,其属于本领域的惯用技术手段。
综上所述,复审请求人陈述的意见不具有说服力,合议组不予支持。
基于上述事实和理由,合议组依法做出如下复审请求审查决定。
三、决定
维持国家知识产权局于2017年09月07日对本申请作出的驳回决定。
如对本复审请求审查决定不服,根据专利法第41条第2款的规定,复审请求人可以自收到本复审请求审查决定之日起三个月内向北京知识产权法院起诉。
郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如作者信息标记有误,请第一时间联系我们修改或删除,多谢。