用于通过使用基于事件的情绪分析来形成预测的系统和方法-复审决定


发明创造名称:用于通过使用基于事件的情绪分析来形成预测的系统和方法
外观设计名称:
决定号:185117
决定日:2019-07-24
委内编号:1F256630
优先权日:2012-08-15
申请(专利)号:201380043348.2
申请日:2013-08-14
复审请求人:汤姆森路透社全球资源非有限公司 廖文慧 马苏德·马克雷奇 萨梅纳·沙哈
无效请求人:
授权公告日:
审定公告日:
专利权人:
主审员:王艳坤
合议组组长:王雪莲
参审员:田志刚
国际分类号:G06N5/02
外观设计分类号:
法律依据:专利法第22条第3款
决定要点:如果一项权利要求的技术方案与最接近的现有技术相比存在区别技术特征,上述区别技术特征不属于本领域的公知常识,其他现有技术也没有给出将上述区别技术特征应用到该最接近的现有技术以解决其技术问题的技术启示,并且该区别技术特征的存在使得权利要求的技术方案具备有益的技术效果,则该项权利要求具备创造性。
全文:
本复审请求涉及申请号为201380043348.2,名称为“用于通过使用基于事件的情绪分析来形成预测的系统和方法”的发明专利申请(下称本申请)。本申请的申请人为汤姆森路透社全球资源非有限公司、廖文慧、马苏德?马克雷奇、萨梅纳?沙哈,申请日为2013年08月14日,最早优先权日为2012年08月15日,进入中国国家阶段日为2015年02月13日,公开日为2015年07月15日。
经实质审查,国家知识产权局原审查部门于2018年04月08日发出驳回决定,驳回了本申请,其理由是:权利要求1-22不具备专利法第22条第3款规定的创造性。驳回决定所依据的文本为:2015年02月13日提交的说明书第1-56段、说明书附图图1-4、说明书摘要、摘要附图;2017年10月17日提交的权利要求第1-22项。驳回决定所针对的权利要求书如下:
“1. 一种用于形成与事件相关联的预测的计算机实施的方法,所述方法包括:
通过使用具有处理器和存储器的计算装置来访问来自事件信息源的事件信息;
通过使用所述处理器和事件信息基于事件标准来识别第一事件;
通过使用所述计算装置来访问来自消息源的第一消息集合,其中所述第一消息集合由多个消息用户来产生;
通过使用所述处理器来使所述第一消息集合与所述第一事件相关联;
通过使用所述处理器来识别情绪特征集合,所述情绪特征集合包括表示与所述第一事件相关联的用户情绪的至少一个文本特征,其中,识别所述情绪特征集合包括基于所述第一事件来分析第一消息集合;
通过使用所述计算装置来访问来自所述消息源的第二消息集合;
通过使用所述处理器基于所述情绪特征集合来分析所述第二消息集合以形成与第二事件相关联的预测;
将所述预测存储在所述存储器中;并且其中
将所述情绪特征集合存储在所述存储器的动态词典中,情绪分析器发展和维护所述动态词典;
其中,所述第一消息集合和第二消息集合中的至少一个包括社交媒体消息,并且所述第一社交媒体消息集合中的每一个消息均在所述第一事件发生之前产生。
2. 根据权利要求1所述的方法,还包括:
基于所述预测而助于事件相关的服务。
3. 根据权利要求2所述的方法,其中,所述第二事件包括与股票价格相关联的盈利事件或者与所述股票价格相关联的亏损事件。
4. 根据权利要求3所述的方法,其中,助于所述事件相关的服务包括:
建立基于所述预测的有价证券交易策略,所述有价证券交易策略包括:
如果所述第二事件包括盈利事件,则针对股票持长期立场;以及
如果所述第二时间包括亏损事件,则针对股票持短期立场。
5. 根据权利要求1所述的方法,其中,所述情绪特征集合包括短语、单词、字符以及特殊符号中的至少一个。
6. 根据权利要求1所述的方法,其中,所述社交媒体消息包括推文。
7. 根据权利要求1所述的方法,其中,还包括:基于所述预测识别额外的情绪特征集合以更新所述动态词典,并且将所述额外的情绪特征集合存储在所述动态词典中。
8. 根据权利要求1所述的方法,其中,分析所述第一消息集合包括:
基于所述事件标准将标记分配至所述第一消息集合中的每个消息以创建第一被标记消息集合,其中所述标记对应于预定情绪值;
通过使用所述第一被标记消息集合来训练分类器;并且
通过使用所述分类器来识别所述情绪特征集合。
9. 根据权利要求8所述的方法,分析所述第二消息集合包括:
通过使用所述分类器来识别用于所述第二消息集合中的每一个消息的情绪值;
聚集至少一部分被识别的情绪值;
基于聚集的被识别的情绪值来确定情绪分数;并且
基于所述情绪分数形成预测。
10. 根据权利要求9所述的方法,其中所述情绪分数包括-1至1范围内的数字。
11. 根据权利要求1所述的方法,其中,所述第一事件包括与股票价格相关联的盈利事件以及与所述股票价格相关联的亏损事件,
其中,盈利事件被限定为在时段内的以下股票价格的相对增加,该股票价格的相对增加超过了比与市场指数相关联的利润多百分之 三以上;并且
其中,亏损事件被限定为在时段内的以下股票价格的相对减少,该股票价格的相对减少超过了比与市场指数相关联的利润少百分之三以下。
12. 根据权利要求11所述的方法,其中,所述市场指数包括标准普尔500指数、美国证交所综合指数、纳斯达克全球市场综合指数、纽约证券交易所综合指数、拉塞尔1000指数、威尔希尔5000指数、道琼斯工业指数、美国银行指数、纳斯达克金融100指数、费城证券交易所化工行业指数、拉塞尔1000成长指数以及SIG Energy MLP指数中的至少一个。
13. 根据权利要求11所述的方法,其中将所述标记分配至所述第一消息集合中的每个消息包括:
当所述第一事件为盈利事件时,将所述第一消息集合中的每个消息标记为正;
当所述第一事件为亏损事件时,将所述第一消息集合中的每个消息标记为负。
14. 根据权利要求1所述的方法,其中,分析所述第一消息集合包括施加自动回归模型。
15. 一种用于形成与事件相关联的预测的计算机实施的方法,所述方法包括:
通过使用具有处理器和存储器的计算装置来访问来自消息源的消息集合;其中所述消息集合由多个消息用户产生;
通过使用所述处理器来访问存储在所述存储器中的动态词典,所述动态词典包括情绪特征集合,所述情绪特征集合包括表示与第一事件相关联的用户情绪的至少一个文本特征;
通过使用所述处理器基于所述情绪特征集合来分析所述消息集合以形成与第二事件相关联的预测;并且
将所述预测存储在所述存储器中;并且其中
将所述情绪特征集合存储在所述存储器的动态词典中,情绪分析 器发展和维护所述动态词典;
其中,所述第一消息集合和第二消息集合中的至少一个包括社交媒体消息,并且所述第一社交媒体消息集合中的每一个消息均在所述第一事件发生之前产生。
16. 根据权利要求15所述的方法,还包括:
基于所述预测而助于事件相关的服务。
17. 根据权利要求15所述的方法,其中,所述消息集合包括社交媒体消息。
18. 根据权利要求17所述的方法,所述社交媒体消息包括推文。
19. 用于预测事件的系统,所述系统包括:
服务器,其构造为从消息源接收由多个消息用户产生的多个消息,所述服务器包括处理器,所述处理器实例化存储在存储器中的多个软件组件,所述多个软件组件包括:
情绪分析器,其构造为:(a)识别情绪特征集合,所述情绪特征集合包括表示与第一事件相关联的用户情绪的至少一个文本特征,其中所述情绪分析器构造为基于所述第一事件来分析所述多个消息的第一集合以识别所述情绪特征集合;以及(b)基于所述情绪特征集合来形成与第二事件相关联的预测,其中所述情绪分析器构造为通过分析所述多个消息的第二集合来形成所述预测;以及
服务组件,其构造为基于所述预测而助于事件相关的服务;并且其中
将所述情绪特征集合存储在所述存储器的动态词典中,所述情绪分析器发展和维护所述动态词典;
其中,所述第一消息集合和第二消息集合中的至少一个包括社交媒体消息,并且所述第一社交媒体消息集合中的每一个消息均在所述第一事件发生之前产生。
20. 根据权利要求19所述的系统,其中,所述情绪分析器包括情绪分类器以及提取模块,并且其中所述提取模块构造为:
基于事件标准将标记分配至所述第一消息集合中的每个消息以 创建被标记消息集合,其中所述标记对应于预定情绪值;以及
通过使用所述被标记消息集合来训练所述分类器。
21. 根据权利要求19所述的系统,其中,所述多个消息包括社交媒体消息集合。
22. 根据权利要求21所述的系统,其中,所述社交媒体消息集合包括推文集合。”
驳回决定引用的对比文件如下:
对比文件1:“Knowledge Management and Business Intelligence”,Thirty Second International Conference on Information Systems Shanghai 2011,“INVESTIGATING PREDICTIVE POWER OF STOCK MICRO BLOG SENTIMENT IN FORECASTING FUTURE STOCK PRICE DIRECTIONAL MOVEMENT”,Chong Oh等,2011年12月31日。
对比文件1为最接近的现有技术。
驳回决定的主要理由:权利要求1与对比文件1相比,其区别在于:将所述情绪特征集合存储在所述存储器的动态词典中,情绪分析器发展和维护所述动态词典;将分析第二消息集合以形成与第二事件相关联的预测存储在所述存储器中。对比文件1已经公开了从每个微博客中提取的情绪,有手动并自动提取词汇,标记7109的帖子,分为三种不同的情绪,1看涨,-1看跌,0中性情绪;对照股票行情,将产生的所有单词的特征向量的发布集,然后一个机器学习算法和分类器被用于产生一个学习模式,该组合方法使用由词汇分类产生的特征向量,以得到情感词汇集合和实际股票浮动的关联性的关系模型。因为对比文件1选取的微博帖子数量较大,而微博具有更新频率高的特点,从微博帖子中所提取的代表情绪的词汇量也将随之变化,因此为了及时更新上述情绪特征向量集,通过动态词典存储所述情绪特征集合,由具有相应功能的情绪分析器发展和维护所述动态词典,这属于本领域常用的技术手段。至于将分析第二消息集合以形成与第二事件相关联的预测存储在所述存储器中,这也是本领域常用的技术手段。因此,权利要求1不具备专利法第22条第3款规定的创造性。权利要求2-14记载的附加技术特征或为本领域的常用技术手段或被对比文件1所公开,因此,也不具备专利法第22条第3款规定的创造性。权利要求15与对比文件1相比,其区别在于:预测存储在所述存储器中;将所述情绪特征集合存储在所述存储器的动态词典中,情绪分析器发展和维护所述动态词典。对比文件1已经公开了从每个微博客中提取的情绪,有手动并自动提取词汇,标记7109的帖子,分为三种不同的情绪,1看涨,-1看跌,0中性情绪;对照股票行情,将产生的所有单词的特征向量的发布集,然后一个机器学习算法和分类器被用于产生一个学习模式,该组合方法使用由词汇分类产生特征向量,以得到情感词汇集合和实际股票浮动的关联性的关系模型。因为对比文件1选取的微博帖子数量较大,而微博具有更新频率高的特点,从微博帖子中所提取的代表情绪的词汇量也将随之变化,因此为了及时更新上述情绪特征向量集,通过动态词典存储所述情绪特征集合,由具有相应功能的情绪分析器发展和维护所述动态词典,这属于本领域常用的技术手段。至于将所述预测存储在存储器中,这也是本领域常用的技术手段。因此,权利要求15不具备专利法第22条第3款规定的创造性。权利要求16-18记载的附加技术特征或为本领域的常用技术手段或被对比文件1所公开,因此,也不具备专利法第22条第3款规定的创造性。权利要求19与对比文件1相比,其区别在于:包括服务器,服务器包括处理器,所述处理器实例化存储在存储器中的多个软件组件,其中包括情绪分析器,将所述情绪特征集合存储在所述存储器的动态词典中,所述情绪分析器发展和维护所述动态词典。对比文件1已经公开了从每个微博客中提取的情绪,有手动并自动提取词汇,标记7109的帖子,分为三种不同的情绪,1看涨,-1看跌,0中性情绪;对照股票行情,将产生的所有单词的特征向量的发布集,然后一个机器学习算法和分类器被用于产生一个学习模式,该组合方法使用由词汇分类产生特征向量,以得到情感词汇集合和实际股票浮动的关联性的关系模型。因为对比文件1选取的微博帖子数量较大,而微博具有更新频率高的特点,从微博帖子中所提取的代表情绪的词汇量也将随之变化,因此为了及时更新上述情绪特征向量集,通过动态词典存储所述情绪特征集合,由具有相应功能的情绪分析器发展和维护所述动态词典,这属于本领域常用的技术手段。至于将所述预测存储在存储器中,这也是本领域常用的技术手段。而根据功能设置相应的服务器、功能组件、分析器等,这属于本领域常用的技术手段。因此,权利要求19不具备专利法第22条第3款规定的创造性。权利要求20-22记载的附加技术特征或为本领域的常用技术手段或被对比文件1所公开,因此也不具备专利法第22条第3款规定的创造性。
申请人(下称复审请求人)对上述驳回决定不服,于2018年07月20日向国家知识产权局提出了复审请求,同时修改了权利要求书。所述修改涉及根据说明书第39、43、47段记载的内容,分别向权利要求1、15、19增加特征“所述第一事件包括与股票的股票价格相关联的盈利事件或者与所述股票价格相关联的亏损事件,其中当所述事件信息指示超过与市场指数相关联的预定利润的所述股票价格的相对增加时所述第一事件是盈利事件,并且其中当所述事件信息指示超过与所述市场指数相关联的预定损失的所述股票价格的相对减少时所述第一事件是损失事件”,权利要求11删除其中的技术特征“所述第一事件包括与股票价格相关联的盈利事件以及与所述股票价格相关联的亏损事件”。复审请求人认为:对比文件1没有公开修改后的权利要求1中的特征“所述第一事件包括与股票的股票价格相关联的盈利事件或者与所述股票价格相关联的亏损事件,其中当所述事件信息指示超过与市场指数相关联的预定利润的所述股票价格的相对增加时所述第一事件是盈利事件,并且其中当所述事件信息指示超过与所述市场指数相关联的预定损失的所述股票价格的相对减少时所述第一事件是损失事件”,也没有给出与其相关的任何启示。根据本申请,第一事件包括与股票的股票价格相关联的盈利事件或与股票价格相关联的亏损事件,其中当所述事件信息指示超过与市场指数相关联的预定利润的所述股票价格的相对增加时所述第一事件是盈利事件,并且其中当所述事件信息指示超过与所述市场指数相关联的预定损失的所述股票价格的相对减少时所述第一事件是损失事件。在本申请中,修改后的权利要求1的技术方案的第一和第二事件与股票价格相对于市场指数的相对趋势相关,而不与股票价格变动、上升或下降趋势相关。在本申请中,指示不超过与市场指数相关联的预定利润的股票价格的相对增加,并且指示不超过与市场指数相关联的预定损失的股票价格的相对减少的事件信息将不会被处理。复审请求时新修改的权利要求1、11、15、19如下:
“1.一种用于形成与事件相关联的预测的计算机实施的方法,所述方法包括:
通过使用具有处理器和存储器的计算装置来访问来自事件信息源的事件信息;
通过使用所述处理器和事件信息基于事件标准来识别第一事件;
通过使用所述计算装置来访问来自消息源的第一消息集合,其中所述第一消息集合由多个消息用户来产生;
通过使用所述处理器来使所述第一消息集合与所述第一事件相关联;
通过使用所述处理器来识别情绪特征集合,所述情绪特征集合包括表示与所述第一事件相关联的用户情绪的至少一个文本特征,其中,识别所述情绪特征集合包括基于所述第一事件来分析第一消息集合;
通过使用所述计算装置来访问来自所述消息源的第二消息集合;
通过使用所述处理器基于所述情绪特征集合来分析所述第二消息集合以形成与第二事件相关联的预测;
将所述预测存储在所述存储器中;并且其中
将所述情绪特征集合存储在所述存储器的动态词典中,情绪分析器发展和维护所述动态词典;
其中,所述第一消息集合和第二消息集合中的至少一个包括社交媒体消息,并且所述第一社交媒体消息集合中的每一个消息均在所述第一事件发生之前产生;
其中,所述第一事件包括与股票的股票价格相关联的盈利事件或者与所述股票价格相关联的亏损事件,其中当所述事件信息指示超过与市场指数相关联的预定利润的所述股票价格的相对增加时所述第一事件是盈利事件,并且其中当所述事件信息指示超过与所述市场指数相关联的预定损失的所述股票价格的相对减少时所述第一事件是损失事件。”
“11. 根据权利要求1所述的方法,
其中,盈利事件被限定为在时段内的以下股票价格的相对增加,该股票价格的相对增加超过了比与市场指数相关联的利润多百分之三以上;并且
其中,亏损事件被限定为在时段内的以下股票价格的相对减少,该股票价格的相对减少超过了比与市场指数相关联的利润少百分之三以下。”
“15. 一种用于形成与事件相关联的预测的计算机实施的方法,所述方法包括:
通过使用具有处理器和存储器的计算装置来访问来自消息源的消息集合;其中所述消息集合由多个消息用户产生;
通过使用所述处理器来访问存储在所述存储器中的动态词典,所述动态词典包括情绪特征集合,所述情绪特征集合包括表示与第一事 件相关联的用户情绪的至少一个文本特征;
通过使用所述处理器基于所述情绪特征集合来分析所述消息集合以形成与第二事件相关联的预测;并且
将所述预测存储在所述存储器中;并且其中
将所述情绪特征集合存储在所述存储器的动态词典中,情绪分析器发展和维护所述动态词典;
其中,所述第一消息集合和第二消息集合中的至少一个包括社交媒体消息,并且所述第一社交媒体消息集合中的每一个消息均在所述第一事件发生之前产生;
其中,所述第一事件包括与股票的股票价格相关联的盈利事件或者与所述股票价格相关联的亏损事件,其中当所述事件信息指示超过与市场指数相关联的预定利润的所述股票价格的相对增加时所述第一事件是盈利事件,并且其中当所述事件信息指示超过与所述市场指数相关联的预定损失的所述股票价格的相对减少时所述第一事件是损失事件。”
“19. 用于预测事件的系统,所述系统包括:
服务器,其构造为从消息源接收由多个消息用户产生的多个消息,所述服务器包括处理器,所述处理器实例化存储在存储器中的多个软件组件,所述多个软件组件包括:
情绪分析器,其构造为:(a)识别情绪特征集合,所述情绪特征集合包括表示与第一事件相关联的用户情绪的至少一个文本特征,其中所述情绪分析器构造为基于所述第一事件来分析所述多个消息的第一集合以识别所述情绪特征集合;以及(b)基于所述情绪特征集合来形成与第二事件相关联的预测,其中所述情绪分析器构造为通过 分析所述多个消息的第二集合来形成所述预测;以及
服务组件,其构造为基于所述预测而助于事件相关的服务;并且其中
将所述情绪特征集合存储在所述存储器的动态词典中,所述情绪分析器发展和维护所述动态词典;
其中,所述第一消息集合和第二消息集合中的至少一个包括社交媒体消息,并且所述第一社交媒体消息集合中的每一个消息均在所述第一事件发生之前产生;
其中,所述第一事件包括与股票的股票价格相关联的盈利事件或者与所述股票价格相关联的亏损事件,其中当所述事件信息指示超过与市场指数相关联的预定利润的所述股票价格的相对增加时所述第一事件是盈利事件,并且其中当所述事件信息指示超过与所述市场指数相关联的预定损失的所述股票价格的相对减少时所述第一事件是损失事件。”
经形式审查合格,国家知识产权局于2018年07月30日依法受理了该复审请求,并将其转送至原审查部门进行前置审查。
原审查部门在前置审查意见书中认为,对比文件1公开了股票的波动包括向上或向下,向上表示盈利,向下表示损失,即对比文件1公开了技术特征“所述第一事件包括与股票的股票价格相关联的盈利事件或者与所述股票价格相关联的亏损事件”。而为了明确显示股票波动,根据需要设定波动阈值,即股票浮动大于该阈值才计入盈利或损失,小于该阈值时不算盈利或损失,这属于本领域的常用手段。因此,修改后的权利要求仍不具备创造性,因而坚持原驳回决定。
随后,国家知识产权局成立合议组对本案进行审理。
在上述程序的基础上,合议组认为本案事实已经清楚,可以作出审查决定。
二、决定的理由
1.审查文本的认定
复审请求人在提交复审请求时对权利要求书进行了修改。经审查,所述修改符合专利法第33条和专利法实施细则第61条第1款的规定。本复审决定所针对的审查文本为:2018年07月20日提交的权利要求1-22项;2015年02月13日提交的说明书第1-56段、说明书附图图1-4、说明书摘要、摘要附图。
2.专利法第22条第3款
专利法第22条第3款规定:创造性,是指与现有技术相比,该发明具有突出的实质性特点和显著的进步,该实用新型具有实质性特点和进步。
如果一项权利要求的技术方案与最接近的现有技术相比存在区别技术特征,上述区别技术特征不属于本领域的公知常识,其他现有技术也没有给出将上述区别技术特征应用到该最接近的现有技术以解决其技术问题的技术启示,并且该区别技术特征的存在使得权利要求的技术方案具备有益的技术效果,则该项权利要求具备创造性。
本复审决定引用的对比文件与驳回决定中引用的对比文件相同,即:
对比文件1:“Knowledge Management and Business Intelligence”,Thirty Second International Conference on Information Systems Shanghai 2011,“INVESTIGATING PREDICTIVE POWER OF STOCK MICRO BLOG SENTIMENT IN FORECASTING FUTURE STOCK PRICE DIRECTIONAL MOVEMENT”,Chong Oh等,2011年12月31日。
对比文件1为最接近的现有技术。
2.1. 权利要求1请求保护一种用于形成与事件相关联的预测的计算机实施的方法。对比文件1公开了一种调查中的股票预测能力微博情绪预测未来股价动向的方法,该方法用于发现并评估股票微博情绪对未来股价走势的预测能力,基于情绪分析和数据挖掘算法,构建一套鲁棒模型,并具体包括如下内容(参见摘要以及正文第7-10页):从雅虎财经获得期间2010年5月11日至2010年8月7日的获得超过208278股微博客帖子,5981作者简介,以及720840日间股价帖子;关键的预测因素是从每一个微博帖子中提取的情绪,这些情绪来源于帖子,并没有明确由作者提供,我们有手动并自动提取它们,标记7109的帖子(相当于访问来自消息源的第一消息集合,其中所述第一消息集合由多个消息用户来产生),分为三种不同的情绪,1看涨,-1看跌,0中性情绪;我们使用词汇记分员、单词包以及这两种方法的结合类标记帖子,词汇知识包括用于手工编制的看涨和看跌关键词对帖子中每一个词进行打分,然后获取每个帖子的聚合分数;单词包包括生成帖子集合中所有词的特征向量,然后使用一个机器学习算法J48分类器以产生一个学习模型,组合方法使用由词汇分类器产生的词以生成为特征向量(相当于识别情绪特征集合,所述情绪特征集合包括表示用户情绪的至少一个文本特征);参见第10页表5,根据上面学习,从其它的微博客内容集合(相当于第二消息集合)可以预测得到未来股票的看涨指标(相当于第二事件),以市场分别调整后的回报也表明和这个预测是一致(相当于通过使用所述计算装置来访问来自所述消息源的第二消息集合;通过使用所述处理器基于所述情绪特征集合来分析所述第二消息集合以形成与第二事件相关联的预测);利用微型股票预测未来股票走势,可以帮助平台提供商获取价值。而访问上述微博平台必然通过具备处理器和存储器的计算机装置。从微博客内容集合(相当于第一消息集合和第二消息集合中的至少一个包括社交媒体消息)可以预测得到未来股票的看涨指标,而微博客中的看涨,看跌,中性等情绪必然发生在股票行情之前。
该权利要求请求保护的技术方案与对比文件1所公开的内容相比,其区别在于:(1)通过使用具有处理器和存储器的计算装置来访问来自事件信息源的事件信息;通过使用所述处理器和事件信息基于事件标准来识别第一事件;通过使用所述处理器来使所述第一消息集合与所述第一事件相关联;所述情绪特征集合包括表示与所述第一事件相关联的用户情绪的至少一个文本特征,识别所述情绪特征集合包括基于所述第一事件来分析第一消息集合;所述第一社交媒体消息集合中的每一个消息均在所述第一事件发生之前产生;所述第一事件包括与股票的股票价格相关联的盈利事件或者与所述股票价格相关联的亏损事件,其中当所述事件信息指示超过与市场指数相关联的预定利润的所述股票价格的相对增加时所述第一事件是盈利事件,并且其中当所述事件信息指示超过与所述市场指数相关联的预定损失的所述股票价格的相对减少时所述第一事件是损失事件;(2)将所述预测存储在所述存储器中;将所述情绪特征集合存储在所述存储器的动态词典中,情绪分析器发展和维护所述动态词典。
基于上述区别技术特征,本申请实际要解决的技术问题是:如何基于事件进行情绪分析以形成与事件相关联的预测以及情绪分析器的更新和维护问题。
关于区别技术特征(1),对比文件1没有公开:访问事件信息源的事件信息,基于事件标准识别第一事件,每一个消息均在第一事件发生之前产生,将第一事件与第一消息集合关联,基于第一事件分析第一消息集合,用户情绪的文本特征与第一事件相关联,以及所述第一事件包括与股票的股票价格相关联的盈利事件或者与所述股票价格相关联的亏损事件,其中当所述事件信息指示超过与市场指数相关联的预定利润的所述股票价格的相对增加时所述第一事件是盈利事件,并且其中当所述事件信息指示超过与所述市场指数相关联的预定损失的所述股票价格的相对减少时所述第一事件是损失事件。
根据对比文件1公开的内容可知,通过从微博帖子中提取情绪相关度词汇,使用算法分类器进行训练形成学习模型,进而可以对其他微博帖子进行分析预测。对比文件1中情绪1表示看涨,-1表示看跌,对应实际股价运行为向上(1)或者向下(-1)趋势,发现并评估股票微博情绪对未来股价走势,对比文件1没有给出形成基于如此事件的情绪分析以预测盈利事件或损失事件的启示,所述盈利事件指示超过与市场指数相关联的预定利润的所述股票价格的相对增加,所述损失信息指示超过与所述市场指数相关联的预定损失的所述股票价格的相对减少。通过使用超过与市场指数相关联的预定利润和预定损失的股票交个的相对增加和相对减少,可以显著减少要分析的数据量,减少动态词典的大小,提高预测的准确性结果。上述区别技术特征也不是本领域的公知常识。
关于区别技术特征(2),对比文件1已经公开了我们使用词汇记分员、单词包以及这两种方法的结合类标记帖子,词汇知识包括用于手工编制的看涨和看跌关键词对帖子中每一个词进行打分,然后获取每个帖子的聚合分数;单词包包括生成帖子集合中所有词的特征向量,然后使用一个机器学习算法J48分类器以产生一个学习模型,组合方法使用由词汇分类器产生的词以生成为特征向量。即对比文件1给出了通过分类器训练数据的启示,且对于本领域技术人员而言,通过词典存储特征向量以及分类器不断的更新和维护是本领域的常用技术手段。
总之,权利要求1的技术方案与最接近的现有技术相比至少存在区别技术特征(1),上述区别技术特征(1)不属于本领域的公知常识,其他现有技术也没有给出将上述区别技术特征(1)应用到该最接近的现有技术以解决其技术问题的技术启示,并且该区别技术特征(1)的存在使得权利要求1的技术方案能够形成基于事件的预测的有益效果,则该项权利要求1具备专利法第22条第3款规定的创造性。
2.2.在权利要求1具备创造性的情形下,其从属权利要求2-14也具备专利法第22条第3款规定的创造性。
2.3. 权利要求15请求保护一种用于形成与事件相关联的预测的计算机实施的方法。对比文件1公开了一种调查中的股票预测能力微博情绪预测未来股价动向的方法,该方法用于发现并评估股票微博情绪对未来股价走势的预测能力,基于情绪分析和数据挖掘算法,构建一套鲁棒模型,并具体包括如下内容(参见摘要以及正文第7-10页):从雅虎财经获得期间2010年5月11日至2010年8月7日的获得超过208278股微博客帖子,5981作者简介,以及720840日间股价帖子;关键的预测因素是从每一个微博帖子中提取的情绪,这些情绪来源于帖子,并没有明确由作者提供,我们有手动并自动提取它们,标记7109的帖子(相当于访问来自消息源的第一消息集合,其中所述第一消息集合由多个消息用户来产生),分为三种不同的情绪,1看涨,-1看跌,0中性情绪;我们使用词汇记分员、单词包以及这两种方法的结合类标记帖子,词汇知识包括用于手工编制的看涨和看跌关键词对帖子中每一个词进行打分,然后获取每个帖子的聚合分数;单词包包括生成帖子集合中所有词的特征向量,然后使用一个机器学习算法J48分类器以产生一个学习模型,组合方法使用由词汇分类器产生的词以生成为特征向量(相当于识别情绪特征集合,所述情绪特征集合包括表示用户情绪的至少一个文本特征,);参见第10页表5,根据上面学习,从其它的微博客内容集合(相当于第二消息集合)可以预测得到未来股票的看涨指标(相当于第二事件),以市场分别调整后的回报也表明和这个预测是一致(相当于通过使用所述计算装置来访问来自所述消息源的第二消息集合;通过使用所述处理器基于所述情绪特征集合来分析所述第二消息集合以形成与第二事件相关联的预测);利用微型股票预测未来股票走势,可以帮助平台提供商获取价值。而访问上述微博平台必然通过具备处理器和存储器的计算机装置。从微博客内容集合(相当于第一消息集合和第二消息集合中的至少一个包括社交媒体消息)可以预测得到未来股票的看涨指标,而微博客中的看涨,看跌,中性等情绪必然发生在股票行情之前。
该权利要求请求保护的技术方案与对比文件1所公开的内容相比,其区别在于:(1)所述情绪特征集合包括表示与所述第一事件相关联的用户情绪的至少一个文本特征;所述第一社交媒体消息集合中的每一个消息均在所述第一事件发生之前产生;所述第一事件包括与股票的股票价格相关联的盈利事件或者与所述股票价格相关联的亏损事件,其中当所述事件信息指示超过与市场指数相关联的预定利润的所述股票价格的相对增加时所述第一事件是盈利事件,并且其中当所述事件信息指示超过与所述市场指数相关联的预定损失的所述股票价格的相对减少时所述第一事件是损失事件;(2)通过使用所述处理器来访问存储在所述存储器中的动态词典;将所述预测存储在所述存储器中;将所述情绪特征集合存储在所述存储器的动态词典中,情绪分析器发展和维护所述动态词典。
基于上述区别技术特征,本申请实际要解决的技术问题是:如何基于事件进行情绪分析以及情绪分析器的更新和维护问题。
关于区别技术特征(1),对比文件1没有公开:用户情绪的文本特征与第一事件相关联,每一个消息均在第一事件发生之前产生以及所述第一事件包括与股票的股票价格相关联的盈利事件或者与所述股票价格相关联的亏损事件,其中当所述事件信息指示超过与市场指数相关联的预定利润的所述股票价格的相对增加时所述第一事件是盈利事件,并且其中当所述事件信息指示超过与所述市场指数相关联的预定损失的所述股票价格的相对减少时所述第一事件是损失事件。
根据对比文件1公开的内容可知,通过从微博帖子中提取情绪相关度词汇,使用算法分类器进行训练形成学习模型,进而可以对其他微博帖子进行分析预测。对比文件1中情绪1表示看涨,-1表示看跌,对应实际股价运行为向上(1)或者向下(-1)趋势,发现并评估股票微博情绪对未来股价走势,对比文件1没有给出形成基于如此事件的情绪分析以预测盈利事件或损失事件的启示,所述盈利事件指示超过与市场指数相关联的预定利润的所述股票价格的相对增加,所述损失信息指示超过与所述市场指数相关联的预定损失的所述股票价格的相对减少。通过使用超过与市场指数相关联的预定利润和预定损失的股票交个的相对增加和相对减少,可以显著减少要分析的数据量,减少动态词典的大小,提高预测的准确性结果。上述区别技术特征也不是本领域的公知常识。
关于区别技术特征(2),对比文件1已经公开了我们使用词汇记分员、单词包以及这两种方法的结合类标记帖子,词汇知识包括用于手工编制的看涨和看跌关键词对帖子中每一个词进行打分,然后获取每个帖子的聚合分数;单词包包括生成帖子集合中所有词的特征向量,然后使用一个机器学习算法J48分类器以产生一个学习模型,组合方法使用由词汇分类器产生的词以生成为特征向量。即对比文件1给出了通过分类器训练数据的启示,且对于本领域技术人员而言,通过词典存储特征向量以及分类器不断的更新和维护是本领域的常用技术手段。
总之,权利要求15的技术方案与最接近的现有技术相比至少存在区别技术特征(1),上述区别技术特征(1)不属于本领域的公知常识,其他现有技术也没有给出将上述区别技术特征(1)应用到该最接近的现有技术以解决其技术问题的技术启示,并且该区别技术特征(1)的存在使得权利要求15的技术方案能够形成基于事件的预测的有益效果,则该项权利要求15具备专利法第22条第3款规定的创造性。
2.4.在权利要求15具备创造性的情形下,其从属权利要求16-18也具备专利法第22条第3款规定的创造性。
2.5.权利要求19请求保护一种用于预测事件的系统。对比文件1公开了一种调查中的股票预测能力微博情绪预测未来股价动向的方法,该方法用于发现并评估股票微博情绪对未来股价走势的预测能力,基于情绪分析和数据挖掘算法,构建一套鲁棒模型,并具体包括如下内容(参见摘要以及正文第7-10页):从雅虎财经获得期间2010年5月11日至2010年8月7日的获得超过208278股微博客帖子,5981作者简介,以及720840日间股价帖子;关键的预测因素是从每一个微博帖子中提取的情绪,这些情绪来源于帖子,并没有明确由作者提供,我们有手动并自动提取它们,标记7109的帖子(相当于访问来自消息源的第一消息集合,其中所述第一消息集合由多个消息用户来产生),分为三种不同的情绪,1看涨,-1看跌,0中性情绪;我们使用词汇记分员、单词包以及这两种方法的结合类标记帖子,词汇知识包括用于手工编制的看涨和看跌关键词对帖子中每一个词进行打分,然后获取每个帖子的聚合分数;单词包包括生成帖子集合中所有词的特征向量,然后使用一个机器学习算法J48分类器以产生一个学习模型,组合方法使用由词汇分类器产生的词以生成为特征向量(相当于识别情绪特征集合,所述情绪特征集合包括表示用户情绪的至少一个文本特征,);参见第10页表5,根据上面学习,从其它的微博客内容集合(相当于第二消息集合)可以预测得到未来股票的看涨指标(相当于第二事件),以市场分别调整后的回报也表明和这个预测是一致(相当于通过使用所述计算装置来访问来自所述消息源的第二消息集合;通过使用所述处理器基于所述情绪特征集合来分析所述第二消息集合以形成与第二事件相关联的预测);利用微型股票预测未来股票走势,可以帮助平台提供商获取价值。而访问上述微博平台必然通过具备处理器和存储器的计算机装置。从微博客内容集合(相当于第一消息集合和第二消息集合中的至少一个包括社交媒体消息)可以预测得到未来股票的看涨指标,而微博客中的看涨,看跌,中性等情绪必然发生在股票行情之前。
该权利要求请求保护的技术方案与对比文件1所公开的内容相比,其区别在于:(1)情绪特征集合包括表示与第一事件相关联的用户情绪的至少一个文本特征,情绪分析器构造为基于所述第一事件来分析所述多个消息的第一集合以识别所述情绪特征集合;所述第一社交媒体消息集合中的每一个消息均在所述第一事件发生之前产生;所述第一事件包括与股票的股票价格相关联的盈利事件或者与所述股票价格相关联的亏损事件,其中当所述事件信息指示超过与市场指数相关联的预定利润的所述股票价格的相对增加时所述第一事件是盈利事件,并且其中当所述事件信息指示超过与所述市场指数相关联的预定损失的所述股票价格的相对减少时所述第一事件是损失事件;(2)将所述预测存储在所述存储器中;将所述情绪特征集合存储在所述存储器的动态词典中,情绪分析器发展和维护所述动态词典。
基于上述区别技术特征,本申请实际要解决的技术问题是:如何基于事件进行情绪分析以及情绪分析器的更新和维护问题。
关于区别技术特征(1),对比文件1没有公开:用户情绪的文本特征与第一事件相关联,基于所述第一事件来分析所述多个消息的第一集合以识别所述情绪特征集合,每一个消息均在第一事件发生之前产生以及所述第一事件包括与股票的股票价格相关联的盈利事件或者与所述股票价格相关联的亏损事件,其中当所述事件信息指示超过与市场指数相关联的预定利润的所述股票价格的相对增加时所述第一事件是盈利事件,并且其中当所述事件信息指示超过与所述市场指数相关联的预定损失的所述股票价格的相对减少时所述第一事件是损失事件。
根据对比文件1公开的内容可知,通过从微博帖子中提取情绪相关度词汇,使用算法分类器进行训练形成学习模型,进而可以对其他微博帖子进行分析预测。对比文件1中情绪1表示看涨,-1表示看跌,对应实际股价运行为向上(1)或者向下(-1)趋势,发现并评估股票微博情绪对未来股价走势,对比文件1没有给出形成基于如此事件的情绪分析以预测盈利事件或损失事件的启示,所述盈利事件指示超过与市场指数相关联的预定利润的所述股票价格的相对增加,所述损失信息指示超过与所述市场指数相关联的预定损失的所述股票价格的相对减少。通过使用超过与市场指数相关联的预定利润和预定损失的股票交个的相对增加和相对减少,可以显著减少要分析的数据量,减少动态词典的大小,提高预测的准确性结果。上述区别技术特征也不是本领域的公知常识。
关于区别技术特征(2),对比文件1已经公开了我们使用词汇记分员、单词包以及这两种方法的结合类标记帖子,词汇知识包括用于手工编制的看涨和看跌关键词对帖子中每一个词进行打分,然后获取每个帖子的聚合分数;单词包包括生成帖子集合中所有词的特征向量,然后使用一个机器学习算法J48分类器以产生一个学习模型,组合方法使用由词汇分类器产生的词以生成为特征向量。即对比文件1给出了通过分类器训练数据的启示,且对于本领域技术人员而言,通过词典存储特征向量以及分类器不断的更新和维护是本领域的常用技术手段。
总之,权利要求19的技术方案与最接近的现有技术相比至少存在区别技术特征(1),上述区别技术特征(1)不属于本领域的公知常识,其他现有技术也没有给出将上述区别技术特征(1)应用到该最接近的现有技术以解决其技术问题的技术启示,并且该区别技术特征(1)的存在使得权利要求19的技术方案能够形成基于事件的预测的有益效果,则该项权利要求19具备专利法第22条第3款规定的创造性。
2.6.在权利要求19具备创造性的情形下,其从属权利要求20-22也具备专利法第22条第3款规定的创造性。
3.关于驳回决定和前置审查意见
合议组认为:关于权利要求1、15或19而言,与对比文件1相比较,对比文件1至少没有公开:用户情绪的文本特征与第一事件相关联,基于所述第一事件来分析所述多个消息的第一集合以识别所述情绪特征集合,每一个消息均在第一事件发生之前产生以及所述第一事件包括与股票的股票价格相关联的盈利事件或者与所述股票价格相关联的亏损事件,其中当所述事件信息指示超过与市场指数相关联的预定利润的所述股票价格的相对增加时所述第一事件是盈利事件,并且其中当所述事件信息指示超过与所述市场指数相关联的预定损失的所述股票价格的相对减少时所述第一事件是损失事件。根据对比文件1公开的内容可知,通过从微博帖子中提取情绪相关度词汇,使用算法分类器进行训练形成学习模型,进而可以对其他微博帖子进行分析预测。对比文件1中情绪1表示看涨,-1表示看跌,对应实际股价运行为向上(1)或者向下(-1)趋势,发现并评估股票微博情绪对未来股价走势,对比文件1没有给出形成基于如此事件的情绪分析以预测盈利事件或损失事件的启示,所述盈利事件指示超过与市场指数相关联的预定利润的所述股票价格的相对增加,所述损失信息指示超过与所述市场指数相关联的预定损失的所述股票价格的相对减少。通过使用超过与市场指数相关联的预定利润和预定损失的股票交个的相对增加和相对减少,可以显著减少要分析的数据量,减少动态词典的大小,提高预测的准确性结果。上述区别技术特征也不是本领域的公知常识。
至于本申请是否还存在其他缺陷,均留待后续程序继续审查。
三、决定
撤销国家知识产权局于2018年04月08 日对本申请作出的驳回决定。由国家知识产权局原审查部门在2018年07月20日提交的权利要求1-22项;2015年02月13日提交的说明书第1-56段、说明书附图图1-4、说明书摘要、摘要附图的基础上对本申请继续进行审查。
如对本复审请求审查决定不服,根据专利法第41条第2款的规定,复审请求人可自收到本决定之日起三个月内向北京知识产权法院起诉。


郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如作者信息标记有误,请第一时间联系我们修改或删除,多谢。

留言与评论(共有 0 条评论)
   
验证码: