发明创造名称:预测叫车平台的用户流失的方法和装置
外观设计名称:
决定号:199036
决定日:2019-12-27
委内编号:1F260762
优先权日:
申请(专利)号:201410748736.7
申请日:2014-12-09
复审请求人:北京嘀嘀无限科技发展有限公司
无效请求人:
授权公告日:
审定公告日:
专利权人:
主审员:杨洁
合议组组长:王阜东
参审员:富瑶
国际分类号:G06Q10/04;G06Q50/30
外观设计分类号:
法律依据:专利法第22条第3款
决定要点:如果一项权利要求请求保护的技术方案相对于最接近的现有技术存在区别技术特征,且现有技术中给出了将上述区别技术特征应用到该最接近的现有技术以解决其存在的技术问题的启示,这种启示会使本领域技术人员在面对所述技术问题时,有动机改进该最接近的现有技术并获得该权利要求请求保护的技术方案,则该权利要求所要求保护的技术方案不具有突出的实质性特点和显著的进步,不具备创造性。
全文:
本复审请求涉及申请号为201410748736.7,名称为“预测叫车平台的用户流失的方法和装置”的发明专利申请(下称本申请)。申请人为北京嘀嘀无限科技发展有限公司。本申请的申请日为2014年12月09日,公开日为2015年04月08日。
经实质审查,国家知识产权局原审查部门于2018年06月05日发出驳回决定,驳回了本申请,其理由是:权利要求1-22不具备专利法第22条第3款规定的创造性。驳回决定引用了以下对比文件:
对比文件1:CN103854065 A,公开日为2014年06月11日。
驳回决定所依据的文本为:2018年04月23日提交的权利要求第1-22项,申请日2014年12月09日提交的说明书第1-88段、说明书附图图1-7、说明书摘要、摘要附图。驳回决定所针对的权利要求书如下:
“1. 一种预测叫车平台的用户流失的方法,包括:
基于用户的行为变量在不同时间段中的取值来获得预定的预测模型的输入变量;
将判断用户是否将会流失的变量确定为所述预测模型的输出变量;
将所述输入变量和所述输出变量作为历史数据,对所述预测模型进行训练;以及
通过选择评价指标来评价所述预测模型,并通过以下至少一项来获得优化的预测模型:基于对所述预测模型的评价来优化所述预测模型,或者从多个经训练的预测模型中选出最优的预测模型;
基于所述优化的预测模型,来预测用户是否将会流失。
2. 根据权利要求1所述的方法,其中所述预定的预测模型包括:
基于神经网络算法的模型、基于决策树的模型、或者基于逻辑回归算法的模型。
3. 根据权利要求1所述的方法,其中基于用户的行为变量来获得预定的预测模型的输入变量包括:
基于用户的多个行为变量中的每个用户行为变量在不同时间段中的取值来获得多个所述输入变量。
4. 根据权利要求3所述的方法,其中基于用户的多个行为变量中的每个用户行为变量在不同时间段中的取值来获得多个所述输入变量包括:
通过用户的所述多个行为变量中的每个用户行为变量在不同时间段中的取值、这些取值之间的差值、这些取值之间的比值、这些取值的平均值、以及这些取值的方差值中的至少一项,来获得多个所述输入变量。
5. 根据权利要求1所述的方法,其中用户的所述行为变量包括:接单次数和在线时长。
6. 根据权利要求1所述的方法,其中将判断用户是否将会流失的变量确定为所述预测模型的输出变量包括:
将只有两种可能取值的变量作为所述输出变量,所述两种可能取值分别对应于用户将会流失和用户将不会流失。
7. 根据权利要求1所述的方法,进一步包括:
基于对输入变量和输出变量所进行的相关性分析或数据分布分析,来进一步筛选所述预定的预测模型的输入变量。
8. 根据权利要求1所述的方法,其中将所述输入变量和所述输出变量作为历史数据,对预测模型进行训练包括:
将所述输入变量输入所述预测模型,计算得出所述输出变量的取值;
将计算得出所述输出变量的取值与所述输出变量的已知值相比较而得到误差;
根据所述误差来调整所述预测模型;以及
迭代进行所述计算、所述比较和所述调整,直到所述误差为零或者迭代次数达到预定最大次数。
9. 根据权利要求8所述的方法,其中在所述预测模型是基于神经网络算法的模型时,根据所述误差来调整所述预测模型包括:
根据所述误差来调整所述基于神经网络算法的模型的输入变量的数量、隐层的数量、隐层神经元的数量、隐层的传递函数、以及输出层的传递函数中的至少一项。
10. 根据权利要求1所述的方法,其中使用以下各项中至少一项作为评价指标来评价所述预测模型的预测结果:准确率、覆盖率、在所有实际为流失的样本中被正确判断为流失之比率、以及在所有实际为流失的样本中被错误判断为流失之比率。
11. 根据权利要求1所述的方法,其中使用ROC空间的方法来评价所述预测模型的预测结果。
12. 一种预测叫车平台的用户流失的装置,包括:
输入变量确定单元,被配置为基于用户的行为变量在不同时间段 中的取值来获得预定的预测模型的输入变量;
输出变量确定单元,被配置为将判断用户是否将会流失的变量确定为所述预测模型的输出变量;
训练单元,被配置为将所述输入变量和所述输出变量作为历史数据,对所述预测模型进行训练;
评价单元,被配置为通过选择评价指标来评价所述预测模型;
其中所述装置通过以下至少一项来获得优化的预测模型:基于对所述预测模型的评价来优化所述预测模型,或者从多个经训练的预测模型中选出最优的预测模型;
预测单元,被配置为基于所述优化的预测模型,来预测用户是否将会流失。
13. 根据权利要求12所述的装置,其中所述预定的预测模型包括:基于神经网络算法的模型、基于决策树的模型、或者基于逻辑回归算法的模型。
14. 根据权利要求12所述的装置,其中所述输入变量确定单元进一步被配置为:
基于用户的多个行为变量中的每个用户行为变量在不同时间段中的取值来获得多个所述输入变量。
15. 根据权利要求14所述的装置,其中所述输入变量确定单元进一步被配置为:
通过用户的所述多个行为变量中的每个用户行为变量在不同时间段中的取值、这些取值之间的差值、这些取值之间的比值、这些取值的平均值、以及这些取值的方差值中的至少一项,来获得多个所述输入变量。
16. 根据权利要求12所述的装置,其中用户的所述行为变量包括:接单次数和在线时长。
17. 根据权利要求12所述的装置,其中所述输出变量确定单元进一步被配置为:
将只有两种可能取值的变量作为所述输出变量,所述两种可能取 值分别对应于用户将会流失和用户将不会流失。
18. 根据权利要求12所述的装置,其中所述输入变量确定单元进一步被配置为:
基于对输入变量和输出变量所进行的相关性分析或数据分布分析,来进一步筛选所述预定的预测模型的输入变量。
19. 根据权利要求12所述的装置,其中所述训练单元进一步被配置为:
将所述输入变量输入所述预测模型,计算得出所述输出变量的取值;
将计算得出所述输出变量的取值与所述输出变量的已知值相比较而得到误差;
根据所述误差来调整所述预测模型;以及
迭代进行所述计算、所述比较和所述调整,直到所述误差为零或者迭代次数达到预定最大次数。
20. 根据权利要求12所述的装置,其中在所述预测模型是基于神经网络算法的模型时,所述训练单元进一步被配置为:
根据所述误差来调整所述基于神经网络算法的模型的输入变量的数量、隐层的数量、隐层神经元的数量、隐层的传递函数、以及输出层的传递函数中的至少一项。
21. 根据权利要求12所述的装置,其中使用以下各项中至少一项作为评价指标来评价所述预测模型的预测结果:准确率、覆盖率、在所有实际为流失的样本中被正确判断为流失之比率、以及在所有实际为流失的样本中被错误判断为流失之比率。
22. 根据权利要求12所述的装置,其中使用ROC空间的方法来评价所述预测模型的预测结果。”
驳回理由具体为:(1)独立权利要求1与对比文件1的区别为:1)预测的对象是叫车平台;2)变量的取值在不同的时间段;3)通过选择评价指标来评价所述预测模型,并通过以下至少一项来获得优化的预测模型;基于对所述预测模型的评价来优化所述预测模型,或者从多个经训练的预测模型中选出最优的预测模型。基于该区别,权利要求1实际要解决的技术问题为:针对何种对象进行预测,以及在何种时间选取预测模型进行预测,以及具体选择何种模型。上述区别为本领域的公知常识。可见,在对比文件1的基础上结合本领域的公知常识得到权利要求1请求保护的技术方案,对本领域技术人员而言是显而易见的。因此,权利要求1不具备专利法第22条第3款规定的创造性。(2)从属权利要求2-11直接或间接引用权利要求1,其限定部分或被对比文件1公开,或为本领域的公知常识。因此,权利要求2-11也不具备专利法第22条第3款规定的创造性。(3)权利要求12-22是与权利要求1-11对应的产品权利要求。因此,在权利要求1-11不具备创造性的情况下,权利要求12-22也不具备专利法第22条第3款规定的创造性。
申请人(下称复审请求人)对上述驳回决定不服,于2018年09月14日向国家知识产权局提出了复审请求,同时修改了权利要求书。复审请求人将原权利要求7的限定部分并入原权利要求1,将原权利要求18的限定部分并入原权利要求12,将原权利要求1、8-9、12、19-20中的特征“所述输入变量”修改为“经筛选的输入变量”,并认为:对比文件1仅公开了将获取所述当前仍未流失的客户的所述多个参数各自的变化率和将参数的变化作为预测模型的变量,但未公开确定输入预测模型的数据是否合适,也未公开基于对输入变量和输出变量所进行的相关性分析或数据分布分析来进一步筛选所述预测模型的输入变量。另外,对比文件1仅启示了基于建立的客户流失型来计算未流失的客户的流失概率,并没有启示基于对预侧模型的评价来优化所述预测模型,或者从多个经训练的预测模型中选出最优的预测模型。权利要求1要求保护的技术方案是对对比文件1公开的技术方案的进一步改进,且对指定的预测模型实现了进一步优化。复审请求时新修改的权利要求书如下:
“1. 一种预测叫车平台的用户流失的方法,包括:
基于用户的行为变量在不同时间段中的取值来获得预定的预测模型的输入变量;
将判断用户是否将会流失的变量确定为所述预测模型的输出变量;
基于对所述输入变量和所述输出变量所进行的相关性分析或数据分布分析,来进一步筛选所述预测模型的输入变量;
将经筛选的所述输入变量和所述输出变量作为历史数据,对所述预测模型进行训练;以及
通过选择评价指标来评价所述预测模型,并通过以下至少一项来获得优化的预测模型:基于对所述预测模型的评价来优化所述预测模型,或者从多个经训练的预测模型中选出最优的预测模型;
基于所述优化的预测模型,来预测用户是否将会流失。
2. 根据权利要求1所述的方法,其中所述预定的预测模型包括:
基于神经网络算法的模型、基于决策树的模型、或者基于逻辑回归算法的模型。
3. 根据权利要求1所述的方法,其中基于用户的行为变量来获得预定的预测模型的输入变量包括:
基于用户的多个行为变量中的每个用户行为变量在不同时间段中的取值来获得多个所述输入变量。
4. 根据权利要求3所述的方法,其中基于用户的多个行为变量中的每个用户行为变量在不同时间段中的取值来获得多个所述输入变量包括:
通过用户的所述多个行为变量中的每个用户行为变量在不同时间段中的取值、这些取值之间的差值、这些取值之间的比值、这些取值的平均值、以及这些取值的方差值中的至少一项,来获得多个所述输入变量。
5. 根据权利要求1所述的方法,其中用户的所述行为变量包括:接单次数和在线时长。
6. 根据权利要求1所述的方法,其中将判断用户是否将会流失的变量确定为所述预测模型的输出变量包括:
将只有两种可能取值的变量作为所述输出变量,所述两种可能取值分别对应于用户将会流失和用户将不会流失。
7. 根据权利要求1所述的方法,其中将经筛选的所述输入变量和所述输出变量作为历史数据,对预测模型进行训练包括:
将经筛选的所述输入变量输入所述预测模型,计算得出所述输出变量的取值;
将计算得出所述输出变量的取值与所述输出变量的已知值相比较而得到误差;
根据所述误差来调整所述预测模型;以及
迭代进行所述计算、所述比较和所述调整,直到所述误差为零或者迭代次数达到预定最大次数。
8. 根据权利要求7所述的方法,其中在所述预测模型是基于神经网络算法的模型时,根据所述误差来调整所述预测模型包括:
根据所述误差来调整所述基于神经网络算法的模型的经筛选的输入变量的数量、隐层的数量、隐层神经元的数量、隐层的传递函数、以及输出层的传递函数中的至少一项。
9. 根据权利要求1所述的方法,其中使用以下各项中至少一项作为评价指标来评价所述预测模型的预测结果:准确率、覆盖率、在所有实际为流失的样本中被正确判断为流失之比率、以及在所有实际为流失的样本中被错误判断为流失之比率。
10. 根据权利要求1所述的方法,其中使用ROC空间的方法来评价所述预测模型的预测结果。
11. 一种预测叫车平台的用户流失的装置,包括:
输入变量确定单元,被配置为基于用户的行为变量在不同时间段中的取值来获得预定的预测模型的输入变量;
输出变量确定单元,被配置为将判断用户是否将会流失的变量确定为所述预测模型的输出变量;
其中所述输入变量确定单元进一步被配置为:基于对所述输入变量和所述输出变量所进行的相关性分析或数据分布分析,来进一步筛选所述预定的预测模型的输入变量;
训练单元,被配置为将经筛选的所述输入变量和所述输出变量作为历史数据,对所述预测模型进行训练;
评价单元,被配置为通过选择评价指标来评价所述预测模型;
其中所述装置通过以下至少一项来获得优化的预测模型:基于对所述预测模型的评价来优化所述预测模型,或者从多个经训练的预测模型中选出最优的预测模型;
预测单元,被配置为基于所述优化的预测模型,来预测用户是否将会流失。
12. 根据权利要求11所述的装置,其中所述预定的预测模型包括:基于神经网络算法的模型、基于决策树的模型、或者基于逻辑回归算法的模型。
13. 根据权利要求11所述的装置,其中所述输入变量确定单元进一步被配置为:
基于用户的多个行为变量中的每个用户行为变量在不同时间段中的取值来获得多个所述输入变量。
14. 根据权利要求13所述的装置,其中所述输入变量确定单元进一步被配置为:
通过用户的所述多个行为变量中的每个用户行为变量在不同时间段中的取值、这些取值之间的差值、这些取值之间的比值、这些取值的平均值、以及这些取值的方差值中的至少一项,来获得多个所述输入变量。
15. 根据权利要求11所述的装置,其中用户的所述行为变量包括:接单次数和在线时长。
16. 根据权利要求11所述的装置,其中所述输出变量确定单元 进一步被配置为:
将只有两种可能取值的变量作为所述输出变量,所述两种可能取值分别对应于用户将会流失和用户将不会流失。
17. 根据权利要求11所述的装置,其中所述训练单元进一步被配置为:
将经筛选的所述输入变量输入所述预测模型,计算得出所述输出变量的取值;
将计算得出所述输出变量的取值与所述输出变量的已知值相比较而得到误差;
根据所述误差来调整所述预测模型;以及
迭代进行所述计算、所述比较和所述调整,直到所述误差为零或者迭代次数达到预定最大次数。
18. 根据权利要求11所述的装置,其中在所述预测模型是基于神经网络算法的模型时,所述训练单元进一步被配置为:
根据所述误差来调整所述基于神经网络算法的模型的经筛选的输入变量的数量、隐层的数量、隐层神经元的数量、隐层的传递函数、以及输出层的传递函数中的至少一项。
19. 根据权利要求11所述的装置,其中使用以下各项中至少一项作为评价指标来评价所述预测模型的预测结果:准确率、覆盖率、在所有实际为流失的样本中被正确判断为流失之比率、以及在所有实际为流失的样本中被错误判断为流失之比率。
20. 根据权利要求11所述的装置,其中使用ROC空间的方法来评价所述预测模型的预测结果。”
经形式审查合格,国家知识产权局于2018年09月20日依法受理了该复审请求,并将其转送至原审查部门进行前置审查。
原审查部门在前置审查意见书中认为:(1)本申请说明书[0038]段记载了以下内容:“方法100还可以基于对输入变量和输出变量所进行的相关性分析或数据分布分析,来进一步筛选预定的预测模型的输入变量。例如,可以首选对输入变量、输出变量进行相关性、数据分布等基础分析,意在剔除输入参数之间相关性大的、输入变量与输出变量相关性较小的、数据分布趋于集中的等,并进行不规则数据的清洗”,即本申请独立权利要求中增加的特征是数据清洗的过程,而在数据挖掘领域,对数据进行预处理和相应的数据清洗是本领域的惯用技术,比如书籍《电子商务基础与实务[M]》(苏艳玲主编,2012年12月31日)公开了:知识挖掘的主要步骤如下:数据清洗,清除噪声数据、不一致的数据和与挖掘主题明显无关的数据;数据集成,将来自多数据源中的相关数据整合到一起,形成一致的、完整的数据描述。(2)对比文件1公开客户流失预测模型可以包括各种基于不同预测技术(例如,贝叶斯网络技术、朴素贝叶斯分类器技术、决策树技术等),在本领域中,本领域技术人员可以根据需要选择和定义相应的模型,而具体选择何种模型是通过不同种模型的比较中进行选择的,这种选择最优过程就是本领域的惯用手段。因此,坚持原驳回决定。
随后,国家知识产权局成立合议组对本案进行审理。
合议组于2019年08月26日向复审请求人发出复审通知书,指出:(1)权利要求1与对比文件1的区别为:1)该权利要求中的用户为叫车平台的用户;2)基于对所述输入变量和所述输出变量所进行的相关性分析或数据分布分析,来进一步筛选所述预测模型的输入变量;将经筛选的所述输入变量作为历史数据;通过选择评价指标来评价所述预测模型,并通过以下至少一项来获得优化的预测模型:基于对所述预测模型的评价来优化所述预测模型,或者从多个经训练的预测模型中选出最优的预测模型;基于所述优化的预测模型,来预测用户是否将会流失。基于上述区别特征,该权利要求相对于对比文件1实际要解决的问题是:1)确定预测的对象;2)如何训练及优化预测模型。上述区别为本领域的惯用手段。可见,在对比文件1的基础上结合本领域的惯用手段得到该权利要求请求保护的解决方案,对本领域技术人员而言是显而易见的。因此,权利要求1不符合专利法第22条第3款有关创造性的规定。(2)直接或间接引用权利要求1的从属权利要求2-10的限定部分或被对比文件1公开,或属于本领域的惯用手段。因此,在其引用的权利要求不具备创造性的情况下,权利要求2-10也不符合专利法第22条第3款有关创造性的规定。(3)权利要求11-20是与方法权利要求1-10一一对应的产品权利要求。因此,基于与权利要求1-20相同的理由,权利要求11-20也不符合专利法第22条第3款有关创造性的规定。
针对复审请求人提出的复审理由,合议组进一步指出:建立模型时,通过相关性分析或数据分布分析对数据进行预处理,使预处理后的数据的质量符合建模标准,这是本领域的惯用手段。另外,对比文件1公开了客户流失预测模型可以包括各种基于不同预测技术(例如,贝叶斯网络技术、朴素贝叶斯分类器技术、决策树技术等);本领域技术人员可以由对比文件1公开的上述内容得到启示,能够根据需要选择及定义与不同预测技术相对应的预测模型,并通过评价、比较等手段来优化所述预测模型,从而提高预测的精确度,这是本领域的惯用手段。
复审请求人于2019年10 月10日提交了意见陈述书和修改的权利要求书。复审请求人给原独立权利要求1、11中增加特征“所述筛选包括剔除所述输入变量之间相关性大的、所述输入变量与所述输出变量相关性较小的、数据分布趋于集中的输入变量”,并认为:对比文件1仅公开预测模型学习服务器计算移动客户Ti的多个参数K各自的变化率作为训练数据、并使用多个参数K各自的变化作为客户流失预测模型的变量,未启示在采样多个参数各自的变化率作为变量时还要对各个参数各自的变化率进行筛选。由于对比文件1未记载对移动客户的多个参数各自的变化率和输出变量进行相关性分析和对输入变量和输出变量进行分布分析,若不依赖于不允许的后见之明,本领域技术人员不会想到“基于对所述输入变量和所述输出变量所进行的相关性分析或数据分布分析来筛选所述预测模型的输入变量”;对比文件1未公开、教导和启示输入变量之间的相关性关系、输入变量与输出变量之间的相关性关系以及输入变量的数据分布,本领域技术人员不会想到“所述筛选包括剔除所述输入变量之间相关性大的、所述输入变量与所述输出变量相关性较小的、数据分布趋于集中的输入变量”。对比文件1仅启示预测模型学习服务器130将多个参数各自的变化率作为输入参数来使用不同的预测技术建立不同的客户流失预测模型,从多个预测模型中选取一个流失预测模型来进行预测,未启示通过选择评价指标来对不同的客户流失预测模型进行评价和基于评价来优化客户流失预测模型、所选择的客户流失模型是经过评价指标评价过的且进行了优化。若不依赖于不允许的后见之明,本领域技术人员不会想到通过选择评价指标来评价所述预测模型,且基于评价来优化预测模型或从多个经训练的预测模型中选出最优预测模型。本申请的权利要求1可实现有益的技术效果:在预测用户是否会流失时,能够提前一定时间给出流失用户清单,并保证高准确率、高覆盖率,降低维系难度;缩小目标客户群,降低维系活动成本。
复审请求人提交的新修改的权利要求书如下:
“1. 一种预测叫车平台的用户流失的方法,包括:
基于用户的行为变量在不同时间段中的取值来获得预定的预测模型的输入变量;
将判断用户是否将会流失的变量确定为所述预测模型的输出变量;
基于对所述输入变量和所述输出变量所进行的相关性分析或数据分布分析,来进一步筛选所述预测模型的输入变量,其中所述筛选包括剔除所述输入变量之间相关性大的、所述输入变量与所述输出变量相关性较小的、数据分布趋于集中的输入变量;
将经筛选的所述输入变量和所述输出变量作为历史数据,对所述预测模型进行训练;以及
通过选择评价指标来评价所述预测模型,并通过以下至少一项来获得优化的预测模型:基于对所述预测模型的评价来优化所述预测模型,或者从多个经训练的预测模型中选出最优的预测模型;
基于所述优化的预测模型,来预测用户是否将会流失。
2. 根据权利要求1所述的方法,其中所述预定的预测模型包括:
基于神经网络算法的模型、基于决策树的模型、或者基于逻辑回归算法的模型。
3. 根据权利要求1所述的方法,其中基于用户的行为变量来获得预定的预测模型的输入变量包括:
基于用户的多个行为变量中的每个用户行为变量在不同时间段中的取值来获得多个所述输入变量。
4. 根据权利要求3所述的方法,其中基于用户的多个行为变量中的每个用户行为变量在不同时间段中的取值来获得多个所述输入变量包括:
通过用户的所述多个行为变量中的每个用户行为变量在不同时间段中的取值、这些取值之间的差值、这些取值之间的比值、这些取 值的平均值、以及这些取值的方差值中的至少一项,来获得多个所述输入变量。
5. 根据权利要求1所述的方法,其中用户的所述行为变量包括:接单次数和在线时长。
6. 根据权利要求1所述的方法,其中将判断用户是否将会流失的变量确定为所述预测模型的输出变量包括:
将只有两种可能取值的变量作为所述输出变量,所述两种可能取值分别对应于用户将会流失和用户将不会流失。
7. 根据权利要求1所述的方法,其中将经筛选的所述输入变量和所述输出变量作为历史数据,对预测模型进行训练包括:
将经筛选的所述输入变量输入所述预测模型,计算得出所述输出变量的取值;
将计算得出所述输出变量的取值与所述输出变量的已知值相比较而得到误差;
根据所述误差来调整所述预测模型;以及
迭代进行所述计算、所述比较和所述调整,直到所述误差为零或者迭代次数达到预定最大次数。
8. 根据权利要求7所述的方法,其中在所述预测模型是基于神经网络算法的模型时,根据所述误差来调整所述预测模型包括:
根据所述误差来调整所述基于神经网络算法的模型的经筛选的输入变量的数量、隐层的数量、隐层神经元的数量、隐层的传递函数、以及输出层的传递函数中的至少一项。
9. 根据权利要求1所述的方法,其中使用以下各项中至少一项作为评价指标来评价所述预测模型的预测结果:准确率、覆盖率、在所有实际为流失的样本中被正确判断为流失之比率、以及在所有实际为流失的样本中被错误判断为流失之比率。
10. 根据权利要求1所述的方法,其中使用ROC空间的方法来评价所述预测模型的预测结果。
11. 一种预测叫车平台的用户流失的装置,包括:
输入变量确定单元,被配置为基于用户的行为变量在不同时间段中的取值来获得预定的预测模型的输入变量;
输出变量确定单元,被配置为将判断用户是否将会流失的变量确定为所述预测模型的输出变量;
其中所述输入变量确定单元进一步被配置为:基于对所述输入变量和所述输出变量所进行的相关性分析或数据分布分析,来进一步筛选所述预定的预测模型的输入变量,其中所述筛选包括剔除所述输入变量之间相关性大的、所述输入变量与所述输出变量相关性较小的、数据分布趋于集中的输入变量;
训练单元,被配置为将经筛选的所述输入变量和所述输出变量作为历史数据,对所述预测模型进行训练;
评价单元,被配置为通过选择评价指标来评价所述预测模型;
其中所述装置通过以下至少一项来获得优化的预测模型:基于对所述预测模型的评价来优化所述预测模型,或者从多个经训练的预测模型中选出最优的预测模型;
预测单元,被配置为基于所述优化的预测模型,来预测用户是否将会流失。
12. 根据权利要求11所述的装置,其中所述预定的预测模型包括:基于神经网络算法的模型、基于决策树的模型、或者基于逻辑回归算法的模型。
13. 根据权利要求11所述的装置,其中所述输入变量确定单元进一步被配置为:
基于用户的多个行为变量中的每个用户行为变量在不同时间段中的取值来获得多个所述输入变量。
14. 根据权利要求13所述的装置,其中所述输入变量确定单元进一步被配置为:
通过用户的所述多个行为变量中的每个用户行为变量在不同时间段中的取值、这些取值之间的差值、这些取值之间的比值、这些取值的平均值、以及这些取值的方差值中的至少一项,来获得多个所述输入变量。
15. 根据权利要求11所述的装置,其中用户的所述行为变量包括:接单次数和在线时长。
16. 根据权利要求11所述的装置,其中所述输出变量确定单元进一步被配置为:
将只有两种可能取值的变量作为所述输出变量,所述两种可能取值分别对应于用户将会流失和用户将不会流失。
17. 根据权利要求11所述的装置,其中所述训练单元进一步被配置为:
将经筛选的所述输入变量输入所述预测模型,计算得出所述输出变量的取值;
将计算得出所述输出变量的取值与所述输出变量的已知值相比较而得到误差;
根据所述误差来调整所述预测模型;以及
迭代进行所述计算、所述比较和所述调整,直到所述误差为零或者迭代次数达到预定最大次数。
18. 根据权利要求11所述的装置,其中在所述预测模型是基于神经网络算法的模型时,所述训练单元进一步被配置为:
根据所述误差来调整所述基于神经网络算法的模型的经筛选的输入变量的数量、隐层的数量、隐层神经元的数量、隐层的传递函数、以及输出层的传递函数中的至少一项。
19. 根据权利要求11所述的装置,其中使用以下各项中至少一项作为评价指标来评价所述预测模型的预测结果:准确率、覆盖率、在所有实际为流失的样本中被正确判断为流失之比率、以及在所有实际为流失的样本中被错误判断为流失之比率。
20. 根据权利要求11所述的装置,其中使用ROC空间的方法来评价所述预测模型的预测结果。”
在上述程序的基础上,合议组认为本案事实已经清楚,可以作出审查决定。
二、决定的理由
审查文本的认定
复审请求人答复复审通知书时提交了修改的权利要求书。经审查,复审请求人对权利要求书的修改符合专利法第33条和专利法实施细则第61条第1款的规定。因此,本复审决定所针对的文本为:复审请求人于2019年10月10日提交的权利要求第1-20项,申请日2014年12月09日提交的说明书第1-88段、说明书附图图1-7、说明书摘要、摘要附图。
具体理由的阐述
专利法第22条第3款规定:创造性,是指与现有技术相比,该发明具有突出的实质性特点和显著的进步,该实用新型具有实质性特点和进步。
如果一项权利要求请求保护的技术方案相对于最接近的现有技术存在区别技术特征,且现有技术中给出了将上述区别技术特征应用到该最接近的现有技术以解决其存在的技术问题的启示,这种启示会使本领域技术人员在面对所述技术问题时,有动机改进该最接近的现有技术并获得该权利要求请求保护的技术方案,则该权利要求请求保护的技术方案不具有突出的实质性特点和显著的进步,不具备创造性。
本复审决定所引用的对比文件与驳回决定及复审通知书所引用的对比文件相同,即:
对比文件1:CN103854065 A,公开日为2014年06月11日。
权利要求1-20不具备专利法第22条第3款规定的创造性。
1)独立权利要求1请求保护一种预测叫车平台的用户流失的方法。对比文件1公开了一种预测客户流失的方法,并具体公开了以下内容(说明书第[0053]-[0060]、 [0078]段):在步骤S304,在接收到用户终端150发送的客户流失预测请求之后,预测服务器140根据数据预处理服务器120所提取的与移动客户的行为有关的数据,计算每一个当前仍未流失的移动客户Yi的反映其行为的多个参数K各自在当前月份的上一月份内的取值;在步骤S308,预测服务器140利用所计算的移动客户Yi的该多个参数K各自在上一月份内的取值和移动客户Yi的该多个参数K各自的均值(相当于权利要求1的“基于用户的行为变量在不同时间段中的取值来获得预定的预测模型的输入变量”),计算移动客户Yi的该多个参数K各自的变化率;在步骤S312中,预测服务器140从预测模型学习服务器130所建立的各种客户流失预测模型中,选取其预测技术和预测时长与所述接收的客户流失预测请求所包括的预测技术相同的客户流失预测模型,其中所述预测技术包括贝叶斯网络、朴素贝叶斯分类器和/或决策树(隐含公开权利要求1的“将所述输入变量和所述输出变量作为历史数据,对所述预测模型进行训练”);在步骤S316,预测服务器140利用所计算机的移动客户Yi的该多个参数K各自的变化率,使用所选取的客户流失预测模型来计算移动客户Yi的流失概率(相当于权利要求1的“将判断用户是否将会流失的变量确定为所述预测模型的输出变量”);在步骤S320,预测服务器140根据所计算的移动客户Yi的流失概率,确定其流失概率大于指定值的移动客户,作为可能会流失的移动客户(相当于权利要求1的“基于所述预测模型,来预测用户是否将会流失”)。
该权利要求与对比文件1相比,区别在于:(1)该权利要求中的用户为叫车平台的用户;(2)基于对所述输入变量和所述输出变量所进行的相关性分析或数据分布分析,来进一步筛选所述预测模型的输入变量,其中所述筛选包括剔除所述输入变量之间相关性大的、所述输入变量与所述输出变量相关性较小的、数据分布趋于集中的输入变量;将经筛选的所述输入变量作为历史数据;通过选择评价指标来评价所述预测模型,并通过以下至少一项来获得优化的预测模型:基于对所述预测模型的评价来优化所述预测模型,或者从多个经训练的预测模型中选出最优的预测模型;基于所述优化的预测模型,来预测用户是否将会流失。基于上述区别,该权利要求相对于对比文件1实际要解决的问题是:(1)确定预测的对象;(2)如何训练及优化预测模型。
关于上述区别(1),每个计算机应用都面临用户可能流失的问题,因而将对比文件1公开的预测移动客户流失的方案应用于叫车平台,这是本领域的常规选择。
关于上述区别(2),利用相关性分析或数据分布分析等手段对数据进行预处理,例如剔除输入变量之间相关性大的、输入变量与输出变量相关性较小的、数据分布趋于集中的输入变量,以筛选出达到符合建模标准的输入数据,这是本领域的惯用手段;另外,对比文件1公开了所建立的客户流失预测模型可以包括各种基于不同预测技术(例如,贝叶斯网络技术、朴素贝叶斯分类器技术、决策树技术等)的模型,本领域技术人员由此可以得到启示,能够通过评价预测模型或从基于不同预测技术建立的预测模型中选出最优的模型、对预测模型进行优化,从而提高预测用户流失的准确性,这是本领域的惯用手段。
可见,在对比文件1的基础上结合本领域的惯用手段得到该权利要求请求保护的解决方案,对本领域技术人员而言是显而易见的。因此,独立权利要求1不具有突出的实质性特点和显著的进步,不符合专利法第22条第3款有关创造性的规定。
2)从属权利要求2对权利要求1作了进一步限定,其附加特征“基于决策树的模型”被对比文件1公开(说明书第[0038]段):所建立的客户流失预测模型可以包括各种基于不同预测技术(例如,贝叶斯网络技术、朴素贝叶斯分类器技术、决策树技术等)的模型。此外,基于神经网络算法的模型、或者基于逻辑回归算法的模型都是常用的预测模型,这是本领域的公知常识。
因此,在其引用的权利要求不具备创造性时,从属权利要求2也不具有突出的实质性特点和显著的进步,不符合专利法第22条第3款有关创造性的规定。
3)从属权利要求3对权利要求1作了进一步限定,从属权利要求4对权利要求3作了进一步限定。对比文件1公开了以下内容(说明书第[0046]段):预测模型学习服务器130可以利用所计算的移动客户Ti的多个参数K各自在指定月份的取值和移动客户Ti的多个参数K各自的均值(相当于权利要求3的“基于用户的行为变量来获得预定的预测模型的输入变量包括:基于用户的多个行为变量中的每个用户行为变量在不同时间段中的取值来获得多个所述输入变量”、权利要求4的“基于用户的多个行为变量中的每个用户行为变量在不同时间段中的取值来获得多个所述输入变量包括:通过用户的所述多个行为变量中的每个用户行为变量在不同时间段中的取值、这些取值的平均值中的至少一项,来获得多个所述输入变量”),计算移动客户Ti的多个参数K各自的变化率作为训练数据。
至于权利要求4的限定部分“基于用户的多个行为变量中的每个用户行为变量在不同时间段中的取值来获得多个所述输入变量包括:通过用户的所述多个行为变量中的每个用户行为变量在不同时间段中的取值之间的差值、这些取值之间的比值、这些取值的方差值中的至少一项,来获得多个所述输入变量”,本领域技术人员可以由对比文件1公开的上述内容得到启示,能够根据所预测的对象的特性,选择差值、比值或方差值的至少一项来训练预测模型,这是本领域的惯用手段。
因此,在其引用的权利要求不具备创造性时,从属权利要求3-4也不具有突出的实质性特点和显著的进步,不符合专利法第22条第3款有关创造性的规定。
4)从属权利要求5对权利要求1作了进一步限定。根据所预测的对象的特性,选择接单次数和在线时长作为行为变量,这是本领域的惯用手段。
因此,在其引用的权利要求不具备创造性时,从属权利要求5也不具有突出的实质性特点和显著的进步,不符合专利法第22条第3款有关创造性的规定。
5)从属权利要求6对权利要求1作了进一步限定。对比文件1公开了以下内容(说明书第[0058]段):在步骤S320,预测服务器140根据所计算机的移动客户Yi的流失概率,确定其流失概率大于指定值的移动客户,作为可能会流失的移动客户。本领域技术人员可以由对比文件1公开的上述内容得到启示,能够将用户将会流失和用户将不会流失作为预测模型的输出变量,这是本领域的惯用手段。
因此,在其引用的权利要求不具备创造性时,从属权利要求6也不具有突出的实质性特点和显著的进步,不符合专利法第22条第3款有关创造性的规定。
6)从属权利要求7对权利要求1作了进一步限定,从属权利要求8对权利要求7作了进一步限定。对比文件1公开了以下内容(说明书第[0038]段):所建立的客户流失预测模型可以包括各种基于不同预测技术(例如,贝叶斯网络技术、朴素贝叶斯分类器技术、决策树技术等)的模型。本领域技术人员由此可以得到启示,能够通过迭代进行计算、比较和误差调整(包含调整输入变量数量、隐层数量等)来训练预测模型,这是本领域的惯用手段。
因此,在其引用的权利要求不具备创造性时,从属权利要求7-8也不具有突出的实质性特点和显著的进步,不符合专利法第22条第3款有关创造性的规定。
7)从属权利要求9-10分别对权利要求1作了进一步限定。根据所预测的对象的特性,使用ROC空间的方法及准确率、覆盖率等指标来评价预测模型的预测结果是否令人满意,这是本领域的惯用手段。
因此,在其引用的权利要求不具备创造性时,从属权利要求9-10也不具有突出的实质性特点和显著的进步,不符合专利法第22条第3款有关创造性的规定。
8)权利要求11-20请求保护一种预测叫车平台的用户流失的装置,其是与方法权利要求1-10一一对应的产品权利要求。因此,基于与评述权利要求1-10相同的理由,权利要求11-20也不符合专利法第22条第3款有关创造性的规定
对复审请求人相关意见的评述
关于复审请求人答复复审通知书时所做的意见陈述(参见本复审决定的案由部分),合议组认为:在数据挖掘领域,建立模型时利用相关性分析或数据分布分析对数据进行预处理和相应的数据清洗(例如,剔除输入变量之间相关性大的、输入变量与输出变量相关性较小的、数据分布趋于集中的输入变量),从而有利于模型的训练,这是本领域的惯用手段。另外,对比文件1已经公开了客户流失预测模型可以使用各种不同的预测技术(例如,贝叶斯网络技术、朴素贝叶斯分类器技术、决策树技术等),本领域技术人员可以由对比文件1公开的上述内容得到启示,有动机根据实际需求来选择、定义所期望的预测模型,并通过评价、比较等手段来优化所述预测模型,从而提高预测的精确度,这是本领域的惯用手段。
三、决定
维持国家知识产权局于2018年06月05日对本申请作出的驳回决定。
如对本复审决定不服,根据专利法第41条第2款的规定,复审请求人可自收到本复审决定之日起三个月内向北京知识产权法院起诉。
郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如作者信息标记有误,请第一时间联系我们修改或删除,多谢。