用于机器学习的资源分配-复审决定


发明创造名称:用于机器学习的资源分配
外观设计名称:
决定号:193925
决定日:2019-11-01
委内编号:1F268891
优先权日:2012-12-14
申请(专利)号:201380064897.8
申请日:2013-12-14
复审请求人:微软技术许可有限责任公司
无效请求人:
授权公告日:
审定公告日:
专利权人:
主审员:王艳坤
合议组组长:李燕东
参审员:史江峰
国际分类号:G06N7/00
外观设计分类号:
法律依据:专利法第22条第3款
决定要点:如果一项权利要求所要求保护的技术方案相对于最接近的现有技术存在区别技术特征,由于该区别技术特征属于本领域的公知常识,即现有技术中给出了将上述区别技术特征应用到该最接近的现有技术以解决其存在的技术问题的启示,这种启示会使本领域的技术人员在面对所述技术问题时,有动机改进该最接近的现有技术并获得要求保护的发明,且也未产生任何意料不到的技术效果,则该项权利要求所要求保护的技术方案不具备突出的实质性特点和显著的进步,不具备创造性。
全文:
本复审请求涉及申请号为201380064897.8,名称为“用于机器学习的资源分配”的发明专利申请(下称本申请)。本申请的申请人为微软技术许可有限责任公司,申请日为2013年12月14日,优先权日为2012年12月14日,进入中国国家阶段日为2015年06月11日,公开日为2016年01月06日。
经实质审查,国家知识产权局原审查部门于2018年09月03日发出驳回决定,驳回了本申请,其理由是:权利要求1-11不具备专利法第22条第3款规定的创造性。驳回决定所依据的文本为2015年06月11日进入中国国家阶段提交的国际申请中文译文的说明书第1-136段、说明书附图图1-11、说明书摘要、摘要附图;2018年07月23日提交的权利要求第1-11项。驳回决定所针对的权利要求书如下:
“1. 一种机器学习系统处的方法,包括:
对于多个选项中的每一个,在处理器处接收描述该选项的行为的多个样本,所述样本的数量至少部分地基于根据应用领域或可用计算资源来自动选择的容错度;
对于每一个选项,使用所述样本通过采用柱计数的直方图来计算分数,所述分数包括有界差分统计数据;
对于每一个选项,使用所述样本来计算所述分数的置信区间,包括计算该选项的分数加上或减去一常量与所述分数的所估计的方差乘以二与所述容错度的商的对数的平方根的乘积;
在所述置信区间和所述分数的基础上选择所述选项中的一个或多个。
2. 如权利要求1所述的方法,其特征在于,所述有界差分统计数据是从所述样本中获取的数值,所述数值描述所述选项的行为;并且所述数值在所述样本中的任一个被省略或改变时稍微改变。
3. 如前述任一权利要求所述的方法,其特征在于,所述分数选自信息增益、基尼增益、方差、熵中的任一个或多个。
4. 如前述任一权利要求所述的方法,其特征在于,包括设置所述容错度以及在所述置信区间和所述分数的基础上选择一个选项以使得所选选项在所述容错度内具有所有选项中的最佳分数。
5. 如前述任一权利要求所述的方法,其特征在于,计算所述置信区间包括估计所 述选项的分数的方差。
6. 如前述任一权利要求所述的方法,其特征在于,计算所述置信区间包括通过计算jackknife方差估计来估计所述选项的分数的方差。
7. 如前述任一权利要求所述的方法,其特征在于,包括为偏差调整所计算的置信区间。
8. 如前述任一权利要求所述的方法,其特征在于,所述方法至少部分地使用选自以下各项中的任一个或多个的硬件逻辑来执行:现场可编程门阵列、程序专用的集成电路、程序专用的标准产品、片上系统、复杂可编程逻辑器件,图形处理单元。
9. 一种机器学习装置,包括:
打分逻辑,所述打分逻辑被安排成对于多个选项中的每一个,接收描述该选项的行为的多个样本,所述样本的数量至少部分地基于根据应用领域或可用计算资源来自动选择的容错度;
所述打分逻辑被安排成对于每一个选项,使用所述样本通过采用柱计数的直方图来计算分数,所述分数包括有界差分统计数据;
竞速逻辑,所述竞速逻辑被安排成对于每一个选项,使用所述样本来计算所述分数的置信区间,计算所述置信区间包括计算该选项的分数加上或减去一常量与所述分数的所估计的方差乘以二与所述容错度的商的对数的平方根的乘积;
被安排成在所述置信区间和所述分数的基础上选择所述选项中的一个或多个的处理器。
10. 一种具有指令的计算机可读存储介质,所述指令在被执行时使机器执行如权利要求1-8中的任一项所述的方法。
11. 一种包括用于执行如权利要求1-8中的任一项所述的方法的装置的计算机系统。”
驳回决定引用如下对比文件,即
对比文件1:US7937336B1,公告日为2011年05月03日;
对比文件2:US7277574B2,公告日为2007年10月02日;
对比文件3:US2011/0086777A1,公开日为2011年04月14日;
对比文件4:US2006/0088894A1,公开日为2006年04月27日。
驳回决定的主要理由:(1)关于权利要求1,权利要求1与对比文件1相比,区别技术特征在:机器学习系统处的方法,界差分统计数据;计算所述置信区间包括计算该选项的分数加上或减去一常量与所述分数的所估计的方差乘以二与所述容错度的商的对数的平方根的乘积,采用柱计数的直方图计算分数。基于上述区别特征,可以确定本申请实际解决的技术问题为具体何种方法。而在所属技术领域,具体学习方法的确定是所属领域技术人员根据实际需要而自行灵活设置的,因此本领域技术人员容易想到机器学习系统处的方法,界差分统计数据是常用技术手段;且对比文件1公开了置信区间的计算以及计算错误率置信水平,而具体计算方式是所属领域技术人员根据实际需要而自行选择设定的,因此本领域技术人员容易想到:计算所述置信区间包括计算该选项的分数加上或减去一常量与所述分数的所估计的方差乘以二与所述容错度的商的对数的平方根的乘积,采用柱计数的直方图计算分数是常用技术手段;因此,在对比文件1的基础上,结合公知常识得出该权利要求所要求保护的技术方案对本领域的技术人员来说是显而易见的;因此该权利要求不具备突出的实质性特点和显著的进步,不符合专利法第22条第3款有关创造性的规定。(2)关于权利要求2-8,其附加技术特征或被对比文件1-4公开或为本领域的常用技术手段。因此,权利要求2-8也不具备专利法第22条第3款规定的创造性。(3)关于权利要求9,其是与权利要求1相对应的产品权利要求,在权利要求1不具备创造性的情形下,基于相同的理由和证据,权利要求9也不具备专利法第22条第3款规定的创造性。(4)关于权利要求10,权利要求10要求保护一种具有指令的计算机可读存储介质。所述指令在被执行时使机器执行如权利要求1-8中的任一项所述的方法,而在权利要求1-8不具备创造性的情形下,权利要求10也不具备专利法第22条第3款规定的创造性。(5)关于权利要求11,权利要求11要求保护包括用于执行如权利要求1-8中的任一项所述的方法的装置的计算机系统,而在权利要求1-8不具备创造性的情形下,权利要求11也不具备专利法第22条第3款规定的创造性。
申请人(下称复审请求人)对上述驳回决定不服,于2018年12月17日向国家知识产权局提出了复审请求,但未对申请文件进行任何修改。复审请求人认为:权利要求1和9中的通过将该选项的分数加上或减去一常量与所述分数的所估计的方差乘以二与所述容错度的商的对数的平方根的乘积来计算置信区间这一区别技术特征并非是本领域常用技术手段且并非是本领域技术人员容易想到的。
经形式审查合格,国家知识产权局于2018年12月26日依法受理了该复审请求,并将其转送至原审查部门进行前置审查。
原审查部门在前置审查意见书中认为,对比文件1公开了置信区间的计算以及计算错误率置信水平;且对比文件3说明书第0065-0066段公开了:置信区间的具体计算,对比文件3的第0084段12-14行:减少了时间及计算成本,与本申请实现了相同的技术效果;且现有置信区间的计算为:置信区间=[平均值-(标准差*标准分数),平均值 (标准差*标准分数)],可以根据不同的置信水平来确定相应的标准分数取值,例如:《概率论与数理统计》,王学民,第145-148页,陕西科学技术出版社,2011年06月,其公开了置信区间的计算,并具体公开了以下特征(参见第147页):u的置信度为1-a的置信区间为X ±μ_(α/2) σ/√n,其中X 为样本均值,σ为标准差。该教科书公开了根据置信区间的计算,因此根据标准差以及均值计算置信区间是本领域常用的技术手段,属于本领域的公知常识。因此,本申请的设定置信区间实现减少计算时间并降低计算成本不需要付出创造性劳动。因而坚持原驳回决定。
随后,国家知识产权局成立合议组对本案进行审理。
合议组于2019年06月25日向复审请求人发出复审通知书,指出:权利要求1-11不具备专利法第22条第3款规定的创造性。其中复审通知书引用的对比文件与驳回决定中引用的对比文件相同,复审通知书的主要理由:权利要求1与对比文件1的区别技术特征是:通过采用柱计数的直方图计算分数;置信区间的计算包括计算该选项的分数加上或减去一常量与所述分数的所估计的方差乘以二与所述容错度的商的对数的平方根的乘积。基于上述区别特征,可以确定本申请实际解决的技术问题为如何进行统计数据及其准确性参数的计算问题。对于本领域技术人员而言,在对诸如方差、熵等统计数据进行计算的过程,采用柱计数的直方图进行计算,属于本领域的常用技术手段;另外,对于统计数据准确性参数的计算中,采用常数、方差、容错度等因数进行计算也是本领域的常用技术手段。在对比文件1给出计算错误率、置信水平、置信区间等的启示下,本领域技术人员面对本申请要解决的技术问题,结合本领域的常用技术手段,通过合乎逻辑的分析、推理或者有限次试验得到权利要求1的方案对本领域的技术人员来说是显而易见的。因此,权利要求1不具备专利法第22条第3款规定的创造性。权利要求2-8记载的附加技术特征或被对比文件1-4公开或为本领域的常用技术手段。因此,权利要求2-8也不具备专利法第22条第3款规定的创造性。权利要求9要求保护一种机器学习装置,其作为产品权利要求与作为方法权利要求的权利要求1相对应。在权利要求1不具备创造性的情形下,基于相同的理由和证据,权利要求9也不具备专利法第22条第3款规定的创造性。权利要求10要求保护一种具有指令的计算机可读存储介质。具有指令的计算机可读存储介质为本领域的常用技术手段。在权利要求1-8不具备创造性的情形下,权利要求10也不具备专利法第22条第3款规定的创造性。权利要求11要求保护包括用于执行如权利要求1-8中的任一项所述的方法的装置的计算机系统,在权利要求1-8不具备创造性的情形下,权利要求11也不具备专利法第22条第3款规定的创造性。 。
复审请求人于2019年07月25日提交了意见陈述书,同时修改了申请文件,所述修改涉及根据说明书第36-38段的内容,分别在权利要求1和9中加入技术特征“在所述置信区间的基础上选择所述选项中的一个或多个包括: 确定所述多个选项中的得分最高的选项; 将所述得分最高的选项的置信区间与所述多个选项中的一个不同选项的置信区间进行比较;以及当所述得分最高的选项的置信区间与所述不同选项的置信区间不重叠时,排除所述不同选项”。复审请求人认为:上述新增加的技术特征并未被对比文件1-4公开,且并非本领域惯用技术手段或公知常识,使得权利要求1和9具备专利法第22条第3款规定的创造性。
新提交的权利要求1和9为
“1. 一种机器学习系统处的方法,包括:
对于多个选项中的每一个,在处理器处接收描述该选项的行为的多个样本,所述样本的数量至少部分地基于根据应用领域或可用计算资源来自动选择的容错度;
对于每一个选项,使用所述样本通过采用柱计数的直方图来计算分数,所述分数包括有界差分统计数据;
对于每一个选项,使用所述样本来计算所述分数的置信区间,包括计算该选项的分数加上或减去一常量与所述分数的所估计的方差乘以二与所述容错度的商的对数的平方根的乘积;
在所述置信区间和所述分数的基础上选择所述选项中的一个或多个,在所述置信区间的基础上选择所述选项中的一个或多个包括:
确定所述多个选项中的得分最高的选项;
将所述得分最高的选项的置信区间与所述多个选项中的一个不同选项的置信区间进行比较;以及
当所述得分最高的选项的置信区间与所述不同选项的置信区间不重叠时,排除所述不同选项。”
“9. 一种机器学习装置,包括:
打分逻辑,所述打分逻辑被安排成对于多个选项中的每一个,接收描述该选项的行为的多个样本,所述样本的数量至少部分地基于根据应用领域或可用计算资源来自动选择的容错度;
所述打分逻辑被安排成对于每一个选项,使用所述样本通过采用柱计数的直方图来计算分数,所述分数包括有界差分统计数据;
竞速逻辑,所述竞速逻辑被安排成对于每一个选项,使用所述样本来计算所述分数的置信区间,计算所述置信区间包括计算该选项的分数加上或减去一常量与所述分数的所估计的方差乘以二与所述容错度的商的对数的平方根的乘积;
被安排成在所述置信区间和所述分数的基础上选择所述选项中的一个或多个的处理器,在所述置信区间的基础上选择所述选项中的一个或多个包括:
确定所述多个选项中的得分最高的选项;
将所述得分最高的选项的置信区间与所述多个选项中的一个不同选项的置信区间进行比较;以及
当所述得分最高的选项的置信区间与所述不同选项的置信区间不重叠时,排除所述不同选项。”
在上述程序的基础上,合议组认为本案事实已经清楚,可以作出审查决定。
二、决定的理由
1.审查文本的认定
复审请求人在答复复审通知书时,对权利要求书进行了修改。经审查,上述修改符合专利法第33条和专利法实施细则第60条第1款的规定。本复审决定所针对的审查文本为:2019年07月25日提交的权利要求1-11项,2015年06月11日国际申请进入中国国家阶段所提交的说明书第1-136段、说明书附图图1-11、说明书摘要和摘要附图。
2.关于专利法第22条第3款规定的创造性。
专利法第22条第3款规定:创造性,是指与现有技术相比,该发明具有突出的实质性特点和显著的进步,该实用新型具有实质性特点和进步。
如果一项权利要求所要求保护的技术方案相对于最接近的现有技术存在区别技术特征,由于该区别技术特征属于本领域的公知常识,即现有技术中给出了将上述区别技术特征应用到该最接近的现有技术以解决其存在的技术问题的启示,这种启示会使本领域的技术人员在面对所述技术问题时,有动机改进该最接近的现有技术并获得要求保护的发明,且也未产生任何意料不到的技术效果,则该项权利要求所要求保护的技术方案不具备突出的实质性特点和显著的进步,不具备创造性。
本复审决定引用驳回决定和复审通知书中引用的对比文件,即
对比文件1:US7937336B1,公开日为2011年05月03日;
对比文件2:US7277574B2,公开日为2007年10月02日;
对比文件3:US2011/0086777A1,公开日为2011年04月14日;
对比文件4:US2006/0088894A1,公开日为2006年04月27日,
其中对比文件1为最接近的现有技术。
2.1.权利要求1要求保护一种机器学习系统处的方法,对比文件1(参见说明书第1栏第50行至第10栏第33行)公开了一种用于机器学习系统的方法,其具体公开以下内容:决策树,其用作为预测用户属性的机器学习分类器,经由对采样数据的机器学习而构建决策树;所述系统包括处理器,在处理器处接收选项行为的多个样本,学习快速决断,获得样本集(相当于对于多个选项中的每一个,在处理器处接收描述该选项的行为的多个样本);服务提供商计算错误率,置信水平等,以用于采用规范化的样本数据的每个节点进行分类(相当于对于每一个选项,计算分数,所述分数包括有界差分统计数据);对于每个单独节点,计算期望的准确率,计算用于每个单独节点的准确率的置信区间(相当于对于每一个选项,使用所述样本来计算所述分数的置信区间);选择最好的快速节点(相当于在所述置信区间和所述分数的基础上选择所述选项中的一个或多个),其中服务提供商利用期望的准确率和置信值可以确定阈值误差率,用于界限参数,以确定是否接收分类 (相当于所述样本的数量至少部分地基于根据应用领域或可用计算资源来自动选择的容错度)。
权利要求1与对比文件1的区别技术特征是:通过采用柱计数的直方图计算分数;置信区间的计算包括计算该选项的分数加上或减去一常量与所述分数的所估计的方差乘以二与所述容错度的商的对数的平方根的乘积;在所述置信区间的基础上选择所述选项中的一个或多个包括:确定所述多个选项中的得分最高的选项;将所述得分最高的选项的置信区间与所述多个选项中的一个不同选项的置信区间进行比较;以及当所述得分最高的选项的置信区间与所述不同选项的置信区间不重叠时,排除所述不同选项。基于上述区别特征,可以确定本申请实际解决的技术问题为如何进行统计数据及其准确性参数计算和提高准确性问题。
对于本领域技术人员而言,在对诸如方差、熵等统计数据进行计算的过程,采用柱计数的直方图进行计算;以及,减小或缩小置信区间,在保证置信度达到指定要求的前提下,尽可能的提高置信区间的精确度或准确性,而采用将得分最高的选项的置信区间与不同选项的置信区间进行比较以排除或拒绝置信区间中与得分最高的选项的置信区间重叠的选项,均是本领域的常用技术手段;另外,对于统计数据准确性参数的计算中,采用常数、方差、容错度等因数进行计算也是本领域的常用技术手段。在对比文件1给出计算错误率、置信水平、置信区间等的启示下,本领域技术人员面对本申请要解决的技术问题,结合本领域的常用技术手段,通过合乎逻辑的分析、推理或者有限次试验得到权利要求1的方案对本领域的技术人员来说是显而易见的。因此,权利要求1不具备创造性,不符合专利法第22条第3款的规定。
2.2.权利要求2是权利要求1的从属权利要求,对比文件1还公开了(参见说明书第10栏第24-26行):服务提供商计算错误率,置信水平等,以用于采用规范化的样本数据的每个节点进行分类(相当于所述有界差分统计数据是从所述样本中获取的数值,所述数值描述所述选项的行为;并且所述数值在所述样本中的任一个被省略或改变时稍微改变),所以该权利要求的附加技术特征也已经被对比文件1公开。因此,在所引用的权利要求不具备创造性的情况下,该权利要求所保护的技术方案也不具备专利法第22条第3款规定的创造性。
2.3.权利要求3是权利要求1-2的任一项从属权利要求,对比文件2公开了(参见说明书第13栏第56-62行):使用每一级上特征子集的信息增益以对具有相同行为分数的任意特征子集进行排序,在该技术中,度量G(C,F)计算熵的减少量(相当于所述分数选自信息增益、基尼增益、方差、熵中的任一个或多个),可见该权利要求限定部分的附加技术特征已被对比文件2公开了,所公开的特征在对比文件2中所起的作用与附加技术特征在本权利要求中为解决技术问题所起的作用相同,都是进行分数确定。因此,对比文件2给出了将上述已公开的特征用于对比文件1以解决其技术问题的启示。因此,在所引用的权利要求不具备创造性的情况下,该权利要求所保护的技术方案也不具备专利法第22条第3款规定的创造性。
2.4.权利要求4是权利要求1-3的任一项从属权利要求,对比文件1还公开了(参见说明书第7栏第14-46行,第4栏59-60行):设置阈值误差率,用于界限参数,如果置信区间的不同选项与阈值不一致,则不被考虑,选择最合适的节点,置信区间内选择最佳节点(相当于设置容错度以及在所述置信区间和所述分数的基础上选择一个选项以使得所选选项在所述容错度内具有所有选项中的最佳分数),所以该权利要求的附加技术特征也已经被对比文件1公开。因此,在所引用的权利要求不具备创造性的情况下,该权利要求所保护的技术方案也不具备专利法第22条第3款规定的创造性。
2.5.权利要求5是权利要求1-4的任一项从属权利要求,对比文件3公开了(参见说明书第0065-0066段):采用独立预测逻辑衰退模型进行预测,采用jackknife方差估计所选项的分数(相当于计算所述置信区间包括估计所述选项的分数的方差),可见该权利要求限定部分的附加技术特征已被对比文件3公开了,所公开的特征在对比文件3中所起的作用与附加技术特征在本权利要求中为解决技术问题所起的作用相同,都是进行分数确定。因此,在所引用的权利要求不具备创造性的情况下,该权利要求所保护的技术方案也不具备专利法第22条第3款规定的创造性。
2.6.权利要求6是权利要求1-5的任一项从属权利要求,对比文件3还公开了(参见说明书第0065-0066段):采用独立预测逻辑衰退模型进行预测,采用jackknife方差估计所选项的分数(相当于计算所述置信区间包括通过计算jackknife方差估计来估计所述选项的分数的方差),所以该权利要求的附加技术特征也已经被对比文件3公开。因此,在所引用的权利要求不具备创造性的情况下,该权利要求所保护的技术方案也不具备专利法第22条第3款规定的创造性。
2.7.权利要求7是权利要求1-6的任一项从属权利要求,而在所属技术领域,具体计算方式的选择是所属领域技术人员根据实际需要而自行灵活设置的,因此本领域技术人员容易想到包括为偏差调整所计算的置信区间,是所属领域常用技术手段。因此,在所引用的权利要求不具备创造性的情况下,该权利要求所保护的技术方案也不具备专利法第22条第3款规定的创造性。
2.8.权利要求8是权利要求1-7的任一项从属权利要求,对比文件4公开了(参见说明书第0094段):FPGAs,可编程门阵列(相当于所述方法至少部分地使用选自以下各项中的任一个或多个的硬件逻辑来执行:现场可编程门阵列、程序专用的集成电路、程序专用的标准产品、片上系统、复杂可编程逻辑器件,图形处理单元),可见该权利要求限定部分的附加技术特征已被对比文件4公开了,所公开的特征在对比文件4中所起的作用与附加技术特征在本权利要求中为解决技术问题所起的作用相同,都是进行器件选择。因此,在所引用的权利要求不具备创造性的情况下,该权利要求所保护的技术方案也不具备专利法第22条第3款规定的创造性。
2.9.权利要求9要求保护一种机器学习装置,其作为产品权利要求与作为方法权利要求的权利要求1相对应。在权利要求1不具备创造性的情形下,基于相同的理由和证据,权利要求9也不具备专利法第22条第3款规定的创造性。
2.10.权利要求10要求保护一种具有指令的计算机可读存储介质。具有指令的计算机可读存储介质为本领域的常用技术手段。在权利要求1-8不具备专利法第22条第3款规定的创造性的情形下,权利要求10也不具备专利法第22条第3款规定的创造性。
2.11.权利要求11要求保护包括用于执行如权利要求1-8中的任一项所述的方法的装置的计算机系统,在权利要求1-8不具备专利法第22条第3款规定的创造性的情形下,权利要求11也不具备专利法第22条第3款规定的创造性。
3.关于复审请求人的意见陈述
合议组认为:尽管上述新增加的技术特征没有被对比文件1-4所公开,但是其对于本领域技术人员而言,减小或缩小置信区间,在保证置信度达到指定要求的前提下,尽可能地提高置信区间的精确度或准确性,而采用将得分最高的选项的置信区间与不同选项的置信区间进行比较以排除或拒绝置信区间中与得分最高的选项的置信区间重叠的选项是本领域的常用技术手段。
三、决定
维持国家知识产权局于2018年09月03日对本申请作出的驳回决定。
如对本复审请求审查决定不服,根据专利法第41条第2款的规定,复审请求人可自收到本决定之日起三个月内向北京知识产权法院起诉。



郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如作者信息标记有误,请第一时间联系我们修改或删除,多谢。

留言与评论(共有 0 条评论)
   
验证码: