发明创造名称:外呼结果确定方法、装置及系统
外观设计名称:
决定号:199256
决定日:2019-12-10
委内编号:1F289444
优先权日:
申请(专利)号:201610627078.5
申请日:2016-08-02
复审请求人:北京京东尚科信息技术有限公司 北京京东世纪贸易有限公司
无效请求人:
授权公告日:
审定公告日:
专利权人:
主审员:俞燕浓
合议组组长:范晓寒
参审员:高霞
国际分类号:H04M3/51
外观设计分类号:
法律依据:专利法第22条第3款
决定要点
:如果一项权利要求请求保护的技术方案与最接近的现有技术相比存在区别特征,但该区别特征或被其他现有技术公开,或是本领域的惯用手段,则该项权利要求请求保护的技术方案不具有突出的实质性特点和显著的进步,不具有创造性。
全文:
本复审请求审查决定涉及申请号为201610627078.5,名称为“外呼结果确定方法、装置及系统”的发明专利申请(下称本申请)。申请人为北京京东尚科信息技术有限公司、北京京东世纪贸易有限公司。本申请的申请日为2016年08月02日,公开日为2016年12月21日。
经实质审查,国家知识产权局原审查部门于2019年03月20日发出驳回决定,驳回了本申请。驳回决定依据的审查文本为:申请人于申请日2016年08月02日提交的权利要求书第1-17项,说明书第1-105段(即第1-11页),说明书附图第1-5页,说明书摘要和摘要附图。驳回决定引用的对比文件为:对比文件1:“语音识别技术在呼叫中心自动外呼应用的研究与实现”,中国优秀硕士学位论文全文数据库,信息科技辑,2012年第8期,公开日为2012年8月15日;以及对比文件2:US2001014859A1,公开日为2001年08月16日。驳回决定中的驳回理由为:权利要求1-7、9-15、17相对于对比文件1和本领域惯用手段的结合不具有专利法第22条第3款规定的创造性;权利要求8、16相对于对比文件1、对比文件2和本领域惯用手段的结合不具有专利法第22条第3款规定的创造性。驳回决定所针对的权利要求书内容如下:
“1. 一种外呼结果确定方法,其特征在于,包括:
获取外呼的语音数据;
通过自动语音识别,对所述语音数据进行处理,以将所述语音数据转换为文本数据;以及
将所述文本数据与预存的关键词信息进行匹配,以确定所述外呼的外呼结果。
2. 根据权利要求1所述的方法,其特征在于,将所述文本数据与预存的关键词信息进行匹配,以确定所述外呼的外呼结果包括:
从所述文本数据中提取所述关键词信息中的一个或多个关键词;以及
根据所述一个或多个关键词与外呼结果映射表,确定所述外呼的外呼结果。
3. 根据权利要求1所述的方法,其特征在于,还包括:确定获取所述语音数据的时间。
4. 根据权利要求3所述的方法,其特征在于,确定提取所述语音通话的时间包括:
从语音网关获取所述外呼的SIP协议数据包;
解析所述SIP协议数据包,以获取所述外呼的通话ID及确定所述SIP协议数据包承载的消息的类型;以及
当所述SIP协议数据包承载的消息的类型为响铃消息时,确定开始获取所述语音数据。
5. 根据权利要求4所述的方法,其特征在于,所述外呼通过所述通话ID被唯一标识。
6. 根据权利要求1所述的方法,其特征在于,所述语音数据被封装为RTP协议数据包。
7. 根据权利要求1所述的方法,其特征在于,还包括:将所述外呼的外呼结果存储到一存储装置中,以更新所述外呼的通话记录的外呼结果状态。
8. 根据权利要求1所述的方法,其特征在于,通过自动语音识别,对所述语音数据进行处理,以将所述语音数据转换为文本数据包括:
对所述语音数据进行解码;
对解码后的所述语音数据进行预处理;
对预处理后的语音数据进行特征提取,以提取出所述语音数据的特征参数;以及
基于已建立的声学模型、语音模型及字典,对所述特征参数进行语音解码和搜索,以将获取的语音数据转换为文本数据。
9. 一种外呼结果确定装置,其特征在于,包括:
语音获取模块,用于获取外呼的语音数据;
语音识别模块,用于通过自动语音识别,对所述语音数据进行处理,以将所述语音数据转换为文本数据;以及
结果确定模块,用于将所述文本数据与预存的关键词信息进行匹配,以确定所述外呼的外呼结果。
10. 根据权利要求9所述的装置,其特征在于,所述结果确定模块包括:
关键词提取子模块,用于从所述文本数据中提取所述关键词信息中的一个或多个关键词;以及
外呼结果匹配子模块,用于根据所述一个或多个关键词与外呼结果映射表,确定所述外呼的外呼结果。
11. 根据权利要求9所述的装置,其特征在于,还包括:时间确定模块,用于确定获取所述语音数据的时间。
12. 根据权利要求11所述的装置,其特征在于,所述时间确定模块包括:
SIP包获取子模块,用于从语音网关获取所述外呼的SIP协议数据包;
SIP包解析子模块,用于解析所述SIP协议数据包,以获取所述外呼的通话ID及确定所述SIP协议数据包承载的消息的类型;以及
时间确定子模块,用于当所述SIP协议数据包承载的消息的类型为响铃消息时,确定开始获取所述语音数据。
13. 根据权利要求12所述的装置,其特征在于,所述外呼通过所述通话ID被唯一标识。
14. 根据权利要求9所述的装置,其特征在于,所述语音数据被封装为RTP协议数据包。
15. 根据权利要求9所述的装置,其特征在于,还包括:结果存储模块,用于将所述外呼的外呼结果存储到一存储装置中,以更新所述外呼的通话记录的外呼结果状态。
16. 根据权利要求9所述的装置,其特征在于,所述语音识别模块包括:
语音解码子模块,用于对所述语音数据进行解码;
预处理子模块,用于对解码后的所述语音数据进行预处理;
特征提取子模块,用于对预处理后的语音数据进行特征提取,以提取出所述语音数据的特征参数;以及
数据转换子模块,用于基于已建立的声学模型、语音模型及字典,对所述特征参数进行语音解码和搜索,以将获取的语音数据转换为文本数据。
17. 一种外呼结果确定系统,其特征在于,包括:
处理器;以及
存储器,用于存储所述处理器的可执行指令;
其中所述处理器配置为经由执行所述可执行指令来执行以下操作:
获取外呼的语音数据;
通过自动语音识别,对所述语音数据进行处理,以将所述语音数据转换为文本数据;以及
将所述文本数据与预存的关键词信息进行匹配,以确定所述外呼的外呼结果。”
申请人(下称复审请求人)对上述驳回决定不服,于2019年07月01日向国家知识产权局提出了复审请求,同时提交了权利要求书的全文修改替换页。具体修改为:将从属权利要求3、4的附加技术特征以及说明书中的特征“其中所述响铃消息为180 Ringing消息”加到独立权利要求1、17中,将从属权利要求11、12的附加技术特征加到独立权利要求9中,删除从属权利要求3、4、11、12并适应性修改权利要求的编号及引用关系。复审请求人认为:首先,权利要求1与对比文件1相比,具有如下区别特征:(1)对所述语音数据进行处理,以将所述语音数据转换为文本数据,以及将所述文本数据与预存的关键词信息进行匹配,以确定所述外呼的外呼结果;(2)确定获取所述语音数据的时间,包括:从语音网关获取所述外呼的SIP协议数据包,解析所述SIP协议数据包,以获取所述外呼的通话ID及确定所述SIP协议数据包承载的消息的类型,以及当所述SIP协议数据包承载的消息的类型为响铃消息时,确定开始获取所述语音数据,其中所述响铃消息为180 Ringing消息。其次,基于上述区别特征(2),对比文件1的方式 “首先系统发起呼叫,下一步处理流程由返回的信令决定,如返回18X 响应码说明通话正处在振铃阶段,但是这一步还无法确定结果,因为还需要根据是否带SDP 确定下一步处理,如果18X 带了SDP,表明进入了临时话路,则需要跳转到语音识别模块就行识别处理”与本申请的“当所述SIP协议数据包承载的消息的类型为响铃消息即180 Ringing时,确定开始获取所述语音数据”并不相同,而且比本申请复杂,权利要求1通过“解析所述SIP协议数据包”这一简便的方式实现了“通过解析SIP协议数据包能够同时确定获取语音数据的时间以及外呼的通话ID”的一举两得的技术效果,这是包括对比文件1和2在内的现有技术所无法实现的有益技术效果,对比文件1和2没有给出相关技术启示,同时上述区别特征(2)也并非本领域的公知常识。因此,本申请具有创造性。
复审请求人提出复审请求时新修改的独立权利要求1、7、13内容如下:
“1. 一种外呼结果确定方法,其特征在于,包括:
获取外呼的语音数据;
通过自动语音识别,对所述语音数据进行处理,以将所述语音数据转换为文本数据;
将所述文本数据与预存的关键词信息进行匹配,以确定所述外呼的外呼结果;以及
确定获取所述语音数据的时间,包括:
从语音网关获取所述外呼的SIP协议数据包;
解析所述SIP协议数据包,以获取所述外呼的通话ID及确定所述SIP协议数据包承载的消息的类型;以及
当所述SIP协议数据包承载的消息的类型为响铃消息时,确定开始获取所述语音数据,其中所述响铃消息为180 Ringing消息。”
“7. 一种外呼结果确定装置,其特征在于,包括:
语音获取模块,用于获取外呼的语音数据;
语音识别模块,用于通过自动语音识别,对所述语音数据进行处理,以将所述语音数据转换为文本数据;
结果确定模块,用于将所述文本数据与预存的关键词信息进行匹配,以确定所述外呼的外呼结果;以及
时间确定模块,用于确定获取所述语音数据的时间,包括:
SIP包获取子模块,用于从语音网关获取所述外呼的SIP协议数据包;
SIP包解析子模块,用于解析所述SIP协议数据包,以获取所述外呼的通话ID及确定所述SIP协议数据包承载的消息的类型;以及
时间确定子模块,用于当所述SIP协议数据包承载的消息的类型为响铃消息时,确定开始获取所述语音数据。”
“13. 一种外呼结果确定系统,其特征在于,包括:
处理器;以及
存储器,用于存储所述处理器的可执行指令;
其中所述处理器配置为经由执行所述可执行指令来执行以下操作:
获取外呼的语音数据;
通过自动语音识别,对所述语音数据进行处理,以将所述语音数据转换为文本数据;
将所述文本数据与预存的关键词信息进行匹配,以确定所述外呼的外呼结果;以及
确定获取所述语音数据的时间,包括:
从语音网关获取所述外呼的SIP协议数据包;
解析所述SIP协议数据包,以获取所述外呼的通话ID及确定所述SIP协议数据包承载的消息的类型;以及
当所述SIP协议数据包承载的消息的类型为响铃消息时,确定开始获取所述语音数据,其中所述响铃消息为180 Ringing消息。”
经形式审查合格,国家知识产权局于2019年07月10日依法受理了该复审请求,并将其转送至原审查部门进行前置审查。
原审查部门在前置审查意见书中坚持驳回决定。
随后,国家知识产权局成立合议组对本案进行审理。
合议组于2019年09月26日向复审请求人发出复审通知书。该复审通知书依据的审查文本为:复审请求人于2019年07月01日提交的权利要求第1-13项;于申请日2016年08月02日提交的说明书第1-11页,说明书附图第1-5页,说明书摘要和摘要附图。该复审通知书引用的对比文件与驳回决定引用的对比文件相同,均为对比文件1和对比文件2。
该复审通知书指出:权利要求1-5、7-11、13相对于对比文件1和本领域惯用手段的结合不具有专利法第22条第3款规定的创造性;权利要求6、12相对于对比文件1、对比文件2和本领域惯用手段的结合不具有专利法第22条第3款规定的创造性。
针对复审请求人的意见,合议组认为:首先,对比文件1已经公开了“对所述语音数据进行处理”、“确定获取所述语音数据的时间,包括:从语音网关获取所述外呼的SIP协议数据包,解析所述SIP协议数据包,以确定所述SIP协议数据包承载的消息的类型”,权利要求1与对比文件1相比,区别特征仅在于:(1)权利要求1中是将语音数据转换为文本数据,将文本数据与预存的关键词信息进行匹配,以确定外呼的外呼结果,而对比文件1中是将语音数据转换为特征数据,将特征数据与预存的特征信息进行匹配,以确定外呼的外呼结果;(2)解析SIP协议数据包后还获取外呼的通话ID;(3)权利要求1中是当SIP协议数据包承载的消息的类型为响铃消息时,确定开始获取语音数据,其中响铃消息为180 Ringing消息,而对比文件1中是当SIP协议数据包承载的消息的类型为临时话路消息时,确定开始获取语音数据。并且上述区别特征是本领域的惯用手段。其次,对比文件1确定获取语音数据的时间的方式是先确定进入振铃阶段,再确定进入振铃阶段的临时话路阶段,才获取语音数据,而本申请确定获取语音数据的时间的方式是在确定进入振铃阶段即获取语音数据,也就是说,对比文件1和本申请的方式均是在振铃阶段确定获取时间,而对比文件1为了确定更加精确地获取时间而对振铃阶段进行了进一步判断,即对比文件1比本申请复杂是为了确定更加精确的获取时间,因此,本领域技术人员在不需要确定更加精确的获取时间的基础上,可以想到把对比文件1中上述进一步判断的步骤省去,而与本申请一样直接在进入振铃阶段即获取数据,这是本领域的惯用手段。另外,在对比文件1已经公开了“解析所述SIP协议数据包”的基础上,为了标识外呼通话,而通过解析SIP协议数据包获取外呼的通话ID是本领域的惯用手段。因此,对于复审请求人具有创造性的理由,合议组不予支持。
复审请求人于2019年11月07日提交了意见陈述书以及权利要求书全文修改替换页。具体修改为:将独立权利要求1、7、13中的特征“以获取所述外呼的通话ID”修改为“以获取所述外呼的通话开始时间、通话结束时间、通话ID”。复审请求人认为:首先,对比文件1的方式“首先系统发起呼叫,下一步处理流程由返回的信令决定,如返回18X响应码说明通话正处在振铃阶段,但是这一步还无法确定结果,因为还需要根据是否带SDP确定下一步处理,如果18X带了SDP,表明进入了临时话路,则需要跳转到语音识别模块进行识别处理”与本申请的“当所述SIP协议数据包承载的消息的类型为响铃消息即180 ringring时,确定开始获取所述语音数据”并不相同,而且比本申请复杂,并且本申请通过“解析所述SIP协议数据包”这一简便的方式实现了“能够同时确定获取语音数据的时间(包括通话开始时间、通话结束时间)以及外呼的通话ID”的技术效果,而对比文件1、2均没有涉及该内容。其次,对比文件1没有任何涉及“获取外呼的SIP协议数据包以及解析SIP协议数据包”的内容,这不属于隐含公开的内容。最后,对比文件1“首先对其进行预加重处理,然后,对信号进行加窗处理,其次,为了保持语音信号的短时平稳性,需要继续进行分帧处理,经过上述前端处理后,接下来对每一帧语音信号提取相关特征”,上述四个复杂的语音处理步骤在本申请的技术方案中并无任何对应之处,因为本申请的技术方案通过将语音数据转换为文本数据并与预存的关键词文本信息进行匹配即可快速、准确地确定外呼结果,没有进行也不需要进行上述四个复杂的语音处理步骤,正是因为对比文件1采用了将输入的语音与库中的模板音进行语音匹配和判断的方案,为了提高语音匹配和判断的正确性和可靠性,才需要事先对输入的语音进行四个复杂的语音处理步骤后才与库中的模板音进行匹配和判断,这就导致了处理速度和效率降低以及资源消耗增加的弊端,可见对比文件1实际上给出了相反的技术启示。本次新修改的独立权利要求1、7、13内容如下:
“1. 一种外呼结果确定方法,其特征在于,包括:
获取外呼的语音数据;
通过自动语音识别,对所述语音数据进行处理,以将所述语音数据转换为文本数据;
将所述文本数据与预存的关键词信息进行匹配,以确定所述外呼的外呼结果;以及
确定获取所述语音数据的时间,包括:
从语音网关获取所述外呼的SIP协议数据包;
解析所述SIP协议数据包,以获取所述外呼的通话开始时间、通话结束时间、通话ID及确定所述SIP协议数据包承载的消息的类型;以及
当所述SIP协议数据包承载的消息的类型为响铃消息时,确定开始获取所述语音数据,其中所述响铃消息为180Ringing消息。”
“7. 一种外呼结果确定装置,其特征在于,包括:
语音获取模块,用于获取外呼的语音数据;
语音识别模块,用于通过自动语音识别,对所述语音数据进行处理,以将所述语音数据转换为文本数据;
结果确定模块,用于将所述文本数据与预存的关键词信息进行匹配,以确定所述外呼的外呼结果;以及
时间确定模块,用于确定获取所述语音数据的时间,包括:
SIP包获取子模块,用于从语音网关获取所述外呼的SIP协议数据包;
SIP包解析子模块,用于解析所述SIP协议数据包,以获取所述外呼的通话开始时间、通话结束时间、通话ID及确定所述SIP协议数据包承载的消息的类型;以及
时间确定子模块,用于当所述SIP协议数据包承载的消息的类型为响铃消息时,确定开始获取所述语音数据。”
“13. 一种外呼结果确定系统,其特征在于,包括:
处理器;以及
存储器,用于存储所述处理器的可执行指令;
其中所述处理器配置为经由执行所述可执行指令来执行以下操作:
获取外呼的语音数据;
通过自动语音识别,对所述语音数据进行处理,以将所述语音数据转换为文本数据;
将所述文本数据与预存的关键词信息进行匹配,以确定所述外呼的外呼结果;以及
确定获取所述语音数据的时间,包括:
从语音网关获取所述外呼的SIP协议数据包;
解析所述SIP协议数据包,以获取所述外呼的通话开始时间、通话结束时间、通话ID及确定所述SIP协议数据包承载的消息的类型;以及
当所述SIP协议数据包承载的消息的类型为响铃消息时,确定开始获取所述语音数据,其中所述响铃消息为180Ringing消息。”
在上述程序的基础上,合议组认为本案事实已经清楚,可以作出审查决定。
二、决定的理由
(一)审查文本的认定
复审请求人在答复复审通知书时提交了权利要求书全文修改替换页,经核实,上述修改文本的修改之处符合专利法第33条的规定。本复审请求审查决定依据的审查文本为:复审请求人于2019年11月07日提交的权利要求第1-13项;于申请日2016年08月02日提交的说明书第1-11页,说明书附图第1-5页,说明书摘要和摘要附图。
(二)具体理由的阐述
专利法第22条第3款规定:创造性,是指与现有技术相比,该发明具有突出的实质性特点和显著的进步,该实用新型具有实质性特点和进步。
本复审请求审查决定引用的对比文件与驳回决定、复审通知书引用的对比文件相同,即:
对比文件1:“语音识别技术在呼叫中心自动外呼应用的研究与实现”,中国优秀硕士学位论文全文数据库,信息科技辑,2012年第8期,公开日为2012年8月15日;
对比文件2:US2001014859A1,公开日为2001年08月16日。
1.权利要求1要求保护一种外呼结果确定方法。对比文件1公开了一种语音识别技术在呼叫中心自动外呼应用的研究与实现,并具体公开了以下内容(参见正文第四章、第五章):呼叫中心的整体结构如下:接入网关,CTI,SoftACD,坐席,IVR和MS;接入网关(相当于语音网关):负责接入不同的媒体(线路),把电路信令转化为SIP信令,把话路转换为RTP话路。在外呼的过程中,可以语音识别自动判断号码的状态进行筛选,如果是可用号码则接入给话务员进行通话,如果不是可用号码或者该号码处于停机或者关机状态,系统则不接回到座席。语音识别技术利用现有PSTN网络普遍实施了呼叫失败后语音提示的人性化功能,对语音提示(相当于外呼的语音数据)进行快速的语音识别与匹配,需要通过特征码或关键字匹配的方式,在几秒内完成语音匹配,以提高识别效率;提示音库就是样本库,语音识别采用语音匹配模式,与样本库语音进行比对。号码识别过程发生在呼叫过程中,如果存在临时话路,则进入到语音识别过程,首先系统应该发起呼叫,下一步处理流程由返回的信令决定,返回200响应码的意思是呼叫接通,则可以直接转到人工座席处理,返回3XX-6XX响应码的意思是呼叫失败,可以根据返回信令直接检测,18X响应码(相当于消息的类型)说明通话正处在振铃阶段(相当于消息类型为响铃消息),但是这一步还无法确定结果,因为还需要根据是否带SDP确定下一步处理,如果18X带了SDP,表明进入了临时话路,则需要跳转到语音识别模块进行识别处理(相当于确定获取语音数据的时间,因为语音网关把电路信令转化为SIP信令,所以上述内容隐含公开了从语音网关获取外呼的SIP协议数据包,解析SIP协议数据包,以确定SIP协议数据包承载的消息的类型,当SIP协议数据包承载的消息的类型为临时话路消息时,确定开始获取语音数据),如果18X没有带SDP,只是普通的振铃而无需识别。设计的语音识别算法主要包括的模块为:前端语音数据处理模块,用来对语音进行预处理和特征提取,前端的语音数据处理模块在所有的处理模块中非常重要,从上文的语音识别的基本理论我们己经知道,该模块的各项处理都为提取特征值做好充足的准备,模板库的制作也是基于该模块,对于输入的每一个PCM语音包(相当于获取外呼的语音数据),首先对其进行预加重处理,然后,对信号进行加窗处理,其次,为了保持语音信号的短时平稳性,需要继续进行分帧处理(相当于通过自动语音识别,对语音数据进行处理),经过上述前端处理后,接下来对每一帧语音信号提取相关特征(相当于将语音数据转换为特征数据);AM音匹配模块,把机器应答音从库中匹配合适的模板音和判断是否库外音,AM音匹配模块的主要任务是将输入的语音经过处理后,与库文件中的特征模板(相当于预存的特征信息)进行比较,选择出最为相近的一条语音作为匹配结果返回(相当于将特征数据与预存的特征信息进行匹配,以确定外呼的外呼结果)。
权利要求1与对比文件1相比,区别特征为:(1)权利要求1中是将语音数据转换为文本数据,将文本数据与预存的关键词信息进行匹配,以确定外呼的外呼结果,而对比文件1中是将语音数据转换为特征数据,将特征数据与预存的特征信息进行匹配,以确定外呼的外呼结果;(2)解析SIP协议数据包后还获取外呼的通话开始时间、通话结束时间、通话ID;(3)权利要求1中是当SIP协议数据包承载的消息的类型为响铃消息时,确定开始获取语音数据,其中响铃消息为180 Ringing消息,而对比文件1中是当SIP协议数据包承载的消息的类型为临时话路消息时,确定开始获取语音数据。基于上述区别特征可以确定,权利要求1相对于对比文件1实际要解决的技术问题是:提供了另一种语音数据匹配方式,如何获知通话时间并标识外呼通话,以及如何减少信令检测。
对于上述区别特征(1),对比文件1已经公开了对语音提示进行快速的语音识别与匹配,需要通过特征码或关键字匹配的方式,在几秒内完成语音匹配,以提高识别效率(参见正文第4.3.3.2节),也就是说,对比文件1已经公开了关键字匹配的方式。并且《导盲机器人定位与路径规划技术》一书中公开了以下内容(参见正文第114页):导盲机器人采用语音芯片型号为LD3320的语音识别模块,该语音识别芯片由STC10L08XE型号的单片机控制,当LD3320新芯片识别出用户发出的语音信号(相当于语音数据)后,将其转换为汉语拼音串(相当于文本数据)的形式(相当于语音数据转换为文本数据),传入到STC10L08XE中,然后STC10L08XE单片机通过内部程序将拼音串和关键词进行一一匹配,匹配完成后根据相应的匹配结果确定语音输出或相应动作的执行(相当于将文本数据与预存的关键词信息进行匹配,以确定外呼的外呼结果)。由此可见,将语音数据转换为文本数据,将文本数据与预存的关键词信息进行匹配,以确定外呼的外呼结果以完成关键字匹配的方式记载在该工具书中,属于公知常识。
对于上述区别特征(2),对本领域技术人员来说,为了获知通话时间,解析SIP协议数据包后还获取外呼的通话开始时间、通话结束时间是本领域的惯用手段,另外,本领域技术人员知晓,通话ID用于唯一地标识一次外呼通话,因此,为了标识外呼通话,解析SIP协议数据包后还获取外呼的通话ID也是本领域的惯用手段。
对于上述区别特征(3),根据对比文件1公开的内容“18X响应码说明通话正处在振铃阶段,但是这一步还无法确定结果,因为还需要根据是否带SDP确定下一步处理,如果18X带了SDP,表明进入了临时话路,则需要跳转到语音识别模块进行识别处理”可知:对比文件1公开的是在振铃阶段中的临时话路阶段获取语音数据,而本领域技术人员为了减少对信令的检测,避免继续检测18X是否携带SDP,在进入振铃阶段即检测到响铃消息18X响应码时就进行语音数据的获取是本领域的惯用手段。另外,本领域技术人员知晓,18x消息指的是180消息或183消息,该180消息为Ringing振铃消息,因此,采用180 Ringing响铃消息表示振铃阶段是本领域的惯用手段。
因此,在对比文件1的基础上结合上述惯用手段以获得该权利要求所要求保护的技术方案,对本领域技术人员来说是显而易见的。由此可见,该权利要求所要求保护的技术方案不具备突出的实质性特点和显著的进步,不符合专利法第22条第3款有关创造性的规定。
2.权利要求2引用权利要求1。本领域技术人员知晓,语音提示通常为一句话,例如“您呼叫的号码已关机”,“您呼叫的号码是空号”,“您呼叫的号码已停机”,如果进行整句话比较势必会延长处理时间,因此,本领域技术人员为了节约处理时间,提高判断速度,会想到只进行关键词,例如“关机”、“空号”、“停机”的提取与比较,再根据外呼结果映射表确定外呼结果,这是本领域的惯用手段。因此,在其引用的权利要求不具有创造性的情况下,权利要求2也不具有创造性,不符合专利法第22条第3款的规定。
3.权利要求3引用权利要求1。本领域技术人员知晓,通话ID用于唯一地标识一次外呼通话,因此,所述外呼通过所述通话ID被唯一标识是本领域的惯用手段。因此,在其引用的权利要求不具有创造性的情况下,权利要求3也不具有创造性,不符合专利法第22条第3款的规定。
4.权利要求4引用权利要求1。对比文件1公开了以下内容(参见正文第4.1节第10-11行):接入网关:负责接入不同的媒体(线路),把电路信令转化为SIP信令,把话路转换为RTP话路(相当于语音数据被封装为RTP协议数据包)。因此,在其引用的权利要求不具有创造性的情况下,权利要求4也不具有创造性,不符合专利法第22条第3款的规定。
5.权利要求5引用权利要求1。对比文件1公开了以下内容(参见正文第4.3.1节第10-14行):其工作过程为,系统根据座席状态和算法策略对指定号码集自动发起呼叫,并通过呼叫过程中的各种信令和信号,对呼叫进行合适的处理:1.如果呼叫接通,则将呼叫转给座席;2.如果呼叫未接通,系统跳过该号码,继续呼叫下一个号码;同时代替座席记录当前呼叫的状态(相当于将所述外呼的外呼结果存储到一存储装置中,以更新所述外呼的通话记录的外呼结果状态)。因此,在其引用的权利要求不具有创造性的情况下,权利要求5也不具有创造性,不符合专利法第22条第3款的规定。
6.权利要求6引用权利要求1。对比文件1公开了以下内容(参见正文第5.2.1节):对于输入的每一个PCM语音包,首先对其进行预加重处理,然后,对信号进行加窗处理,其次,为了保持语音信号的短时平稳性,需要继续进行分帧处理(相当于对语音数据进行预处理,隐含公开了对语音数据进行解码,对解码后的语音数据进行预处理),经过上述前端处理后,接下来对每一帧语音信号提取相关特征。对比文件2公开了一种用于语音识别的设备、方法、计算机系统和存储介质,并具体公开了以下内容(参见说明书第0043段):输入语音S被语音识别装置110的声音处理器111转换为一系列信号X(根据对比文件2说明书第0006段公开的内容“语音的特征X”可知:X相当于语音数据的特征参数,所以上述公开内容相当于对语音数据进行特征提取,以提取出语音数据的特征参数),并随后被存储,转换后的信号X在语言解码器112通过从实际文本W和不流畅词的混合物中提取出被认为有意义的字,使用具有已学习的声音特征的声音模型113(相当于声学模型)以及通过下文描述的学习过程事先准备的语言模型的字典114(相当于语言模型),被处理为识别结果W’,这样一个处理序列有时被称为对以声音形式编码的数据中有意义数据的解码,然后作为识别结果产生的文本被显示(相当于基于已建立的声学模型、语音模型,对所述特征参数进行语音解码和搜索,以将获取的语音数据转换为文本数据)。对本领域技术人员来说,为了语音识别更加准确,在语音解码和搜索过程中还引入字典是本领域的惯用手段。因此,在对比文件1的基础上结合对比文件2以及上述惯用手段,得出该权利要求所要求保护的技术方案,对本领域技术人员来说是显而易见的,该权利要求所要求保护的技术方案不具备突出的实质性特点和显著的进步,不符合专利法第22条第3款有关创造性的规定。
7.权利要求7要求保护一种外呼结果确定装置,对比文件1公开了一种语音识别技术在呼叫中心自动外呼应用的研究与实现,并具体公开了以下内容(参见正文第四章、第五章):呼叫中心的整体结构如下:接入网关,CTI,SoftACD,坐席,IVR和MS;接入网关(相当于语音网关):负责接入不同的媒体(线路),把电路信令转化为SIP信令,把话路转换为RTP话路。在外呼的过程中,可以语音识别自动判断号码的状态进行筛选,如果是可用号码则接入给话务员进行通话,如果不是可用号码或者该号码处于停机或者关机状态,系统则不接回到座席。语音识别技术利用现有PSTN网络普遍实施了呼叫失败后语音提示的人性化功能,对语音提示(相当于外呼的语音数据)进行快速的语音识别与匹配,需要通过特征码或关键字匹配的方式,在几秒内完成语音匹配,以提高识别效率;提示音库就是样本库,语音识别采用语音匹配模式,与样本库语音进行比对。号码识别过程发生在呼叫过程中,如果存在临时话路,则进入到语音识别过程,首先系统应该发起呼叫,下一步处理流程由返回的信令决定,返回200响应码的意思是呼叫接通,则可以直接转到人工座席处理,返回3XX-6XX响应码的意思是呼叫失败,可以根据返回信令直接检测,18X响应码(相当于消息的类型)说明通话正处在振铃阶段(相当于消息的类型为响铃消息),但是这一步还无法确定结果,因为还需要根据是否带SDP确定下一步处理,如果18X带了SDP,表明进入了临时话路,则需要跳转到语音识别模块进行识别处理(相当于确定获取语音数据的时间,因为语音网关把电路信令转化为SIP信令,所以上述内容隐含公开了从语音网关获取外呼的SIP协议数据包,解析SIP协议数据包,以确定SIP协议数据包承载的消息的类型,当SIP协议数据包承载的消息的类型为临时话路消息时,确定开始获取语音数据),如果18X没有带SDP,只是普通的振铃而无需识别。设计的语音识别算法主要包括的模块为:前端语音数据处理模块,用来对语音进行预处理和特征提取,前端的语音数据处理模块在所有的处理模块中非常重要,从上文的语音识别的基本理论我们己经知道,该模块的各项处理都为提取特征值做好充足的准备,模板库的制作也是基于该模块,对于输入的每一个PCM语音包(相当于获取外呼的语音数据),首先对其进行预加重处理,然后,对信号进行加窗处理,其次,为了保持语音信号的短时平稳性,需要继续进行分帧处理(相当于通过自动语音识别,对语音数据进行处理),经过上述前端处理后,接下来对每一帧语音信号提取相关特征(相当于将语音数据转换为特征数据);AM音匹配模块,把机器应答音从库中匹配合适的模板音和判断是否库外音,AM音匹配模块的主要任务是将输入的语音经过处理后,与库文件中的特征模板(相当于预存的特征信息)进行比较,选择出最为相近的一条语音作为匹配结果返回(相当于将特征数据与预存的特征信息进行匹配,以确定外呼的外呼结果)。
权利要求7与对比文件1相比,区别特征为:(1)权利要求7中是将语音数据转换为文本数据,将文本数据与预存的关键词信息进行匹配,以确定外呼的外呼结果,而对比文件1中是将语音数据转换为特征数据,将特征数据与预存的特征信息进行匹配,以确定外呼的外呼结果;(2)解析SIP协议数据包后还获取外呼的通话开始时间、通话结束时间、通话ID;(3)权利要求7中是当SIP协议数据包承载的消息的类型为响铃消息时,确定开始获取语音数据,而对比文件1中是当SIP协议数据包承载的消息的类型为临时话路消息时,确定开始获取语音数据;(4)采用模块完成相应的方法步骤。基于上述区别特征可以确定,权利要求7相对于对比文件1实际要解决的技术问题是:提供了另一种语音数据匹配方式,如何获知通话时间并标识外呼通话,如何减少信令检测,以及如何完成方法步骤。
对于上述区别特征(1),对比文件1已经公开了对语音提示进行快速的语音识别与匹配,需要通过特征码或关键字匹配的方式,在几秒内完成语音匹配,以提高识别效率(参见正文第4.3.3.2节),也就是说,对比文件1已经公开了关键字匹配的方式。并且《导盲机器人定位与路径规划技术》一书中公开了以下内容(参见正文第114页):导盲机器人采用语音芯片型号为LD3320的语音识别模块,该语音识别芯片由STC10L08XE型号的单片机控制,当LD3320新芯片识别出用户发出的语音信号(相当于语音数据)后,将其转换为汉语拼音串(相当于文本数据)的形式(相当于语音数据转换为文本数据),传入到STC10L08XE中,然后STC10L08XE单片机通过内部程序将拼音串和关键词进行一一匹配,匹配完成后根据相应的匹配结果确定语音输出或相应动作的执行(相当于将文本数据与预存的关键词信息进行匹配,以确定外呼的外呼结果)。因此,将语音数据转换为文本数据,将文本数据与预存的关键词信息进行匹配,以确定外呼的外呼结果以完成关键字匹配的方式记载在该工具书中,属于公知常识。
对于上述区别特征(2),对本领域技术人员来说,为了获知通话时间,解析SIP协议数据包后还获取外呼的通话开始时间、通话结束时间是本领域的惯用手段,另外,本领域技术人员知晓,通话ID用于唯一地标识一次外呼通话,因此,为了标识外呼通话,解析SIP协议数据包后还获取外呼的通话ID也是本领域的惯用手段。
对于上述区别特征(3),根据对比文件1公开的内容“18X响应码说明通话正处在振铃阶段,但是这一步还无法确定结果,因为还需要根据是否带SDP确定下一步处理,如果18X带了SDP,表明进入了临时话路,则需要跳转到语音识别模块进行识别处理”可知:对比文件1公开的是在振铃阶段的临时话路阶段时获取语音数据。而本领域技术人员为了减少对信令的检测,避免继续检测18X是否携带SDP,在进入振铃阶段即检测到响铃消息18X响应码时就进行语音数据的获取是本领域的惯用手段。
对于上述区别特征(4),对本领域技术人员来说,采用模块完成方法步骤是本领域的惯用手段
因此,在对比文件1的基础上结合上述惯用手段以获得该权利要求所要求保护的技术方案,对本领域技术人员来说是显而易见的。由此可见,该权利要求所要求保护的技术方案不具备突出的实质性特点和显著的进步,不符合专利法第22条第3款有关创造性的规定。
8.权利要求8-12的附加技术特征与权利要求2-6的附加技术特征实质相同,因此,与评述权利要求2-6的理由类似,权利要求8-12也不具有创造性,不符合专利法第22条第3款有关的规定。
9.权利要求13要求保护一种外呼结果确定系统,对比文件1公开了一种语音识别技术在呼叫中心自动外呼应用的研究与实现,并具体公开了以下内容(参见正文第四章、第五章):呼叫中心的整体结构如下:接入网关,CTI,SoftACD,坐席,IVR和MS;接入网关(相当于语音网关):负责接入不同的媒体(线路),把电路信令转化为SIP信令,把话路转换为RTP话路。在外呼的过程中,可以语音识别自动判断号码的状态进行筛选,如果是可用号码则接入给话务员进行通话,如果不是可用号码或者该号码处于停机或者关机状态,系统则不接回到座席。语音识别技术利用现有PSTN网络普遍实施了呼叫失败后语音提示的人性化功能,对语音提示(相当于外呼的语音数据)进行快速的语音识别与匹配,需要通过特征码或关键字匹配的方式,在几秒内完成语音匹配,以提高识别效率;提示音库就是样本库,语音识别采用语音匹配模式,与样本库语音进行比对。号码识别过程发生在呼叫过程中,如果存在临时话路,则进入到语音识别过程,首先系统应该发起呼叫,下一步处理流程由返回的信令决定,返回200响应码的意思是呼叫接通,则可以直接转到人工座席处理,返回3XX-6XX响应码的意思是呼叫失败,可以根据返回信令直接检测,18X响应码(相当于消息的类型)说明通话正处在振铃阶段(相当于消息类型为响铃消息),但是这一步还无法确定结果,因为还需要根据是否带SDP确定下一步处理,如果18X带了SDP,表明进入了临时话路,则需要跳转到语音识别模块进行识别处理(相当于确定获取语音数据的时间,因为语音网关把电路信令转化为SIP信令,所以上述内容隐含公开了从语音网关获取外呼的SIP协议数据包,解析SIP协议数据包,以确定SIP协议数据包承载的消息的类型,当SIP协议数据包承载的消息的类型为临时话路消息时,确定开始获取语音数据),如果18X没有带SDP,只是普通的振铃而无需识别。设计的语音识别算法主要包括的模块为:前端语音数据处理模块,用来对语音进行预处理和特征提取,前端的语音数据处理模块在所有的处理模块中非常重要,从上文的语音识别的基本理论我们己经知道,该模块的各项处理都为提取特征值做好充足的准备,模板库的制作也是基于该模块,对于输入的每一个PCM语音包(相当于获取外呼的语音数据),首先对其进行预加重处理,然后,对信号进行加窗处理,其次,为了保持语音信号的短时平稳性,需要继续进行分帧处理(相当于通过自动语音识别,对语音数据进行处理),经过上述前端处理后,接下来对每一帧语音信号提取相关特征(相当于将语音数据转换为特征数据);AM音匹配模块,把机器应答音从库中匹配合适的模板音和判断是否库外音,AM音匹配模块的主要任务是将输入的语音经过处理后,与库文件中的特征模板(相当于预存的特征信息)进行比较,选择出最为相近的一条语音作为匹配结果返回(相当于将特征数据与预存的特征信息进行匹配,以确定外呼的外呼结果)。
权利要求13与对比文件1相比,区别特征为:(1)权利要求13中是将语音数据转换为文本数据,将文本数据与预存的关键词信息进行匹配,以确定外呼的外呼结果,而对比文件1中是将语音数据转换为特征数据,将特征数据与预存的特征信息进行匹配,以确定外呼的外呼结果;(2)解析SIP协议数据包后还获取外呼的通话开始时间、通话结束时间、通话ID;(3)权利要求13中是当SIP协议数据包承载的消息的类型为响铃消息时,确定开始获取语音数据,其中响铃消息为180 Ringing消息,而对比文件1中是当SIP协议数据包承载的消息的类型为临时话路消息时,确定开始获取语音数据;(4)系统包括:处理器;以及存储器,用于存储所述处理器的可执行指令,其中所述处理器配置为经由执行所述可执行指令来执行上述方法步骤。基于上述区别特征可以确定,权利要求13相对于对比文件1实际要解决的技术问题是:提供了另一种语音数据匹配方式,如何获知通话时间并标识外呼通话,如何减少信令检测,以及如何完成方法步骤。
对于上述区别特征(1),对比文件1已经公开了对语音提示进行快速的语音识别与匹配,需要通过特征码或关键字匹配的方式,在几秒内完成语音匹配,以提高识别效率(参见正文第4.3.3.2节),也就是说,对比文件1已经公开了关键字匹配的方式。并且《导盲机器人定位与路径规划技术》一书中公开了以下内容(参见正文第114页):导盲机器人采用语音芯片型号为LD3320的语音识别模块,该语音识别芯片由STC10L08XE型号的单片机控制,当LD3320新芯片识别出用户发出的语音信号(相当于语音数据)后,将其转换为汉语拼音串(相当于文本数据)的形式(相当于语音数据转换为文本数据),传入到STC10L08XE中,然后STC10L08XE单片机通过内部程序将拼音串和关键词进行一一匹配,匹配完成后根据相应的匹配结果确定语音输出或相应动作的执行(相当于将文本数据与预存的关键词信息进行匹配,以确定外呼的外呼结果)。因此,将语音数据转换为文本数据,将文本数据与预存的关键词信息进行匹配,以确定外呼的外呼结果以完成关键字匹配的方式记载在该工具书中,属于公知常识。
对于上述区别特征(2),对本领域技术人员来说,为了获知通话时间,解析SIP协议数据包后还获取外呼的通话开始时间、通话结束时间是本领域的惯用手段,另外,本领域技术人员知晓,通话ID用于唯一地标识一次外呼通话,因此,为了标识外呼通话,解析SIP协议数据包后还获取外呼的通话ID也是本领域的惯用手段。
对于上述区别特征(3),根据对比文件1公开的内容“18X响应码说明通话正处在振铃阶段,但是这一步还无法确定结果,因为还需要根据是否带SDP确定下一步处理,如果18X带了SDP,表明进入了临时话路,则需要跳转到语音识别模块进行识别处理”可知:对比文件1公开的是在振铃阶段中的临时话路阶段获取语音数据,而本领域技术人员为了减少对信令的检测,避免继续检测18X是否携带SDP,在进入振铃阶段即检测到响铃消息18X响应码时就进行语音数据的获取是本领域的惯用手段。另外,本领域技术人员知晓,18x消息指的是180消息或183消息,该180消息为Ringing振铃消息,因此,采用180 Ringing响铃消息表示振铃阶段是本领域的惯用手段。
对于上述区别特征(4),对本领域技术人员来说,系统包括处理器以及存储器,存储器存储可执行指令,处理器执行可执行指令来执行上述方法步骤是本领域的惯用手段。
因此,在对比文件1的基础上结合上述惯用手段以获得该权利要求所要求保护的技术方案,对本领域技术人员来说是显而易见的。由此可见,该权利要求所要求保护的技术方案不具备突出的实质性特点和显著的进步,不符合专利法第22条第3款有关创造性的规定。
(三)对复审请求人相关意见的评述
对于复审请求人在答复复审通知书时陈述的意见,合议组认为:
首先,对比文件1确定获取语音数据的时间的方式是先确定进入振铃阶段,再确定进入振铃阶段的临时话路阶段,才获取语音数据,而本申请确定获取语音数据的时间的方式是在确定进入振铃阶段即获取语音数据,也就是说,对比文件1和本申请的方式均是在振铃阶段确定获取时间,而对比文件1为了确定更加精确地获取时间而对振铃阶段进行了进一步判断,即对比文件1比本申请复杂是为了确定更加精确的获取时间,因此,本领域技术人员在不需要确定更加精确的获取时间的基础上,可以想到把对比文件1中上述进一步判断的步骤省去,而与本申请一样直接在进入振铃阶段即获取数据,这是本领域的惯用手段,另外,在对比文件1已经公开了解析所述SIP协议数据包,确定获取语音数据的时间的基础上,为了获知通话时间、标识外呼通话,同时从解析的数据包获取通话开始时间、通话结束时间、外呼的通话ID是本领域的惯用手段。
其次,对比文件1已经公开了“接入网关(相当于语音网关):负责接入不同的媒体(线路),把电路信令转化为SIP信令,把话路转换为RTP话路”(参见正文第四章第4.1节第10-11行),因此,必然是从语音网关获取外呼的SIP信令即SIP协议数据包,并通过解析SIP协议数据包获取其包含的各个响应码,并确定响应码的类型,这属于隐含公开的内容。
最后,对比文件1中将语音数据的特征数据与预存的特征信息进行匹配,以确定外呼的外呼结果仅仅是一种语音数据匹配手段,本领域技术人员可以使用这种语音数据匹配手段,也可以使用其他语音数据匹配手段,中并不会产生相反的技术启示,并且对比文件1也公开了:“对语音提示进行快速的语音识别与匹配,需要通过特征码或关键字匹配的方式,在几秒内完成语音匹配,以提高识别效率”(参见正文第四章第4.3.3.2节),也就是说,对比文件1已经公开了关键字匹配的方式,而根据《导盲机器人定位与路径规划技术》一书可知:将语音数据转换为文本数据,将文本数据与预存的关键词信息进行匹配,以确定外呼的外呼结果以完成关键字匹配的方式是公知常识。
因此,对于复审请求人的意见,合议组不予支持。
三、决定
维持国家知识产权局于2019年03月20日对本申请作出的驳回决定。
如对本复审请求审查决定不服,根据专利法第41条第2款的规定,请求人自收到本决定之日起三个月内可以向北京知识产权法院起诉。
郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如作者信息标记有误,请第一时间联系我们修改或删除,多谢。