一种录音处理方法及终端-复审决定--河南专利网

发明创造名称：一种录音处理方法及终端
外观设计名称：
决定号：182066
决定日：2019-06-24
委内编号：1F279161
优先权日：
申请（专利）号：201610509141.5
申请日：2016-06-29
复审请求人：维沃移动通信有限公司
无效请求人：
授权公告日：
审定公告日：
专利权人：
主审员：刘世茹
合议组组长：赵晓晴
参审员：吴志彪
国际分类号：H04S5/00,H04S7/00
外观设计分类号：
法律依据：专利法第二十二条第三款
决定要点：如果权利要求的技术方案和作为最接近的现有技术的对比文件相比具有区别特征，现有技术没有给出将上述区别特征应用于该对比文件从而得到该技术方案的技术启示，上述区别特征也不属于本领域公知常识，并且包含上述区别特征的技术方案能够带来有益的技术效果，则该权利要求具有突出的实质性特点和显著的进步，具备创造性。
全文：
本复审请求审查决定涉及申请号为201610509141.5，名称为“一种录音处理方法及终端”的发明专利申请（下称本申请）。申请人为维沃移动通信有限公司。本申请的申请日为2016年06月29日，公开日为2016年09月28日。
经实质审查，国家知识产权局实质审查部门于2018年12月29日发出驳回决定，驳回了本申请，其理由是：权利要求1-9不符合专利法第二十二条第三款的规定。驳回决定针对的审查文本为：2018年12月05日提交的权利要求书第1-9项；申请日2016年06月29日提交的说明书第1-80段（即第1-7页），说明书附图第1-4页，说明书摘要和摘要附图。驳回决定采用的对比文件为：对比文件2，CN102483928A，公开日为2012年05月30日。驳回决定所针对的权利要求书的内容如下：
“1. 一种录音处理方法，应用于一终端，其特征在于，所述方法包括：
获取录音录像时摄像头采集的场景影像信息以及麦克风采集的声音信息；所述麦克风采集的声音信息为单声道声音信息；
根据所述场景影像信息获取场景影像中的每一声源的位置信息；
根据所述每一声源的位置信息以及播放录音时需要采用的多个声道，生成与每一所述声源的位置信息对应的声道系数信息；
根据所述声道系数信息，将所述麦克风采集的声音信息合成为多声道音频数据；
所述播放录音时需要采用的多个声道为用于播放录音的终端的左声道和右声道，所述根据所述每一声源的位置信息以及播放录音时需要采用的多个声道，生成与每一所述声源的位置信息对应的声道系数信息的步骤包括：
当声源的位置信息表示所述声源位于场景影像的左二分之一部分时，所述声源的位置信息对应的声道系数信息配置为采用左声道播放所述声源的声音信息；
当声源的位置信息表示所述声源位于场景影像的右二分之一部分时，所述声源的位置信息对应的声道系数信息配置为采用右声道播放所述声源的声音信息；
或者
所述根据所述每一声源的位置信息以及播放录音时需要采用的多个声道，生成与每一所述声源的位置信息对应的声道系数信息的步骤包括：
根据所述声源的位置信息，计算所述声源在场景影像的横向方向上的比例系数；
根据所述声源在场景影像的横向方向上的比例系数，计算左声道和右声道所占的系数信息，得到所述声源的位置信息对应的声道系数信息；
所述录音处理方法由所述终端在录音录像时执行。
2. 根据权利要求1所述的录音处理方法，其特征在于，所述将所述麦克风采集的声音信息合成为多声道音频数据的步骤之后，还包括：
播放所述多声道音频数据。
3. 根据权利要求1所述的录音处理方法，其特征在于，所述终端包括所述摄像头和所述麦克风，所述获取录音录像时所述摄像头采集的场景影像信息以及所述麦克风采集的声音信息的步骤之前，还包括：
当接收到打开录音录像功能的请求时，开启所述摄像头采集场景影像信息，以及开启所述麦克风采集声音信息。
4. 根据权利要求3所述的录音处理方法，其特征在于，所述录音录像功能为终端中的摄像应用软件中的录音录像功能或者为所述终端中的实时通信应用软件中的录音录像功能。
5. 根据权利要求1所述的录音处理方法，其特征在于，所述根据所述场景影像信息获取场景影像中的每一声源的位置信息的步骤包括：
根据所述场景影像信息，识别场景影像中的发声的生物体；
对所述场景影像中的发声的生物体进行面部识别，确定每一声源；
获取所述每一声源的位置信息。
6. 一种终端，其特征在于，包括：
获取模块，用于获取录音录像时摄像头采集的场景影像信息以及麦克风采集的声音信息；所述麦克风采集的声音信息为单声道声音信息；
位置信息获取模块，用于根据所述场景影像信息获取场景影像中的每一声源的位置信息；
声道系数确定模块，用于根据所述每一声源的位置信息以及播放录音时需要采用的多个声道，生成与所述每一声源的位置信息对应的声道系数信息；
合成模块，用于根据所述声道系数信息，将所述麦克风采集的声音信息合成为多声道音频数据；
所述播放录音时需要采用的多个声道为用于播放录音的终端的左声道和右声道；
所述声道系数确定模块，用于当声源的位置信息表示所述声源位于场景影像的左二分之一部分时，所述声源的位置信息对应的声道系数信息配置为采用左声道播放所述声源的声音信息；当声源的位置信息表示所述声源位于场景影像的右二分之一部分时，所述声源的位置信息对应的声道系数信息配置为采用右声道播放所述声源的声音信息；
或者
所述声道系数确定模块，用于根据所述声源的位置信息，计算所述声源在场景影像的横向方向上的比例系数；根据所述声源在场景影像的横向方向上的比例系数，计算左声道和右声道所占的系数信息，得到所述声源的位置信息对应的声道系数信息；
所述终端在录音录像时控制上述模块运行。
7. 根据权利要求6所述的终端，其特征在于，还包括：
播放模块，用于播放所述多声道音频数据。
8. 根据权利要求6所述的终端，其特征在于，还包括：
所述摄像头和所述麦克风；以及
控制模块，用于当接收到打开录音录像功能的请求时，控制所述摄像头开启并采集场景影像信息，以及控制所述麦克风开启并采集声音信息。
9. 根据权利要求6所述的终端，其特征在于，所述位置信息获取模块包括：
第一识别单元，用于根据所述场景影像信息，识别场景影像中的发声的生物体；
第二识别单元，用于对所述场景影像中的发声的生物体进行面部识别，确定每一声源；
获取单元，用于获取所述每一声源的位置信息。”
驳回决定的具体理由是：（1）独立权利要求1和对比文件2之间的区别特征在于：1）该权利要求中基于声源的位置信息生成对应的声道系数信息以合成多声道音频数据；2）所述根据所述每一声源的位置信息以及播放录音时需要采用的多个声道，生成与每一所述声源的位置信息对应的声道系数信息的步骤包括：当声源的位置信息表示所述声源位于场景影像的左二分之一部分时，所述声源的位置信息对应的声道系数信息配置为采用左声道播放所述声源的声音信息；当声源的位置信息表示所述声源位于场景影像的右二分之一部分时，所述声源的位置信息对应的声道系数信息配置为采用右声道播放所述声源的声音信息；或者根据所述声源的位置信息，计算所述声源在场景影像的横向方向上的比例系数；根据所述声源在场景影像的横向方向上的比例系数，计算左声道和右声道所占的系数信息，得到所述声源的位置信息对应的声道系数信息；3）该权利要求中所述录音处理方法由所述终端在录音录像时执行。上述区别特征属于本领域公知常识，因此权利要求1不符合专利法第二十二条第三款有关创造性的规定。（2）独立权利要求6与对比文件2之间的区别特征在于：1）该权利要求中基于声源的位置信息生成对应的声道系数信息以合成多声道音频数据；2）所述声道系数确定模块，用于当声源的位置信息表示声源位于场景影像的左二分之一时，将对应的声道系数信息配置为采用左声道播放声源的声音信息，而当声源的位置信息表示声源位于场景影像的右二分之一时，将对应的声道系数信息配置为采用右声道播放声源的声音信息；或者，根据声源的位置信息计算声源在场景影像的横向方向上的比例系数，进而计算左声道和右声道所占的系数信息，得到所述声源的位置信息对应的声道系数信息；3）所述终端在录音录像时控制上述模块运行。上述区别特征属于本领域公知常识，因此权利要求6不符合专利法第二十二条第三款有关创造性的规定。（3）权利要求2-5、7-9的附加技术特征或者被对比文件2公开或者属于本领域公知常识，在独立权利要求1和6不具备创造性的情况下，权利要求2-5、7-9也不符合专利法第二十二条第三款有关创造性的规定。
申请人（下称复审请求人）对上述驳回决定不服，于2019年04月12日向国家知识产权局提出了复审请求，没有提交任何修改文件。复审请求人认为：对比文件2并不是根据偏移量直接得到左右声道的相位差，而是需要执行多个步骤，才能得到左右声道的相位差，与本申请中根据比例系数直接得到声道系数信息不同，因此即使将对比文件2中的偏移量替换为比例系数，也是需要执行多个步骤才能得到相位差，对比文件2没有给出通过简化步骤、以节省终端计算量的启示，并且本申请和对比文件2之间的区别不属于本领域的公知常识，因此权利要求1具备突出的实质性特点和显著的进步，符合专利法第二十二条第三款的规定。
经形式审查合格，国家知识产权局于2019年04月17日依法受理了该复审请求，并将其转送至实质审查部门进行前置审查。
原实质审查部门在前置审查意见书中认为：对比文件2公开了根据拍摄对象在场景影像的横向方向上的偏移量即声源的位置信息生成多声道控制信息，利用声压等级差模拟地再现拍摄时的拍摄者与被拍摄体的距离感，因此能够有效地实现拍摄装置内的空间，虽然其实现根据位置信息生成声道控制信息的具体方法比较复杂，但是其所采用的具体方法是为了更准确地匹配声源的声音定位与声源在图像中的位置。而且对比文件2应用于小型装置，对于小型电子设备而言，减少功耗是本领域常见的技术问题，那么，本领域技术人员在面对这一问题时，为了在节约计算量以减少功耗的基础上实现声像一致性，本领域技术人员能够想到采用简单直接的方式来计算声道控制信息，例如，当声源位于图像的左二分之一时采用左声道播放，当声源位于图像的右二分之一时采用右声道播放，或者根据声源在图像的横向方向的比例系数来确定左右声道调整信息，这是本领域技术人员为了兼顾声像一致性和节约功耗而能够进行设置的。因此坚持驳回决定。
随后，国家知识产权局成立合议组对本案进行审理。
在上述程序的基础上，合议组认为本案事实已经清楚，可以作出审查决定。
决定的理由
（一）审查文本的认定
复审请求人于2019年04月12日提出复审请求时没有提交任何修改文件。本次复审请求审查决定针对的审查文本和驳回决定针对的审查文本相同，即：2018年12月05日提交的权利要求书第1-9项；申请日2016年06月29日提交的说明书第1-7页，说明书附图第1-4页，说明书摘要和摘要附图。
（二）关于创造性
专利法第二十二条第三款规定：创造性，是指与现有技术相比，该发明具有突出的实质性特点和显著的进步，该实用新型具有实质性特点和进步。
本复审请求审查决定引用的对比文件和驳回决定引用的对比文件相同，即：
对比文件2：CN102483928A，公开日为2012年05月30日。
1.权利要求1要求保护一种录音处理方法，对比文件2公开了一种声音数据合成装置（参见说明书第[0006]-[0007]、[0051]、[0061]-[0154]段，说明书附图1、3、8，权利要求1-3）：该装置用于搭载传声器的小型装置中，用于在多扬声器中再现通过传声器所得的声音数据的情况下，生成能够使音响效果提高的声音数据，声音数据合成装置具备：拍摄部、声音数据取得部、CPU所含的拍摄控制部、发音期间检测部、声音数据分离部、声音数据合成部、距离测定部、偏离量检测部、偏离角检测部、多声道增益计算部和多声道相位计算部。拍摄部，用于拍摄由光学系统形成的对象的像，并输出图像数据；声音数据取得部，是取得拍摄部周边的声音的传声器，将其所取得的声音的声音数据向CPU输出；发音期间检测部，基于通过拍摄部拍摄到的图像数据，检测从拍摄对象发出声音的发音期间，将表示发音期间的发音期间信息向声音数据分离部输出；声音数据分离部，基于通过声音数据取得部取得的声音数据，分离出从拍摄对象发出的对象声音数据和从该对象以外发出的声音即周围声音数据，然后将周围声音数据和对象声音数据输入至声音数据合成部；发音期间检测部对拍摄对象进行面部识别处理，检测拍摄对象的面部的位置信息，该位置信息输入至偏离量检测部，偏离量检测部基于该位置信息检测偏离量X，偏离角检测部基于从偏离量检测部所得的偏离量X和从拍摄控制部所得的焦点距离f，检测连结拍摄元件的拍摄面上的拍摄对象P的光学像P’和焦点的线与中心轴所成的偏离角θ，然后将该偏离角输出给多声道相位计算部；多声道相位计算部，基于通过偏离角检测部检测出的偏离角θ，计算对于发音期间中的多扬声器的每声道的声音数据赋予的相位调整量Δt；距离测定部基于从拍摄控制部输入的焦点位置，计算从被拍摄体到光学系统中的焦点为止的被拍摄体距离d，将其向多声道增益计算部输出；多声道增益计算部，基于通过距离测定部计算出的被拍摄体距离d，计算多扬声器的每声道的声音数据的增益；通过多声道增益计算部所得的增益和通过多声道相位计算部所得的相位调整量被输入于声音数据合成部，按向多扬声器输出的声音数据的每声道FR、FL、RR、RL，控制对象声音数据的增益和相位，将该对象声音数据与周围声音数据合成。
权利要求1与对比文件2相比区别特征在于：根据所述每一声源的位置信息以及播放录音时需要采用的多个声道，生成与每一所述声源的位置信息对应的声道系数信息，根据所述声道系数信息，将所述麦克风采集的声音信息合成为多声道音频数据，生成声道系数信息的步骤包括：当声源的位置信息表示所述声源位于场景影像的左二分之一部分时，所述声源的位置信息对应的声道系数信息配置为采用左声道播放所述声源的声音信息；当声源的位置信息表示所述声源位于场景影像的右二分之一部分时，所述声源的位置信息对应的声道系数信息配置为采用右声道播放所述声源的声音信息；或者所述根据所述每一声源的位置信息以及播放录音时需要采用的多个声道，生成与每一所述声源的位置信息对应的声道系数信息的步骤包括：根据所述声源的位置信息，计算所述声源在场景影像的横向方向上的比例系数；根据所述声源在场景影像的横向方向上的比例系数，计算左声道和右声道所占的系数信息，得到所述声源的位置信息对应的声道系数信息。基于上述区别特征，本申请权利要求1实际要解决的技术问题为如何更简单的获取现场感音效。
对于上述区别特征，合议组认为：本申请要解决的是现有的移动终端使用单个麦克风录音难以合成多声道声音的问题，随着移动终端技术的发展，人们常使用移动终端进行录音和录像，立体声录音和录像更能提高场景还原度，在移动终端的双喇叭或耳机场景下播放更为立体，立体声录音录像的常用方法是使用移动终端中的多个麦克风进行声音采集，但是移动终端的尺寸较小，如果配置多个麦克风，麦克风的距离较近，声音定位差，录音录像效果并不好，因此本申请提出了一种技术方案，可以基于声源在场景影像中的位置信息来生成多声道的声道系数信息，根据该声道系数信息将单个麦克风采集的声音信息合成为多声道音频数据。对比文件2也是提供了一种声音数据合成装置，其也可以通过声源的位置信息来对传声器获取的声音数据进行合成，从而获取具有现场感的声音。但是其和本申请采用的技术手段不同，对比文件2需要根据拍摄对象的面部的位置信息来检测偏移量X，根据该偏移量X以及焦点距离获取光学像和焦点的线与中心轴所成的偏离角θ，多声道相位计算部基于偏离角计算对于发音期间中的多扬声器的每声道的声音数据赋予的相位调整量。由以上分析可知，对比文件2中为了获取现场感的声音，需要复杂的计算获得相位调整量，计算量非常大而且复杂，而在本申请中只需要简单的方法即可计算出声道系数，计算量非常小，可以极大节省终端系统资源的占用比例，并且在对比文件2中也没有给出通过简化步骤以节省终端计算量的启示，且上述区别特征对于本领域技术人员来说并不属于本领域公知常识，因此对于本领域技术人员来说根据对比文件2和公知常识的结合得到权利要求1的技术方案是非显而易见的，权利要求1具备突出的实质性特点和显著的进步，符合专利法第二十二条第三款有关创造性的规定。
权利要求6要求保护一种终端，其和权利要求1要求保护的方法相对应，基于同样的理由，权利要求6相对于对比文件2和公知常识的结合具备突出的实质性特点和显著的进步，符合专利法第二十二条第三款有关创造性的规定。
在权利要求1、6具备创造性的基础上，从属权利要求2-5、7-9同样也具备突出的实质性特点和显著的进步，符合专利法第二十二条第三款有关创造性的规定。
三、决定
撤销国家知识产权局于2018年12月29日对本申请作出的驳回决定。由国家知识产权局实质审查部门在本复审请求审查决定针对的审查文本的基础上对本申请继续进行审查。
如对本复审请求审查决定不服，根据专利法第41条第2款的规定，复审请求人可以自收到本决定之日起三个月内向北京知识产权法院起诉。

郑重声明：本文版权归原作者所有，转载文章仅为传播更多信息之目的，如作者信息标记有误，请第一时间联系我们修改或删除，多谢。

相关文章阅读