直播视频的合成方法、装置及系统-复审决定


发明创造名称:直播视频的合成方法、装置及系统
外观设计名称:
决定号:183068
决定日:2019-07-08
委内编号:1F273652
优先权日:
申请(专利)号:201510127721.3
申请日:2015-03-23
复审请求人:阿里巴巴集团控股有限公司
无效请求人:
授权公告日:
审定公告日:
专利权人:
主审员:程华
合议组组长:郑直
参审员:盛钊
国际分类号:H04N21/234,H04N21/44,H04N21/472
外观设计分类号:
法律依据:专利法第二十二条第三款
决定要点:对比文件与权利要求技术方案的技术构思相同,本领域技术人员能够结合本领域公知常识,通过对对比文件中技术手段进行改进,从而解决权利要求实际要解决的技术问题,则认为现有技术整体上存在改进对比文件获得权利要求的技术方案的技术启示。
全文:
本复审请求涉及申请号为201510127721.3,名称为“直播视频的合成方法、装置及系统”的发明专利申请。申请人为阿里巴巴集团控股有限公司。本申请的申请日为2015年03月23日,公开日为2016年11月23日。
经实质审查,国家知识产权局原审查部门于2018年11月02日发出驳回决定,以本申请不符合专利法第二十二条第二、三款的规定为由驳回了本发明专利申请。驳回决定所依据的文本为:申请日2015年03月23日提交的说明书第1-9页,说明书附图1-6,权利要求第1-17项,说明书摘要以及摘要附图。引用的对比文件1是:CN1696923A,公开日为2005年11月16日。
驳回决定所针对的权利要求书如下:
“1. 一种直播视频的合成方法,其特征在于,所述方法包括:
在播放第一视频流时,通过视频采集设备采集第二视频流;
将所述第二视频流传输至服务器,以便所述服务器利用所述第二视频流与正在播放的所述第一视频流合并,形成直播的第三视频流;
接收所述服务器发送的所述第三视频流;
解析所述第三视频流,形成所述第三视频流的播放画面,播放所述第三视频流的播放画面。
2. 根据权利要求1所述的方法,其特征在于,所述第二视频流包括通过视频采集设备采集用户对所述第一视频流的播放画面的交互行为形成第二视频流。
3. 根据权利要求2所述的方法,其特征在于,所述交互行为包括语音交互行为和动作交互行为;
所述通过视频采集设备采集用户对所述第一视频流的播放画面的交互行为包括:
通过摄像头采集所述用户对所述第一视频流的播放画面的动作交互行为;以及,通过麦克风采集所述用户对所述第一视频流的语音交互数据。
4. 根据权利要求2所述的方法,其特征在于,所述交互行为包括动作交互行为;
所述通过视频采集设备采集用户对所述第一视频流的播放画面的交互行为包括:
通过摄像头采集所述用户对播放的画面的动作交互行为。
5. 根据权利要求1所述的方法,其特征在于,在接收所述服务器发送的所述第三视频流之后,还包括:
存储所述第三视频流;
当接收到播放所述第三视频流的操作时,解析所述第三视频流,形成所述第三视频流的播放画面,播放所述第三视频流的播放画面。
6. 一种直播视频的合成方法,其特征在于,所述方法包括:
在终端播放第一视频流时,接收所述终端传输的第二视频流,所述第二 视频流为所述终端通过视频采集设备采集的视频流;
利用所述第二视频流与所述第一视频流合并,形成直播的第三视频流;
将所述第三视频流传输给所述终端。
7. 根据权利要求6所述的方法,其特征在于,所述第二视频流为所述终端通过视频采集设备采集的用户对所述第一视频流进行交互而形成的视频流。
8. 根据权利要求6所述的方法,其特征在于,利用所述第二视频流与正在播放的第一视频流合并,形成直播的第三视频流,具体包括:
在所述第一视频流的播放画面中嵌入一个播放窗口;
按照所述第二视频流的时间标识,将所述第二视频流的播放画面添加到所述播放窗口中,且所述播放窗口的播放画面与所述第一视频流的播放画面具有相同的时间标识,形成所述第三视频流。
9. 根据权利要求6所述的方法,其特征在于,在将所述第三视频流传输给所述终端之前,还包括:
对形成的所述第三视频流的播放画面进行压缩,将压缩后的第三视频流传输给所述终端。
10. 一种直播视频的合成装置,其特征在于,所述装置包括:
采集单元,用于在播放第一视频流时,采集第二视频流;
传输单元,用于将所述采集单元采集到的所述第二视频流传输至服务器,以便所述服务器利用所述第二视频流与正在播放的所述第一视频流合并,形成直播的第三视频流;
接收单元,用于接收所述服务器发送的所述第三视频流;
处理单元,用于解析所述接收单元接收的所述第三视频流,形成所述第三视频流的播放画面,播放所述第三视频流的播放画面。
11. 根据权利要求10所述的装置,其特征在于,所述第二视频流包括采集的用户对所述第一视频流的播放画面的交互行为而形成的第二视频流;
所述交互行为包括语音交互行为和动作交互行为;所述采集单元包括摄像头和麦克风,所述摄像头采集所述用户对所述第一视频流的播放画面的动作交互行为,所述麦克风采集所述用户对所述第一视频流的语音交互数据;
或者,所述交互行为包括动作交互行为;所述采集单元包括摄像头,所述摄像头采集所述用户对所述第一视频流的播放画面的动作交互行为。
12. 根据权利要求10所述的装置,其特征在于,所述装置还包括:
存储单元,用于在所述接收单元接收到所述服务器发送的所述第三视频流之后,存储所述第三视频流;
当所述接收单元接收到播放所述第三视频流的操作时,所述处理单元解析所述第三视频流,形成所述第三视频流的播放画面,播放所述第三视频流的播放画面。
13. 一种直播视频的合成装置,其特征在于,所述装置包括:
接收单元,用于在终端播放第一视频流时,接收所述终端传输的第二视频流;
处理单元,用于利用所述接收单元接收的所述第二视频流与所述第一视频流合并,形成直播的第三视频流;
传输单元,用于将所述处理单元形成的所述第三视频流传输给所述终端。
14. 根据权利要求13所述的装置,其特征在于,所述第二视频流为所述终端通过视频采集设备采集的用户对所述第一视频流进行交互而形成的视频流。
15. 根据权利要求13所述的装置,其特征在于,所述处理单元具体包括:
嵌入子单元,用于在所述第一视频流的播放画面中嵌入一个播放窗口;
合并子单元,用于按照所述第二视频流的时间标识,将所述第二视频流的播放画面添加到所述播放窗口中,且所述播放窗口的播放画面与所述第一视频流的播放画面具有相同的时间标识,形成所述第三视频流。
16. 根据权利要求13所述的装置,其特征在于,所述处理单元还包括:
压缩子单元,用于在所述传输单元将所述第三视频流传输给所述终端之前,对形成的所述第三视频流的播放画面进行压缩;
所述传输单元将所述压缩子单元压缩后的第三视频流传输给所述终端。
17. 一种直播视频的合成系统,其特征在于,所述系统包括:服务器和 带有视频采集设备的终端;
所述终端在播放第一视频流时,通过视频采集设备采集第二视频流;
所述终端将所述第二视频流传输至所述服务器;
所述服务器利用所述第二视频流与正在播放的所述第一视频流合并,形成直播的第三视频流;
所述终端接收所述服务器发送的所述第三视频流;
所述终端解析所述第三视频流,形成所述第三视频流的播放画面,播放所述第三视频流的播放画面。”
驳回的具体理由是:权利要求1、2、4相对于对比文件1不具备新颖性,权利要求3、5-17相对于对比文件1和本领域惯用技术手段的结合不具备创造性。
申请人(下称复审请求人)对上述驳回决定不服,于2019年02月15日向国家知识产权局提出了复审请求,同时修改了权利要求书。复审请求人认为:本申请权利要求1涉及单侧撰写,各个步骤的执行主体是同一个终端。该终端与服务器交互,实现了直播的功能。对比文件1揭示的技术方案中,服务器对采集装置采集的各种实时媒体信息与演示课件合成的流文件是不能与教师当前授课情况同时显示。即服务器计算机系统并不会向演示课件的计算机发送任何视频流,而仅仅是接收演讲者演示端的提供的视频流、音频流等,进行合并。本申请中终端播放的第一视频流为服务器提供,终端可以向服务器提供第二视频流,服务器便可以将第一视频流和第二视频流合并形成第三视频流。本申请权利要求实际解决的技术问题包括:在针对使用者与在线视频交互过程进行直播的场景下,如何增强使用者与在线视频的交互性。对比文件1演讲者进行演讲的过程中,其使用的演示端并不会有任何的反馈,仅仅用于展示其所准备的课件,否则会影响在场听课的观众。
复审请求时修改的权利要求1、6、10、13、17内容如下:
“1. 一种直播视频的合成方法,其特征在于,所述方法应用于终端;所述方法包括:
所述终端在播放服务器提供的第一视频流时,通过所述终端的视频采集设备采集第二视频流;
所述终端将所述第二视频流传输至所述服务器,以便所述服务器利用所述第二视频流与正在播放的所述第一视频流合并,形成直播的第三视频流;
所述终端接收所述服务器发送的所述第三视频流;
所述终端解析所述第三视频流,形成所述第三视频流的播放画面,播放所述第三视频流的播放画面。”
“6. 一种直播视频的合成方法,其特征在于,所述方法应用于服务器,所述方法包括:
所述服务器在终端播放所述服务器提供的第一视频流时,接收所述终端传输的第二视频流,所述第二视频流为所述终端通过视频采集设备采集的视频流;
所述服务器利用所述第二视频流与所述第一视频流合并,形成直播的第三视频流;
所述服务器将所述第三视频流传输给所述终端。”
“10. 一种直播视频的播放装置,其特征在于,所述装置包括:
采集单元,用于在播放服务器提供的第一视频流时,采集第二视频流;
传输单元,用于将所述采集单元采集到的所述第二视频流传输至所述服务器,以便所述服务器利用所述第二视频流与正在播放的所述第一视频流合并,形成直播的第三视频流;
接收单元,用于接收所述服务器发送的所述第三视频流;
处理单元,用于解析所述接收单元接收的所述第三视频流,形成所述第三视频流的播放画面,播放所述第三视频流的播放画面。”
“13. 一种直播视频的合成装置,其特征在于,所述装置包括:
接收单元,用于在终端播放所述装置提供的第一视频流时,接收所述终端传输的第二视频流;
处理单元,用于利用所述接收单元接收的所述第二视频流与所述第一视频流合并,形成直播的第三视频流;
传输单元,用于将所述处理单元形成的所述第三视频流传输给所述终端。”
“17. 一种直播视频的合成系统,其特征在于,所述系统包括:服务器和带有视频采集设备的终端;
所述终端在播放所述服务器提供的第一视频流时,通过视频采集设备采集第二视频流;
所述终端将所述第二视频流传输至所述服务器;
所述服务器利用所述第二视频流与正在播放的所述第一视频流合并,形成直播的第三视频流;
所述终端接收所述服务器发送的所述第三视频流;
所述终端解析所述第三视频流,形成所述第三视频流的播放画面,播放所述第三视频流的播放画面。”
经形式审查合格,国家知识产权局于2019年02月20日依法受理了该复审请求,并将其转送至原审查部门进行前置审查。
原审查部门在前置审查意见书中坚持驳回决定。
随后,国家知识产权局成立合议组对本案进行审理。
合议组于2019年04月08日向复审请求人发出复审通知书,详细论述了权利要求1-17相对于对比文件1与本领域公知常识的结合不符合专利法第二十二条第三款规定的理由。针对复审请求人的意见,本案合议组认为:本申请的有益效果主要是通过在服务器端合成视频流,在当前播放的画面中添加用户的交互视频来实现的,从而提高直播视频流的播放效果,提高用户体验。上述技术特征都被对比文件1公开了。针对使用者与在线视频交互过程中进行直播的场景下,面对如何增强使用者与在线视频交互性的问题,例如针对来源于网络服务器的网络游戏,如何添加解说或动作指导的问题时,本领域技术人员有启示能够想到运用对比文件1在服务器合成数据流的技术从而将来源于服务器的网络游戏视频数据流和解说或动作指导的视频数据流在服务器合成,并将合成后的视频数据流返回给直播终端。
复审请求人于2019年05月21日提交了意见陈述书,但未修改申请文件。复审请求人认为:1、对比文件1不存在本申请解决的技术问题。对比文件1揭示的技术方案中,服务器对采集装置采集的各种实时媒体信息与演示课件合成的流文件是不需要与教师当前授课情况同时显示。2、所属领域技术人员没有动机在对比文件1的基础上结合区别技术特征。对比文件1本身是用于演讲、授课场景,如果将区别技术特征应用到对比文件1中,会使得演讲/授课现场的学生在看到现场演讲/授课老师的同时在演示端也显示演讲/授课老师,在课件的演示端还需要设置区域显示针对授课老师的视频流,使得课件的展示空间变小。从而使得教学效果变得更差、交互体验更差。本申请通过将视频合成是在云端服务器上进行处理的,用户可以通过自有的视频采集设备,简单地选择互动直播的方式,就可以进行视频直播,增强交互性,不需要购买专业的设备,非常简单方便。本申请权利要求1已经取得了显著的进步。
在上述程序的基础上,合议组认为本案事实已经清楚,可以作出审查决定。
决定的理由
(一)审查文本的认定
此次复审请求审查决定所依据的审查文本是:申请日2015年03月23日提交的说明书第1-9页,说明书附图1-6,说明书摘要以及摘要附图;2019年02月15日提交的权利要求第1-17项。
(二)具体理由的阐述
专利法第二十二条第三款规定:“创造性,是指与现有技术相比,该发明具有突出的实质性特点和显著的进步,实用新型具有实质性特点和进步。”
此次复审请求审查决定引用的对比文件与驳回决定、复审通知书中引用的相同,即
对比文件1:CN1696923A,公开日为2005年11月16日。
1、权利要求1请求保护一种直播视频的合成方法,对比文件1公开了一种网络上的多种媒体的同步合成存储发布系统及操作该系统的方法,具体公开了如下技术内容(参见对比文件1说明书第2页倒数第1行至第9页倒数第9行,第11页倒数第6行至第12页倒数第1行,附图1、5):操作并演示课件的计算机103通过网络连接与一服务器计算机系统105相连,网络上不特定数目的客户端将可通过通用的方式与服务器计算机系统105进行信息传输和交互。在所述操作并演示课件的计算机103内包含有用于演示课件的应用软件以及采集演讲者操作课件记录的后台记录装置104,所述服务器计算机系统105安装有用于演示所述预定格式课件的应用软件、用于接收视频音频信息的视频采集卡、视频采集软件、音频采集卡和音频采集软件,并包含有为接收的视频、音频和课件记录添加时间标记的时间添加装置106,将接收的多种媒体合成为一流文件的同步合成装置107和课件数据库108。摄像装置101和话筒102用于采集演讲者演讲的现场视频和音频,并传给服务器计算机系统105的视频、音频采集卡。
当演讲者所演示的课件为一非预定格式的文件时,如一个EXE文件,操作并演示课件的计算机103当中的后台记录装置104将以固定的一段时间设置为间隔对计算机103的显示画面进行截屏作为视频流发送给服务器系统105,作为更优选的方案,可以将固定的时间间隔和演讲者对该课件进行鼠标或键盘操作结合起来,作为触发截屏操作的信号。服务器计算机系统105中的时间添加装置106将为采集卡所采集的来自演讲者端摄像装置101和话筒102的演讲者画面和声音添加时间标记,同时也为计算机103发送的截屏数据的视频流添加时间标记。数据合成装置106利用该时间戳将上述多种媒体同步合成一个流媒体文件,存储于服务器计算机系统105的数据库108中。
当课件为一个非预定义格式的文件时,所述后台记录装置将发送课件截屏视频流,为了方便客户端即时点播,服务器可以将该截屏数据视频流和视频音频数据经过同步合成即时转发到各个客户端播放,同时将合成的流文件保存于数据库中,以待客户端稍后点播。
图5所示为根据本发明的一个具体实施例的客户端界面。该客户端主要功能是实时地显示服务器端转发过来的数据。客户端为一个含有控件的网页。该网页主要包括四个部分:视频播放器、媒体控制器、课件章节结构列表和课件播放器。所述视频播放器和媒体控制器,用于播放和控制解码后的视频音频流。
为了减少发送端演示课件计算机和各个课件接收客户端的负担,本发明所有的合成和存储功能都集中在服务器端实现,客户端仅通过访问服务器进行点播,服务器就会将所点播的文件流式传输到点播的客户端播放。在同步录制的同时,服务器端也可以对客户端做直播广播或者直播组播。同时将所生成的流文件统一存储于服务器的数据库中,也方便受众查找和点播。
由于本发明自定义的流文件保存格式采用单个文件形式进行保存,没有以文件夹的形式保存所以可以方便异地服务器自动调用和镜像。
由此可知,对比文件1的技术方案在演讲者演示端演示非预定义格式的课件时,抓取课件显示过程的屏幕数据,作为一段视频流,同时通过摄像装置采集演讲者演讲现场的视频信息,通过话筒采集演讲者演讲现场的音频信息;在服务器计算机系统端,接收视频信息、音频信息和抓取的视频流,以时间为同步合成标志将视频信息、音频信息和抓取的视频流进行同步合成,获得并保存单独的视频流文件。对比文件1中通过摄像装置采集演讲者演讲现场的视频信息与通过话筒采集演讲者演讲现场的音频信息形成的数据流相当于本申请中的第二视频流,在服务器同步合成的流媒体文件相当于本申请中的第三视频流。
经过对比分析可知,权利要求1与对比文件1的区别在于:所述终端在播放服务器提供的第一视频流;所述终端接收所述服务器发送的所述第三视频流,所述终端解析所述第三视频流,形成所述第三视频流的播放画面,播放所述第三视频流的播放画面。基于上述区别特征,权利要求1实际解决的技术问题是:在针对使用者与在线视频交互过程进行直播的场景下,如何增强使用者与在线视频的交互性。
由于对比文件1的技术方案主要是用于演讲、授课环境,演讲者/授课者自身提供讲稿或课件,并上传至服务器;对于合成后的视频流,使用者主要是其他用户终端。权利要求1的技术方案主要是用于网络游戏的解说,游戏视频流来源于网络服务器,直播终端只有在自身参与其中看到游戏画面时,即首先接收服务器提供的视频流,针对当前播放的来源于网络服务器的画面进行解说或动作指导,直播终端也可以同时看到合成后的视频流。因此导致了第一视频流的来源不同,以及直播终端接收并播放合成后的第三视频流。而两者均是在服务器中合成视频流,播放时可以看到讲解的视频画面,交互性体验好。
针对使用者与在线视频交互过程中进行直播的场景下,面对如何增强使用者与在线视频交互性的问题,例如针对来源于网络服务器的网络游戏,如何添加解说或动作指导的问题时,本领域技术人员有启示能够想到运用对比文件1在服务器合成数据流的技术从而将来源于服务器的网络游戏视频数据流和解说或动作指导的视频数据流在服务器合成,并将合成后的视频数据流返回给直播终端。此外,终端接收服务器发送的视频数据,解析后播放属于本领域的公知常识。
综上,在对比文件1的基础上结合本领域的公知常识得到权利要求1的技术方案对本领域技术人员而言是显而易见的。况且上述区别特征的运用也未能给权利要求1的技术方案带来预料不到的技术效果。因此,权利要求1的技术方案不具备突出的实质性特点和显著的进步,不符合专利法第二十二条第三款所规定的创造性。
2、权利要求2、3、4分别对其引用的权利要求做了进一步的限定。如上所述,对比文件1中已经公开了摄像装置采集现场的视频信息,通过话筒采集现场的音频信息,视频信息、音频信息均是针对播放的讲稿或课件用于与对象交互的信息。因此,在引用的权利要求不具备创造性的情况下,权利要求2、3、4的技术方案也不具备专利法第二十二条第三款所规定的创造性。
3、权利要求5对其引用的权利要求1做了进一步的限定。接收到的视频流先存储再根据播放操作进行解析和播放属于本领域的惯用手段。因此,在引用的权利要求不具备创造性的情况下,权利要求5的技术方案也不具备专利法第二十二条第三款所规定的创造性。
4、权利要求6请求保护一种直播视频的合成方法,对比文件1公开的具体技术内容参见第1条审查意见。
经过对比分析可知,权利要求6与对比文件1的区别在于:服务器传输第一视频流和第三视频流供终端播放。基于上述区别特征,权利要求6实际解决的技术问题是:在针对使用者与在线视频交互过程进行直播的场景下,如何增强使用者与在线视频的交互性。
由于对比文件1的技术方案主要是用于演讲、授课环境,演讲者/授课者自身提供讲稿或课件,并上传至服务器;对于合成后的视频流,使用者主要是其他用户终端。权利要求1的技术方案主要是用于网络游戏的解说,游戏视频流来源于网络服务器(即由服务器提供第一视频流),直播终端只有在自身参与其中看到游戏画面时,即首先接收服务器提供的视频流,针对当前播放的来源于网络服务器的画面进行解说或动作指导,直播终端也可以同时看到合成后的视频流(即服务器将第三视频流传输给所述终端)。因此导致了服务器为终端提供第一视频流并将合成后的第三视频流传输至终端供其播放。而两者均是在服务器中合成视频流,播放时可以看到讲解的视频画面,交互性体验好。
对于本领域技术人员来说,在服务器对视频流进行处理后,将处理后的视频流返回给视频发送终端以进行处理后的视频流的显示和处理效果检验属于本领域的惯用技术手段。针对使用者与在线视频交互过程中进行直播的场景下,面对如何增强使用者与在线视频交互性的问题,例如针对来源于网络服务器的网络游戏,如何添加解说或动作指导的问题时,本领域技术人员也有启示能够想到运用对比文件1在服务器合成数据流的技术从而将由服务器提供的网络游戏视频数据流和来自于直播终端的解说或动作指导的视频数据流在服务器合成,并将合成后的视频数据流传输给直播终端。
综上,在对比文件1的基础上结合本领域的惯用技术手段得到权利要求6的技术方案对本领域技术人员而言是显而易见的。况且上述区别特征的运用也未能给权利要求6的技术方案带来预料不到的技术效果。因此,权利要求6的技术方案不具备突出的实质性特点和显著的进步,不符合专利法第二十二条第三款所规定的创造性。
5、权利要求7对其引用的权利要求6做了进一步的限定。如上所述,对比文件1中已经公开了摄像装置采集现场的视频信息,视频信息是针对播放的讲稿或课件用于与对象交互的信息。因此,在引用的权利要求不具备创造性的情况下,权利要求7的技术方案也不具备专利法第二十二条第三款所规定的创造性。
6、权利要求8对其引用的权利要求6做了进一步的限定。对比文件1中已经公开了:“服务器计算机系统105中的时间添加装置106将为采集卡所采集的来自演讲者端摄像装置101和话筒102的演讲者画面和声音添加时间标记,同时也为计算机103发送的截屏数据的视频流添加时间标记。数据合成装置106利用该时间戳将上述多种媒体同步合成一个流媒体文件”(参见对比文件1说明书第8页最后一段),如附图5所示客户端界面中播放器显示视频和音频融合后的数据流,课件播放器显示课件视频数据流。而将合并的两个视频流以画中画的形式显示属于本领域的惯用技术手段。
在对比文件1的基础上结合本领域的惯用技术手段得到权利要求8的技术方案,对于本领域技术人员来说是显而易见的。因此,权利要求8不具备突出的实质性特点和显著的进步,不具备专利法第二十二条第三款所规定的创造性。
7、权利要求9对其引用的权利要求6做了进一步的限定。在传输视频流前对视频数据进行压缩属于本领域的惯用技术手段。在对比文件1的基础上结合本领域的惯用技术手段得到权利要求9的技术方案对于本领域技术人员来说是显而易见的。因此,权利要求9的技术方案不具备突出的实质性特点和显著的进步,不具备专利法第二十二条第三款所规定的创造性。
8、权利要求10请求保护一种直播视频的播放装置,对比文件1公开的具体技术内容参见第1条审查意见。其中操作并演示课件的计算机当中的后台记录装置将以固定的一段时间设置为间隔对计算机的显示画面进行截屏作为视频流发送给服务器系统。
经过对比分析可知,权利要求10与对比文件1的区别在于:播放装置播放服务器提供的第一视频流,播放装置的接收单元用于接收所述服务器发送的所述第三视频流;处理单元,用于解析所述接收单元接收的所述第三视频流,形成所述第三视频流的播放画面,播放所述第三视频流的播放画面。基于上述区别特征,权利要求10实际解决的技术问题是:在针对使用者与在线视频交互过程进行直播的场景下,如何增强使用者与在线视频的交互性。
由于对比文件1的技术方案主要是用于演讲、授课环境,演讲者/授课者自身提供讲稿或课件,并上传至服务器;对于合成后的视频流,使用者主要是其他用户终端。权利要求1的技术方案主要是用于网络游戏的解说,游戏视频流来源于网络服务器,直播终端只有在自身参与其中看到游戏画面时,即首先接收服务器提供的视频流,针对当前播放的来源于网络服务器的画面进行解说或动作指导,直播终端也可以同时看到合成后的视频流。因此导致了第一视频流是由服务器来提供的,以及播放终端接收并播放合成后的第三视频流。而两者均是在服务器中合成视频流,播放时可以看到讲解的视频画面,交互性体验好。
针对使用者与在线视频交互过程中进行直播的场景下,面对如何增强使用者与在线视频交互性的问题,例如针对来源于网络服务器的网络游戏,如何添加解说或动作指导的问题时,本领域技术人员有启示能够想到运用对比文件1在服务器合成数据流的技术从而将来源于服务器的网络游戏视频数据流和来源于播放装置的解说或动作指导的视频数据流在服务器合成,并将合成后的视频数据流返回给播放终端。此外,播放终端接收服务器发送的视频数据,解析处理后播放属于本领域的公知常识。
综上,在对比文件1的基础上结合本领域的公知常识得到权利要求10的技术方案对本领域技术人员而言是显而易见的。况且上述区别特征的运用也未能给权利要求10的技术方案带来预料不到的技术效果。因此,权利要求10的技术方案不具备突出的实质性特点和显著的进步,不符合专利法第二十二条第三款所规定的创造性。
9、权利要求11对其引用的权利要求10做了进一步的限定。如上所述,对比文件1中已经公开了摄像装置采集现场的视频信息,通过话筒采集现场的音频信息,视频信息、音频信息均是针对播放的讲稿或课件用于与对象交互的信息。因此,在引用的权利要求不具备创造性的情况下,权利要求11的技术方案也不具备专利法第二十二条第三款所规定的创造性。
10、权利要求12对其引用的权利要求10做了进一步的限定。对于本领域技术人员来说,接收到的视频流先存储再根据播放操作进行解析和播放均属于本领域的惯用技术手段。即在对比文件1的基础上结合本领域的惯用技术手段得到从属权利要求12所要求保护的技术方案,对于本领域技术人员来说是显而易见的。因此,权利要求12的技术方案不具备突出的实质性特点和显著的进步,不具备专利法第二十二条第三款所规定的创造性。
11、权利要求13请求保护一种直播视频的合成装置,对比文件1公开的具体技术内容参见第1条审查意见。其中在服务器中安装有用于接收视频音频信息的视频采集卡、视频采集软件、音频采集卡和音频采集软件,并包含有为接收的视频、音频和课件记录添加时间标记的时间添加装置,将接收的多种媒体合成为一流文件的同步合成装置。
经过对比分析可知,权利要求13的技术方案与对比文件1的区别在于:合成装置提供第一视频流,并将第三视频流传输给终端。基于上述区别特征,权利要求13实际解决的技术问题是:在针对使用者与在线视频交互过程进行直播的场景下,如何增强使用者与在线视频的交互性。
由于对比文件1的技术方案主要是用于演讲、授课环境,演讲者/授课者自身提供讲稿或课件,并上传至服务器;对于合成后的视频流,使用者主要是其他用户终端。权利要求1的技术方案主要是用于网络游戏的解说,游戏视频流来源于网络服务器(即由合成装置提供第一视频流),直播终端只有在自身参与其中看到游戏画面时,即首先接收服务器提供的视频流,针对当前播放的来源于网络服务器的画面进行解说或动作指导,直播终端也可以同时看到合成后的视频流(即合成装置将第三视频流传输给所述终端)。因此导致了合成装置为终端提供第一视频流并将合成后的第三视频流传输至终端供其播放。而两者均是在服务器中合成视频流,播放时可以看到讲解的视频画面,交互性体验好。
对于本领域技术人员来说,在合成装置对视频流进行处理后,将处理后的视频流返回给视频发送终端以进行处理后的视频流的显示和处理效果检验属于本领域的惯用技术手段。针对使用者与在线视频交互过程中进行直播的场景下,面对如何增强使用者与在线视频交互性的问题,例如针对来源于网络服务器的网络游戏,如何添加解说或动作指导的问题时,本领域技术人员也有启示能够想到运用对比文件1在服务器合成数据流的技术从而将由合成装置提供的网络游戏视频数据流和来自于直播终端的解说或动作指导的视频数据流在合成装置处合成,并将合成后的视频数据流传输给直播终端。
综上,在对比文件1的基础上结合本领域的惯用技术手段得到权利要求13的技术方案对本领域技术人员而言是显而易见的。况且上述区别特征的运用也未能给权利要求13的技术方案带来预料不到的技术效果。因此,权利要求13的技术方案不具备突出的实质性特点和显著的进步,不符合专利法第二十二条第三款所规定的创造性。
12、权利要求14对其引用的权利要求13做了进一步的限定。如上所述,对比文件1中已经公开了摄像装置采集现场的视频信息,视频信息是针对播放的讲稿或课件用于与对象交互的信息。因此,在引用的权利要求不具备创造性的情况下,权利要求14的技术方案也不具备专利法第二十二条第三款所规定的创造性。
13、权利要求15对其引用的权利要求13做了进一步的限定。对比文件1中已经公开了:“服务器计算机系统105中的时间添加装置106将为采集卡所采集的来自演讲者端摄像装置101和话筒102的演讲者画面和声音添加时间标记,同时也为计算机103发送的截屏数据的视频流添加时间标记。数据合成装置106利用该时间戳将上述多种媒体同步合成一个流媒体文件”(参见对比文件1说明书第8页最后一段),如附图5所示客户端界面中播放器显示视频和音频融合后的数据流,课件播放器显示课件视频数据流。而将合并的两个视频流以画中画的形式显示属于本领域的惯用技术手段。
在对比文件1的基础上结合本领域的惯用技术手段得到权利要求15的技术方案,对于本领域技术人员来说是显而易见的。因此,权利要求15不具备突出的实质性特点和显著的进步,不具备专利法第二十二条第三款所规定的创造性。
14、权利要求16对其引用的权利要求13做了进一步的限定。在传输视频流前对视频数据进行压缩属于本领域的惯用技术手段。在对比文件1的基础上结合本领域的惯用技术手段得到权利要求16的技术方案对于本领域技术人员来说是显而易见的。因此,权利要求16的技术方案不具备突出的实质性特点和显著的进步,不具备专利法第二十二条第三款所规定的创造性。
15、权利要求17请求保护一种直播视频的合成系统,对比文件1公开的具体技术内容参见第1条审查意见。
经过对比分析可知,权利要求17与对比文件1的区别在于:所述终端在播放服务器提供的第一视频流;所述终端接收所述服务器发送的所述第三视频流,所述终端解析所述第三视频流,形成所述第三视频流的播放画面,播放所述第三视频流的播放画面。基于上述区别特征,权利要求17实际解决的技术问题是:在针对使用者与在线视频交互过程进行直播的场景下,如何增强使用者与在线视频的交互性。
由于对比文件1的技术方案主要是用于演讲、授课环境,演讲者/授课者自身提供讲稿或课件,并上传至服务器;对于合成后的视频流,使用者主要是其他用户终端。权利要求1的技术方案主要是用于网络游戏的解说,游戏视频流来源于网络服务器(即由服务器提供第一视频流),直播终端只有在自身参与其中看到游戏画面时,即首先接收服务器提供的视频流,针对当前播放的来源于网络服务器的画面进行解说或动作指导,直播终端也可以同时看到合成后的视频流(即服务器将第三视频流传输给所述终端)。因此导致了第一视频流的来源不同,以及直播终端接收并播放合成后的第三视频流。而两者均是在服务器中合成视频流,播放时可以看到讲解的视频画面,交互性体验好。
针对使用者与在线视频交互过程中进行直播的场景下,面对如何增强使用者与在线视频交互性的问题,例如针对来源于网络服务器的网络游戏,如何添加解说或动作指导的问题时,,本领域技术人员有启示能够想到运用对比文件1在服务器合成数据流的技术从而将来源于服务器的网络游戏视频数据流和解说或动作指导的视频数据流在服务器合成,并将合成后的视频数据流返回给直播终端。此外,终端接收服务器发送的视频数据,解析后播放属于本领域的公知常识。
综上,在对比文件1的基础上结合本领域的公知常识得到权利要求17的技术方案对本领域技术人员而言是显而易见的。况且上述区别特征的运用也未能给权利要求17的技术方案带来预料不到的技术效果。因此,权利要求17的技术方案不具备突出的实质性特点和显著的进步,不符合专利法第二十二条第三款所规定的创造性。
(三)对复审请求人相关意见的评述
根据本申请说明书第[0029]段的记载:“本申请实施例提供的直播视频的合成方法及装置,利用视频采集设备采集用户针对当前播放的画面的交互行为,将采集到的视频流传输到服务器,可以针对当前播放的画面添加用户的交互视频,形成直播画面,实时性好,用户体验好,同时由于是在服务器中合成视频流,可以使得直播视频流的效果更好,画面更清晰”(参见本申请说明书第[0029]段),由此可知,本申请的有益技术效果主要是通过在服务器端合成视频流,在当前播放的画面中添加用户的交互视频来实现的,从而提高直播视频流的播放效果,提高用户体验。
上述技术特征都被对比文件1公开了:在服务器计算机系统端,接收视频信息、音频信息和抓取的视频流,以时间为同步合成标志将视频信息、音频信息和抓取的视频流进行同步合成,获得并保存单独的流文件。
对比文件1涉及的是一种网络上的多种媒体的同步合成存储发布系统及操作该系统的方法,其录制的现场视频和课件主要是针对网络上的客户端或事后回看,而非针对现场的观众或学生。客户端点播时不仅显示课件或讲稿内容,还播放演讲者或授课教师的的现场视频和音频,也是为了达到更好讲解效果,使得客户的交互体验更好。视频数据的合成也是在服务器平台完成的,用户不需要购买专业的设备,通过自有的视频采集设备将视频信息上传服务器即可,扩大了演讲或授课内容的传播。
针对使用者与在线视频交互过程中进行直播的场景下,面对如何增强使用者与在线视频交互性的问题,例如针对来源于网络服务器的网络游戏,如何添加解说或动作指导的问题时,本领域技术人员能够想到运用对比文件1在服务器合成数据流的技术从而将来源于服务器的网络游戏视频数据流和解说或动作指导的视频数据流在服务器合成,并将合成后的视频数据流返回给直播终端。

三、决定
维持国家知识产权局于2018年11月02日对本申请作出的驳回决定。
如对本复审请求审查决定不服,根据专利法第41条第2款的规定,请求人自收到本决定之日起三个月内向北京知识产权法院起诉。


郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如作者信息标记有误,请第一时间联系我们修改或删除,多谢。

留言与评论(共有 0 条评论)
   
验证码: