CN113079394A - Asr平台语音助手实现流媒体播放的方法、系统及终端 - Google Patents
Asr平台语音助手实现流媒体播放的方法、系统及终端 Download PDFInfo
- Publication number
- CN113079394A CN113079394A CN202110328824.1A CN202110328824A CN113079394A CN 113079394 A CN113079394 A CN 113079394A CN 202110328824 A CN202110328824 A CN 202110328824A CN 113079394 A CN113079394 A CN 113079394A
- Authority
- CN
- China
- Prior art keywords
- streaming media
- data
- media data
- voice
- receiving
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 34
- 238000004806 packaging method and process Methods 0.000 claims abstract description 15
- 238000004458 analytical method Methods 0.000 claims abstract description 6
- 230000005540 biological transmission Effects 0.000 claims description 7
- 230000008569 process Effects 0.000 claims description 4
- 238000007405 data analysis Methods 0.000 claims description 3
- 238000013500 data storage Methods 0.000 claims description 2
- 230000006870 function Effects 0.000 abstract description 3
- 230000009471 action Effects 0.000 description 3
- 230000003993 interaction Effects 0.000 description 2
- 230000006855 networking Effects 0.000 description 2
- 230000007547 defect Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/23—Processing of content or additional data; Elementary server operations; Server middleware
- H04N21/239—Interfacing the upstream path of the transmission network, e.g. prioritizing client content requests
- H04N21/2393—Interfacing the upstream path of the transmission network, e.g. prioritizing client content requests involving handling client requests
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/28—Constructional details of speech recognition systems
- G10L15/30—Distributed recognition, e.g. in client-server systems, for mobile phones or network applications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/43—Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
- H04N21/437—Interfacing the upstream path of the transmission network, e.g. for transmitting client requests to a VOD server
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/223—Execution procedure of a spoken command
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Signal Processing (AREA)
- Telephonic Communication Services (AREA)
Abstract
本发明公开了一种基于ASR平台语音助手实现流媒体播放的方法、系统及终端;流媒体数据播放方法包括:获取语音数据,发送语音数据到网络服务器;网络服务器识别语音数据并返回识别结果;接收并解析识别结果;根据解析结果提取含有语音请求答案的流媒体数据链接,并把提取到的流媒体数据链接存储于本地的流媒体数据链接列表中;解析流媒体数据链接,并根据流媒体数据链接的协议类型要求封装请求数据包;将请求数据包放入发送环形队列缓存,并将请求数据包发送到网络服务器;下载流媒体数据存储于接收环形队列;播放流媒体数据。采用本发明的技术方案,可实现利用语音助手播放网络服务器上的流媒体数据,增加了产品功能的同时提升用户体验感。
Description
技术领域
本发明涉及人机交互技术领域,具体涉及基于ASR平台语音助手实现流媒体播放的方法、系统及终端。
背景技术
自动语音识别技术(Automatic Speech Recognition)是一种将人的语音转换为文本的技术。语音识别是一个多学科交叉的领域,它与声学、语音学、语言学、数字信号处理理论、信息论、计算机科学等众多学科紧密相连。由于语音信号的多样性和复杂性,语音识别系统只能在一定的限制条件下获得满意的性能,或者说只能应用于某些特定的场合。
市场上的消费类电子芯片平台解决方案中,提供的语音互动播放类APP中,大部分只支持播放本地音频文件,不支持在线实时播放流媒体数据。对于目前“万物皆联网”的时代,已然无法跟上步伐。
发明内容
为了解决上述现有技术的不足,本发明提供一种基于ASR平台语音助手实现流媒体播放的方法,并具体提供如下技术方案:
一种基于ASR平台语音助手实现流媒体播放的方法,其特征在于,包括以下步骤:S1:获取语音数据,并发送所述语音数据到网络服务器;S2:网络服务器识别语音数据并返回识别结果;S3:接收并解析所述识别结果;S4:根据解析结果提取含有语音请求答案的流媒体数据链接,并把提取到的流媒体数据链接存储于本地的流媒体数据链接列表中;S5:解析所述流媒体数据链接,并根据所述流媒体数据链接的协议类型要求封装请求数据包;S6:将所述请求数据包放入发送环形队列缓存,并将所述请求数据包发送到网络服务器;S7:下载流媒体数据存储于接收环形队列;S8:播放所述流媒体数据。
进一步地,在步骤S1中,包括以下步骤:S11:获取语音数据缓存于发送数据队列;S12:将发送数据队列中的语音数据发送到网络服务器;S13:重复步骤S11和S12直至所有语音数据发送至网络服务器。
进一步地,在步骤S3之前,包括如下步骤:A1:启动第一接收超时定时器;A2:若超过所述第一接收超时定时器的预定时间未收到识别结果,则停止所述第一接收超时定时器,同时反馈识别失败信息,并返回步骤S1;若在所述第一接收超时定时器的预定时间内收到识别结果,则执行步骤S3。
进一步地,在步骤S4中,提取到含有语音请求答案的流媒体数据链接后,判断所述流媒体数据链接是否存在,若存在,则把提取到的流媒体数据链接存储于本地的流媒体数据链接列表中;若不存在,则反馈识别失败信息,并返回步骤S1。
进一步地,在步骤S5中,解析流媒体数据链接包括判断所述流媒体数据链接的协议类型是否为http或https协议;若是,则根据所述流媒体数据链接的协议类型要求封装请求数据包;若否,则反馈所述流媒体数据链接的协议类型暂不支持的信息,并返回步骤S1。
进一步地,在步骤S6后,步骤S7前,执行以下步骤:B1:启动接收Task,并启动第二接收超时定时器;B2:若超过所述第二接收超时定时器的预定时间未收到流媒体数据,则反馈接收网络数据超时信息,并返回步骤S1;若在所述第二接收超时定时器的预定时间内收到流媒体数据,则执行步骤S7。
进一步地,在步骤S7中,包括以下步骤:S71:请求下载流媒体链接中的一帧未被下载的流媒体数据;S72:下载流媒体数据存储与接收环形队列;S73:检查接收环形队列是否已满;若是,则执行步骤S8,同时继续检查接收环形队列是否已满,直至当前帧的流媒体数据下载完毕;若否,则继续执行步骤S72;S74:检查当前流媒体链接中是否有待下载的流媒体数据;若是没有,则执行步骤S75;若是有,则执行步骤S71;S75:检查本地流媒体数据数据链接列表中是否还有待下载链接;若是没有,则结束下载;若是有,则执行步骤S5。
进一步地,在执行步骤S71的同时,启动重发计数器,若超过所述第二接收超时定时器的预定时间未收到流媒体数据,则递增重发次数,并重发当前帧流媒体数据的下载请求;若重发次数超过预设的阀值,则停止所述第二接收定时器,停止接收Task,清除重发计数器,并反馈接收网络数据超时信息,返回步骤S1;若在重发次数预设的阀值内收到流媒体数据,则执行步骤S72。
另一方面,提供一种利用上述方法的流媒体数据播放系统,包括:语音录入单元,用于获取语音数据;封装数据及发送请求单元,用于把获取到的语音数据封装为网络服务器需要的数据并发送至网络服务器;接收网络数据单元,用于接收网络服务器反馈回来的数据;数据解析单元,用于解析接收到的网络数据并存储于环形队列中;播放单元,用于播放环形队列中的待播放流媒体数据。
另一方面,提供一种能够使用上述方法播放流媒体数据的移动终端设备。
采用本发明的技术方案,可实现利用语音助手播放网络服务器上的流媒体数据,实现一边下载一边播放功能,节约终端设备的内存。本发明增强了产品功能、提升用户体验感,增强产品竞争力。
附图说明
图1是本发明基于ASR平台语音助手实现流媒体播放的方法的流程图;
图2是本发明利用基于ASR平台语音助手实现流媒体播放的方法播放流媒体数据的系统。
具体实施方式
为更进一步阐述本发明的技术手段及技术效果,以下结合附图说明本发明的较佳实施例。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
一种移动终端设备,包括终端屏幕和联网模块,终端屏幕用于显示反馈信息与用户互动,联网模块用于与网络服务器建立连接并进行数据交互。该移动终端设备能够使用基于ASR平台语音助手实现流媒体播放的方法播放流媒体数据。
如图1所示,上述基于ASR平台语音助手实现流媒体播放的方法,包括以下步骤:
1、终端启动语音助手,用户采用语音助手录入语音。
2、终端获取语音数据缓存于发送数据队列,并将发送数据队列中的语音数据发送到网络服务器,进行预识别处理。在获取语音数据的同时,把已获取的语音数据发送到网络服务器,实现了边录音边发送,获取数据与发送数据同步进行。语音数据发送完毕后即启动第一接收超时定时器,第一接收超时定时器的预设时间为10秒。
3、网络服务器识别语音数据并返回识别结果。若终端超过第一接收超时定时器的预定时间未收到识别结果,则停止第一接收超时定时器,同时把对应信息显示到终端屏幕上,反馈识别失败信息,并返回步骤S1;若终端在所述第一接收超时定时器的预定时间内收到识别结果,则停止第一接收超时定时器并执行步骤4。
4、终端接收并解析识别结果,若解析结果为识别出错,则把对应信息显示在终端屏幕上,反馈识别错误信息,之后返回步骤2,等待用户新的操作;若解析结果为识别成功,则把识别到的语义信息显示在终端屏幕上,并执行步骤5。
5、终端根据解析结果提取含有语音请求答案的流媒体数据链接,判断流媒体数据链接是否存在,若存在,则把提取到的流媒体数据链接存储于本地的流媒体数据链接列表中,并执行步骤6;若不存在,则把对应信息显示在终端屏幕上,提示无法获取对应流媒体数据,本次识别失败,返回步骤1,等待用户进行新的操作。
6、终端从流媒体数据链接列表中取出数据,分析流媒体数据链接,并判断流媒体数据链接的协议类型是否为http或https协议;若是,则根据流媒体数据链接对应的协议类型要求封装请求数据包,之后执行步骤7;若否,则把对应信息显示在终端屏幕上,提示流媒体数据链接的协议类型暂不支持,本次识别失败,返回步骤1,等待用户进行新的操作。
7、终端将请求数据包放入发送环形队列缓存,并将请求数据包发送到网络服务器;同时启动接收Task,并启动第二接收超时定时器,第二接收超时定时器的预设时间为20秒,之后执行步骤8.
8、终端请求下载流媒体链接中的一帧未被下载的流媒体数据;若终端在第二接收超时定时器的预设时间内没有下载到流媒体数据,则停止第二接收超时定时器,停止接收Task,同时把对应信息显示在终端屏幕上,提示接收网络数据超时,返回步骤1,等待用户进行新的操作;若终端在第二接收超时定时器的预设时间内下载到流媒体数据,则将下载的流媒体数据存储于接收环形队列,接着执行步骤9。
9、终端播放流媒体数据,并检查接收环形队列是否已满;若是,则继续播放流媒体数据,同时继续检查接收环形队列是否已满,直至当前帧的流媒体数据下载完毕,接着执行步骤10;若否,则继续下载的流媒体数据存储于接收环形队列中,直至当前帧的流媒体数据下载完毕,接着执行步骤10。通过该步骤,可实现终端一边下载的同时一边播放,即“边传边播”;能够有效的节省终端的内存空间,降低终端产品的生产成本。
10、终端检查当前流媒体链接中是否有待下载的流媒体数据;若是有,则重复执行步骤9,直至当前流媒体数据链接中的流媒体数据全部下载完毕;若是没有,则执行步骤11。
11、终端检查本地流媒体数据数据链接列表中是否还有待下载链接;若是没有,则结束下载;若是有,则重复执行步骤8-10,直至本地流媒体数据链接列表中的流媒体数据链接含有的流媒体数据全部下载完毕。
在另一个实施例中,在步骤7执行后,步骤8执行前启动重发技术器,重发计数器的预设次数为3次。在执行步骤8时,若终端在第二接收超时定时器的预设时间内没有下载到流媒体数据,则递增重发次数,并重发当前帧流媒体数据的下载请求;若重发次数超过预设的阀值,则停止第二接收定时器,停止接收Task,清除重发计数器,并反馈接收网络数据超时信息,返回步骤1;若在重发次数预设的阀值内收到流媒体数据,则将下载的流媒体数据存储于接收环形队列,接着执行步骤9-11。
如图2所示,一种利用上述基于ASR平台语音助手实现流媒体播放的方法的流媒体数据播放系统,包括:
语音录入单元,用于获取语音数据;
封装数据及发送请求单元,用于把获取到的语音数据封装为网络服务器需要的数据并发送至网络服务器;
接收网络数据单元,用于接收网络服务器反馈回来的数据;
数据解析单元,用于解析接收到的网络数据并存储于环形队列中;
播放单元,用于播放环形队列中的待播放流媒体数据。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。
Claims (10)
1.一种基于ASR平台语音助手实现流媒体播放的方法,其特征在于,包括以下步骤:
S1:获取语音数据,并发送所述语音数据到网络服务器;
S2:网络服务器识别语音数据并返回识别结果;
S3:接收并解析所述识别结果;
S4:根据解析结果提取含有语音请求答案的流媒体数据链接,并把提取到的流媒体数据链接存储于本地的流媒体数据链接列表中;
S5:解析所述流媒体数据链接,并根据所述流媒体数据链接的协议类型要求封装请求数据包;
S6:将所述请求数据包放入发送环形队列缓存,并将所述请求数据包发送到网络服务器;
S7:下载流媒体数据存储于接收环形队列;
S8:播放所述流媒体数据。
2.如权利要求1所述的基于ASR平台语音助手实现流媒体播放的方法,其特征在于,在步骤S1中,包括以下步骤:
S11:获取语音数据缓存于发送数据队列;
S12:将发送数据队列中的语音数据发送到网络服务器;
S13:重复步骤S11和S12直至所有语音数据发送至网络服务器。
3.如权利要求2所述的基于ASR平台语音助手实现流媒体播放的方法,其特征在于,在步骤S3之前,包括如下步骤:
A1:启动第一接收超时定时器;
A2:若超过所述第一接收超时定时器的预定时间未收到识别结果,则停止所述第一接收超时定时器,同时反馈识别失败信息,并返回步骤S1;若在所述第一接收超时定时器的预定时间内收到识别结果,则执行步骤S3。
4.如权利要求3所述的基于ASR平台语音助手实现流媒体播放的方法,其特征在于,在步骤S4中,提取到含有语音请求答案的流媒体数据链接后,判断所述流媒体数据链接是否存在,若存在,则把提取到的流媒体数据链接存储于本地的流媒体数据链接列表中;若不存在,则反馈识别失败信息,并返回步骤S1。
5.如权利要求4所述的基于ASR平台语音助手实现流媒体播放的方法,其特征在于,在步骤S5中,解析流媒体数据链接包括判断所述流媒体数据链接的协议类型是否为http或https协议;若是,则根据所述流媒体数据链接的协议类型要求封装请求数据包;若否,则反馈所述流媒体数据链接的协议类型暂不支持的信息,并返回步骤S1。
6.如权利要求5所述的基于ASR平台语音助手实现流媒体播放的方法,其特征在于,在步骤S6后,步骤S7前,执行以下步骤:
B1:启动接收Task,并启动第二接收超时定时器;
B2:若超过所述第二接收超时定时器的预定时间未收到流媒体数据,则反馈接收网络数据超时信息,并返回步骤S1;若在所述第二接收超时定时器的预定时间内收到流媒体数据,则执行步骤S7。
7.如权利要求6所述的基于ASR平台语音助手实现流媒体播放的方法,其特征在于,在步骤S7中,包括以下步骤:
S71:请求下载流媒体链接中的一帧未被下载的流媒体数据;
S72:下载流媒体数据存储与接收环形队列;
S73:检查接收环形队列是否已满;若是,则执行步骤S8,同时继续检查接收环形队列是否已满,直至当前帧的流媒体数据下载完毕;若否,则继续执行步骤S72;
S74:检查当前流媒体链接中是否有待下载的流媒体数据;若是没有,则执行步骤S75;若是有,则执行步骤S71;
S75:检查本地流媒体数据数据链接列表中是否还有待下载链接;若是没有,则结束下载;若是有,则执行步骤S5。
8.如权利要求7所述的基于ASR平台语音助手实现流媒体播放的方法,其特征在于,在执行步骤S71的同时,启动重发计数器,若超过所述第二接收超时定时器的预定时间未收到流媒体数据,则递增重发次数,并重发当前帧流媒体数据的下载请求;若重发次数超过预设的阀值,则停止所述第二接收定时器,停止接收Task,清除重发计数器,并反馈接收网络数据超时信息,返回步骤S1;若在重发次数预设的阀值内收到流媒体数据,则执行步骤S72。
9.一种利用权利要求1-8中任一项所述基于ASR平台语音助手实现流媒体播放的方法的流媒体数据播放系统,其特征在于,包括:
语音录入单元,用于获取语音数据;
封装数据及发送请求单元,用于把获取到的语音数据封装为网络服务器需要的数据并发送至网络服务器;
接收网络数据单元,用于接收网络服务器反馈回来的数据;
数据解析单元,用于解析接收到的网络数据并存储于环形队列中;
播放单元,用于播放环形队列中的待播放流媒体数据。
10.一种移动终端设备,其特征在于,所述移动终端设备能够使用权利要求1-8中任一项所述的基于ASR平台语音助手实现流媒体播放的方法播放流媒体数据。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110328824.1A CN113079394A (zh) | 2021-03-27 | 2021-03-27 | Asr平台语音助手实现流媒体播放的方法、系统及终端 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110328824.1A CN113079394A (zh) | 2021-03-27 | 2021-03-27 | Asr平台语音助手实现流媒体播放的方法、系统及终端 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113079394A true CN113079394A (zh) | 2021-07-06 |
Family
ID=76611068
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110328824.1A Pending CN113079394A (zh) | 2021-03-27 | 2021-03-27 | Asr平台语音助手实现流媒体播放的方法、系统及终端 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113079394A (zh) |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1798097A (zh) * | 2004-12-24 | 2006-07-05 | 腾讯科技(深圳)有限公司 | 一种缓存流媒体数据的方法 |
CN1947393A (zh) * | 2004-04-23 | 2007-04-11 | 摩托罗拉公司 | 会话发起协议重发方法 |
CN101937693A (zh) * | 2010-08-17 | 2011-01-05 | 深圳市子栋科技有限公司 | 基于语音命令的视音频播放方法及系统 |
CN102316361A (zh) * | 2011-07-04 | 2012-01-11 | 深圳市子栋科技有限公司 | 基于自然语音识别的音频/视频点播方法和系统 |
CN202289477U (zh) * | 2011-10-17 | 2012-07-04 | 安徽科大讯飞信息科技股份有限公司 | 一种通过无线网络进行语音播放的语音玩具终端设备 |
CN103067766A (zh) * | 2012-12-30 | 2013-04-24 | 深圳市龙视传媒有限公司 | 数字电视应用业务语音控制方法、系统及终端 |
CN106469558A (zh) * | 2015-08-21 | 2017-03-01 | 中兴通讯股份有限公司 | 语音识别方法及设备 |
CN108766436A (zh) * | 2018-05-31 | 2018-11-06 | 广州酷狗计算机科技有限公司 | 一种多媒体设备的语音控制方法及系统 |
-
2021
- 2021-03-27 CN CN202110328824.1A patent/CN113079394A/zh active Pending
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1947393A (zh) * | 2004-04-23 | 2007-04-11 | 摩托罗拉公司 | 会话发起协议重发方法 |
CN1798097A (zh) * | 2004-12-24 | 2006-07-05 | 腾讯科技(深圳)有限公司 | 一种缓存流媒体数据的方法 |
CN101937693A (zh) * | 2010-08-17 | 2011-01-05 | 深圳市子栋科技有限公司 | 基于语音命令的视音频播放方法及系统 |
CN102316361A (zh) * | 2011-07-04 | 2012-01-11 | 深圳市子栋科技有限公司 | 基于自然语音识别的音频/视频点播方法和系统 |
CN202289477U (zh) * | 2011-10-17 | 2012-07-04 | 安徽科大讯飞信息科技股份有限公司 | 一种通过无线网络进行语音播放的语音玩具终端设备 |
CN103067766A (zh) * | 2012-12-30 | 2013-04-24 | 深圳市龙视传媒有限公司 | 数字电视应用业务语音控制方法、系统及终端 |
CN106469558A (zh) * | 2015-08-21 | 2017-03-01 | 中兴通讯股份有限公司 | 语音识别方法及设备 |
CN108766436A (zh) * | 2018-05-31 | 2018-11-06 | 广州酷狗计算机科技有限公司 | 一种多媒体设备的语音控制方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9699307B2 (en) | Method and system for automatically routing a telephonic communication | |
JP4167057B2 (ja) | 発信電話呼出しの状況を決定するスピーチ認識方法およびシステム | |
US8909538B2 (en) | Enhanced interface for use with speech recognition | |
JP6467554B2 (ja) | メッセージ送信方法、メッセージ処理方法及び端末 | |
CN109271130B (zh) | 音频播放方法、介质、装置和计算设备 | |
CN106789581A (zh) | 即时通讯方法、装置及系统 | |
US20140281994A1 (en) | Interactive method, terminal device and system for communicating multimedia information | |
CN107733876A (zh) | 一种流媒体字幕显示方法、移动终端及存储装置 | |
CN107911424A (zh) | 一种与客户端交互的点读功能实现系统、方法及智能手表 | |
CN110113298B (zh) | 数据传输方法、装置、信令服务器和计算机可读介质 | |
JP2005530455A (ja) | ユーザが通信デバイス電話会議中に一時保留状態にある間での補助情報伝送 | |
CN113079394A (zh) | Asr平台语音助手实现流媒体播放的方法、系统及终端 | |
CN106303754A (zh) | 一种音频数据播放方法及装置 | |
CN103841458B (zh) | 辅助信息推送方法及装置、辅助信息接收方法及装置 | |
US8370161B2 (en) | Responding to a call to action contained in an audio signal | |
CN109120993A (zh) | 语音识别方法、智能终端、语音识别系统及可读存储介质 | |
CN109194998A (zh) | 数据传输方法、装置、电子设备及计算机可读介质 | |
CN116455879A (zh) | 基于freeswitch与WebRTC技术进行NLP实时测试方法、装置、介质及设备 | |
CN114067842B (zh) | 客户满意度鉴别方法及装置、存储介质及电子设备 | |
CN113053374B (zh) | 一种大屏幕控制系统 | |
CN113271491B (zh) | 电子装置以及播放控制方法 | |
CN113965551B (zh) | 流媒体场景的测试方法、装置及系统、存储介质 | |
CN111490928A (zh) | 即时通信消息的读取和回复方法、装置,以及电子设备 | |
CN113852835A (zh) | 直播音频处理方法、装置、电子设备以及存储介质 | |
CN114285774A (zh) | 流量录制方法、装置、电子设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20210706 |
|
RJ01 | Rejection of invention patent application after publication |