CN106792048A - 一种识别智能电视用户语音命令的方法和装置 - Google Patents
一种识别智能电视用户语音命令的方法和装置 Download PDFInfo
- Publication number
- CN106792048A CN106792048A CN201611186388.4A CN201611186388A CN106792048A CN 106792048 A CN106792048 A CN 106792048A CN 201611186388 A CN201611186388 A CN 201611186388A CN 106792048 A CN106792048 A CN 106792048A
- Authority
- CN
- China
- Prior art keywords
- current speech
- voice command
- identification
- speech order
- signal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 34
- 238000006243 chemical reaction Methods 0.000 claims abstract description 23
- 230000009466 transformation Effects 0.000 claims abstract description 11
- 230000008859 change Effects 0.000 claims description 17
- 238000012544 monitoring process Methods 0.000 claims description 16
- 238000001514 detection method Methods 0.000 claims description 11
- 238000012217 deletion Methods 0.000 claims description 4
- 230000037430 deletion Effects 0.000 claims description 4
- 239000000284 extract Substances 0.000 claims description 2
- 230000006870 function Effects 0.000 description 7
- 230000008569 process Effects 0.000 description 3
- 238000004590 computer program Methods 0.000 description 2
- 230000005611 electricity Effects 0.000 description 2
- 230000002452 interceptive effect Effects 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 241000725138 Banana bunchy top virus Species 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 238000013144 data compression Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/41—Structure of client; Structure of client peripherals
- H04N21/422—Input-only peripherals, i.e. input devices connected to specially adapted client devices, e.g. global positioning system [GPS]
- H04N21/42203—Input-only peripherals, i.e. input devices connected to specially adapted client devices, e.g. global positioning system [GPS] sound input device, e.g. microphone
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/223—Execution procedure of a spoken command
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- User Interface Of Digital Computer (AREA)
Abstract
本发明属于语音识别领域,提供了一种识别智能电视用户语音命令的方法和装置,以提高智能电视用户语音命令的识别率。所述方法包括:判断当前语音命令是否结束;若所述当前语音命令已经结束,则将所述当前语音命令添加语音命令结束标识;将所述添加了语音命令结束标识的当前语音命令进行语义转换,并按照所述语义转换得到的转换结果执行所述当前语音命令。本发提供的技术方案既能够确定当前语音命令已经结束,正常停止对语音命令的识别,又能够防止在语音信号静默阶段但语音命令尚未结束时错误地停止了对语音命令的识别,从而提高对语音命令的识别成功率。
Description
技术领域
本发明属于语音识别领域,尤其涉及一种识别智能电视用户语音命令的方法和装置。
背景技术
智能电视拥有传统电视厂商所不具备的应用平台优势。智能电视将实现网络搜索、IP电视、BBTV网视通、视频点播(VOD)、数字音乐、网络新闻、网络视频电话等各种应用服务。智能电视正在成为继计算机、手机之后的第三种信息访问终端,用户可随时访问自己需要的信息;电视机也将成为一种智能设备,实现电视、网络和程序之间跨平台搜索;智能电视还将是一个“娱乐中心”。
智能电视是基于互联网(Internet)浪潮冲击形成的新产品,其目的是带给用户更便捷的体验,目前已经成为电视的潮流趋势。由于智能电视具有全开放式平台,搭载了各操作系统,因此,用户在欣赏传统电视内容的同时,可自行安装和卸载各类应用软件,持续对功能进行扩充和升级;智能电视能够不断地给用户带来丰富的个性化体验。智能电视的语音控制到现在已经非常普及,仅需一个遥控器或手机多屏互动程序便能实现。语音控制需要电视强大的处理运算能力,首先需要通过遥控器或手机识别声音,将智能电视用户的语音命令转化为文字,再通过语音知识库来进行匹配识别,接着还需要系统自动执行相应的任务,进行音量调节、换台、切换模式等。
然而,现有的智能电视用户语音命令的识别方案中,由于语音命令录入的方式各有不同,例如语音、语速等存在差异,有时候系统没有截取到语音命令的尾音,致使系统提示语音命令识别失败。
对于上述问题,业界目前并没有提供好的解决方案。
发明内容
本发明的目的在于提供一种识别智能电视用户语音命令的方法和装置,以提高智能电视用户语音命令的识别率。
本发明第一方面提供一种识别智能电视用户语音命令的方法,所述方法包括:
判断当前语音命令是否结束;
若所述当前语音命令已经结束,则将所述当前语音命令添加语音命令结束标识;
将所述添加了语音命令结束标识的当前语音命令进行语义转换,并按照所述语义转换得到的转换结果执行所述当前语音命令。
本发明第二方面提供一种识别智能电视用户语音命令的装置,所述装置包括:
判断模块,用于判断当前语音命令是否结束;
标识添加模块,用于若所述判断模块的判断结果为所述当前语音命令已经结束,则将所述当前语音命令添加语音命令结束标识;
执行模块,用于将所述添加了语音命令结束标识的当前语音命令进行语义转换,并按照所述语义转换得到的转换结果执行所述当前语音命令。
从上述本发明技术方案可知,在判断当前语音命令已经结束后,将当前语音命令添加语音命令结束标识。将当前语音命令添加语音命令结束标识后,当后续信号处理逻辑检测到语音命令结束标识,则既能够确定当前语音命令已经结束,正常停止对语音命令的识别,又能够防止在语音信号静默阶段但语音命令尚未结束时错误地停止了对语音命令的识别,从而提高对语音命令的识别成功率。
附图说明
图1是本发明实施例一提供的识别智能电视用户语音命令的方法的实现流程示意图;
图2是本发明实施例二提供的识别智能电视用户语音命令的装置的结构示意图;
图3是本发明实施例三提供的识别智能电视用户语音命令的装置的结构示意图;
图4是本发明实施例四提供的识别智能电视用户语音命令的装置的结构示意图;
图5-a是本发明实施例五提供的识别智能电视用户语音命令的装置的结构示意图;
图5-b是本发明实施例六提供的识别智能电视用户语音命令的装置的结构示意图;
图5-c是本发明实施例七提供的识别智能电视用户语音命令的装置的结构示意图;
图6-a是本发明实施例八提供的识别智能电视用户语音命令的装置的结构示意图;
图6-b是本发明实施例九提供的识别智能电视用户语音命令的装置的结构示意图;
图6-c是本发明实施例十提供的识别智能电视用户语音命令的装置的结构示意图。
具体实施方式
为了使本发明的目的、技术方案及有益效果更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
本发明实施例提供一种识别智能电视用户语音命令的方法和装置,所述方法包括:判断当前语音命令是否结束;若所述当前语音命令已经结束,则将所述当前语音命令添加语音命令结束标识;将所述添加了语音命令结束标识的当前语音命令进行语义转换,并按照所述语义转换得到的转换结果执行所述当前语音命令。本发明实施例还提供相应的识别智能电视用户语音命令的装置。以下分别进行详细说明。
请参阅附图1,是本发明实施例一提供的识别智能电视用户语音命令的方法的实现流程示意图,主要包括以下步骤S101至步骤S103,详细说明如下:
S101,判断当前语音命令是否结束。
需要说明的是,在判断当前语音命令是否结束之前,系统有一个初始化的过程,具体地,设定语音识别引擎的基本工作环境,包括引擎、识别上下文、语法、音频和事件等的初始化,手机端使用多屏互动连接电视,智能电视用户通过智能电视的遥控器或手机进行语音操作,语音识别引擎进行语音录音输入,Start和Stop用来控制开始和停止接受语音识别,提取智能电视用户通过遥控器或手机输入的语音命令,并将语音命令进行数据压缩,通过网络发送到智能电视终端,等等。在本发明实施例中,判断当前语音命令是否结束可通过如下步骤S1011至S1013实现:
S1011,提取当前语音命令对应语音信号的最后一帧语音数据,并将当前语音命令对应语音信号的最后一帧语音数据设置为监测点。
具体而言,在收到用户通过遥控器或者智能手机传送过来的当前语音命令后,进行语音数据的完整性检测,即,将当前语音命令对应语音信号进行分帧处理,提取当前语音命令对应语音信号的最后一帧语音数据,并将当前语音命令对应语音信号的最后一帧语音数据设置为监测点。
S1012,检测监测点的功率电平。
S1013,若经步骤S1012的检测,监测点的功率电平与参考点的功率电平相等,则确定当前语音命令已经结束。
在本发明实施例中,参考点是设置当前语音命令对应语音信号在时间轴上的一个时刻,参考点的功率电平可以是底层提供的一个基准功率,其值可以是例如1000MVA。若监测点的功率电平与参考点的功率电平相等,则表明当前语音信号已经较弱,智能电视用户已经没再输入语音命令了,即当前语音命令已宣告结束。
S102,若判断当前语音命令已经结束,则将当前语音命令添加语音命令结束标识。
在本发明实施例中,之所以在判断当前语音命令已经结束后,还要强行将当前语音命令添加语音命令结束标识,是因为不添加这个语音命令结束标识,后续处理逻辑在收到当前语音命令时,可能无法确定当前语音命令其实已经结束,从而不能正常停止语音的识别。
作为本发明一个实施例,在判断当前语音命令已经结束后,将当前语音命令添加语音命令结束标识可以是:在当前语音命令对应语音信号的结束处添加零电平,这个零电平以尾部数据的方式附加在当前语音命令对应语音信号的结束处。
S103,将添加了语音命令结束标识的当前语音命令进行语义转换,并按照所述语义转换得到的转换结果执行所述当前语音命令。
在本发明实施例中,将添加了语音命令结束标识的当前语音命令进行语义转换可采用第三方引擎实现。在将添加了语音命令结束标识的当前语音命令进行语义转换后,按照语义转换得到的转换结果执行当前语音命令,例如,按照语义转换得到的转换结果进行功能查找,查找到匹配的功能后,进行页面跳转等操作。进一步地,在本发明实施例中,还可以将语义转换得到的转换结果,例如文本信息显示给智能电视用户,以便智能电视用户可以确认对当前语音命令的识别是否正确。
考虑到语音信号的静默阶段,即智能电视用户输入了语音命令的一部分后停顿一段时间会继续输入余下部分的语音命令,可能对语音命令的识别造成困扰,例如,错误地将静默阶段视为智能电视用户的当前语音命令已经输入结束,在本发明实施例中,将当前语音命令添加语音命令结束标识之后,将添加了语音命令结束标识的当前语音命令进行语义转换之前,还可以:删除已添加了语音命令结束标识的当前语音命令对应语音信号的无声音部分,具体可以通过如下方式实现,即:检测所述已添加了语音命令结束标识的当前语音命令对应语音信号的若干连续周期内信号的功率,若所述若干连续周期内信号的功率小于预设功率阈值且变化率小于预设变化率阈值,则截除所述功率小于预设功率阈值且变化率小于预设变化率阈值的若干连续周期内信号。
从上述附图1示例的识别智能电视用户语音命令的方法可知,在判断当前语音命令已经结束后,将当前语音命令添加语音命令结束标识。将当前语音命令添加语音命令结束标识后,当后续信号处理逻辑检测到语音命令结束标识,则既能够确定当前语音命令已经结束,正常停止对语音命令的识别,又能够防止在语音信号静默阶段但语音命令尚未结束时错误地停止了对语音命令的识别,从而提高对语音命令的识别成功率。
请参阅附图2,是本发明实施例二提供的识别智能电视用户语音命令的装置的结构示意图。为了便于说明,附图2仅示出了与本发明实施例相关的部分。附图2示例的识别智能电视用户语音命令的装置可以是附图1示例的识别智能电视用户语音命令的方法的执行主体,其主要包括判断模块201、标识添加模块202和执行模块203,其中:
判断模块201,用于判断当前语音命令是否结束;
标识添加模块202,用于若判断模块201的判断结果为当前语音命令已经结束,则将当前语音命令添加语音命令结束标识;
执行模块203,用于将添加了语音命令结束标识的当前语音命令进行语义转换,并按照语义转换得到的转换结果执行当前语音命令。
需要说明的是,以上附图2示例的识别智能电视用户语音命令的装置的实施方式中,各功能模块的划分仅是举例说明,实际应用中可以根据需要,例如相应硬件的配置要求或者软件的实现的便利考虑,而将上述功能分配由不同的功能模块完成,即将所述识别智能电视用户语音命令的装置的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。而且,实际应用中,本实施例中的相应的功能模块可以是由相应的硬件实现,也可以由相应的硬件执行相应的软件完成,例如,前述的判断模块,可以是具有执行前述判断当前语音命令是否结束的硬件,例如判断器,也可以是能够执行相应计算机程序从而完成前述功能的一般处理器或者其他硬件设备;再如前述的标识添加模块,可以是若判断模块(或判断器)的判断结果为当前语音命令已经结束,则将当前语音命令添加语音命令结束标识的硬件,例如标识添加器,也可以是能够执行相应计算机程序从而完成前述功能的一般处理器或者其他硬件设备(本说明书提供的各个实施例都可应用上述描述原则)。
附图2示例的判断模块201可以包括监测点设置单元301、第一检测单元302和确定单元303,如附图3所示本发明实施例三提供的识别智能电视用户语音命令的装置,其中:
监测点设置单元301,用于提取当前语音命令对应语音信号的最后一帧语音数据,并将当前语音命令对应语音信号的最后一帧语音数据设置为监测点;
第一检测单元302,用于检测监测点的功率电平;
确定单元303,用于若监测点的功率电平与参考点的功率电平相等,则确定当前语音命令已经结束。
附图2示例的标识添加模块202可以包括零电平添加单元401,如附图4所示本发明实施例四提供的识别智能电视用户语音命令的装置。零电平添加单元401用于在当前语音命令对应语音信号的结束处添加零电平。
附图2至4任一示例的识别智能电视用户语音命令的装置还可以包括无声信号删除模块501,如附图5-a至5-c任一示例提供的识别智能电视用户语音命令的装置。无声信号删除模块501用于标识添加模块202将当前语音命令添加语音命令结束标识之后,执行模块203将添加了语音命令结束标识的当前语音命令进行语义转换之前,删除已添加了语音命令结束标识的当前语音命令对应语音信号的无声音部分。
附图5-a至5-c任一示例的无声信号删除模块可以包括第二检测单元601和信号截除单元602,如附图6-a至6-c任一示例提供的识别智能电视用户语音命令的装置,其中:
第二检测单元601,用于检测已添加了语音命令结束标识的当前语音命令对应语音信号的若干连续周期内信号的功率;
信号截除单元602,用于若所述若干连续周期内信号的功率小于预设功率阈值且变化率小于预设变化率阈值,则截除所述功率小于预设功率阈值且变化率小于预设变化率阈值的若干连续周期内信号。
需要说明的是,上述装置各模块/单元之间的信息交互、执行过程等内容,由于与本发明方法实施例基于同一构思,其带来的技术效果与本发明方法实施例相同,具体内容可参见本发明方法实施例中的叙述,此处不再赘述。
本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序可以存储于一计算机可读存储介质中,存储介质可以包括:只读存储器(ROM,Read Only Memory)、随机存取存储器(RAM,RandomAccess Memory)、磁盘或光盘等。
以上对本发明实施例所提供的识别智能电视用户语音命令的方法和装置进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。
Claims (10)
1.一种识别智能电视用户语音命令的方法,其特征在于,所述方法包括:
判断当前语音命令是否结束;
若所述当前语音命令已经结束,则将所述当前语音命令添加语音命令结束标识;
将所述添加了语音命令结束标识的当前语音命令进行语义转换,并按照所述语义转换得到的转换结果执行所述当前语音命令。
2.如权利要求1所述的方法,其特征在于,所述判断当前语音命令是否结束,包括:
提取所述当前语音命令对应语音信号的最后一帧语音数据,并将所述最后一帧语音数据设置为监测点;
检测所述监测点的功率电平;
若所述监测点的功率电平与参考点的功率电平相等,则确定当前语音命令已经结束。
3.如权利要求1所述的方法,其特征在于,所述若所述当前语音命令已经结束,则将所述当前语音命令添加语音命令结束标识,包括:在所述当前语音命令对应语音信号的结束处添加零电平。
4.如权利要求1至3任意一项所述的方法,其特征在于,所述将所述当前语音命令添加语音命令结束标识之后,将所述添加了语音命令结束标识的当前语音命令进行语义转换之前,所述方法还包括:
删除所述已添加了语音命令结束标识的当前语音命令对应语音信号的无声音部分。
5.如权利要求4所述的方法,其特征在于,所述删除所述已添加了语音命令结束标识的当前语音命令对应语音信号的无声音部分,包括:
检测所述已添加了语音命令结束标识的当前语音命令对应语音信号的若干连续周期内信号的功率;
若所述若干连续周期内信号的功率小于预设功率阈值且变化率小于预设变化率阈值,则截除所述功率小于预设功率阈值且变化率小于预设变化率阈值的若干连续周期内信号。
6.一种识别智能电视用户语音命令的装置,其特征在于,所述装置包括:
判断模块,用于判断当前语音命令是否结束;
标识添加模块,用于若所述判断模块的判断结果为所述当前语音命令已经结束,则将所述当前语音命令添加语音命令结束标识;
执行模块,用于将所述添加了语音命令结束标识的当前语音命令进行语义转换,并按照所述语义转换得到的转换结果执行所述当前语音命令。
7.如权利要求6所述的装置,其特征在于,所述判断模块包括:
监测点设置单元,用于提取所述当前语音命令对应语音信号的最后一帧语音数据,并将所述最后一帧语音数据设置为监测点;
第一检测单元,用于检测所述监测点的功率电平;
确定单元,用于若所述监测点的功率电平与参考点的功率电平相等,则确定当前语音命令已经结束。
8.如权利要求6所述的装置,其特征在于,所述标识添加模块包括:
零电平添加单元,用于在所述当前语音命令对应语音信号的结束处添加零电平。
9.如权利要求6至8任意一项所述的装置,其特征在于,所述装置还包括:
无声信号删除模块,用于所述标识添加模块将所述当前语音命令添加语音命令结束标识之后,所述执行模块将所述添加了语音命令结束标识的当前语音命令进行语义转换之前,删除所述已添加了语音命令结束标识的当前语音命令对应语音信号的无声音部分。
10.如权利要求9所述的装置,其特征在于,所述无声信号删除模块包括:
第二检测单元,用于检测所述已添加了语音命令结束标识的当前语音命令对应语音信号的若干连续周期内信号的功率;
信号截除单元,用于若所述若干连续周期内信号的功率小于预设功率阈值且变化率小于预设变化率阈值,则截除所述功率小于预设功率阈值且变化率小于预设变化率阈值的若干连续周期内信号。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201611186388.4A CN106792048B (zh) | 2016-12-20 | 2016-12-20 | 一种识别智能电视用户语音命令的方法和装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201611186388.4A CN106792048B (zh) | 2016-12-20 | 2016-12-20 | 一种识别智能电视用户语音命令的方法和装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN106792048A true CN106792048A (zh) | 2017-05-31 |
CN106792048B CN106792048B (zh) | 2020-08-14 |
Family
ID=58893974
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201611186388.4A Active CN106792048B (zh) | 2016-12-20 | 2016-12-20 | 一种识别智能电视用户语音命令的方法和装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN106792048B (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107919130A (zh) * | 2017-11-06 | 2018-04-17 | 百度在线网络技术(北京)有限公司 | 基于云端的语音处理方法和装置 |
CN108364652A (zh) * | 2018-01-16 | 2018-08-03 | 成都易讯呼科技有限公司 | 一种用于人工智能电话的智能语音对答交互控制系统 |
CN111081248A (zh) * | 2019-12-27 | 2020-04-28 | 安徽仁昊智能科技有限公司 | 一种人工智能语音识别装置 |
CN111857041A (zh) * | 2020-07-30 | 2020-10-30 | 东莞市易联交互信息科技有限责任公司 | 一种智能设备的运动控制方法、装置、设备和存储介质 |
CN112825248A (zh) * | 2019-11-19 | 2021-05-21 | 阿里巴巴集团控股有限公司 | 语音处理方法、模型训练方法、界面显示方法及设备 |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1571536A (zh) * | 2003-07-19 | 2005-01-26 | 华为技术有限公司 | 实现半双工ip语音通信的方法 |
CN1601604A (zh) * | 2003-09-19 | 2005-03-30 | 株式会社Ntt都科摩 | 说话时段检测设备及方法、语音识别处理设备 |
CN1628339A (zh) * | 2001-11-30 | 2005-06-15 | 英特尔公司 | 一种在声音信道上进行语音识别的方法和装置 |
CN1819017A (zh) * | 2004-12-13 | 2006-08-16 | Lg电子株式会社 | 提取特征向量用于语音识别的方法 |
CN102299988A (zh) * | 2010-06-24 | 2011-12-28 | 杭州华三通信技术有限公司 | 一种电话录音的实现方法和装置 |
CN104702576A (zh) * | 2013-12-09 | 2015-06-10 | 腾讯科技(深圳)有限公司 | 语音传输方法、装置和语音服务系统 |
CN105551483A (zh) * | 2015-12-11 | 2016-05-04 | 百度在线网络技术(北京)有限公司 | 语音识别的建模方法和装置 |
CN105632498A (zh) * | 2014-10-31 | 2016-06-01 | 株式会社东芝 | 生成会议记录的方法、装置和系统 |
CN105869446A (zh) * | 2016-03-29 | 2016-08-17 | 广州阿里巴巴文学信息技术有限公司 | 一种电子阅读装置和语音阅读加载方法 |
-
2016
- 2016-12-20 CN CN201611186388.4A patent/CN106792048B/zh active Active
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1628339A (zh) * | 2001-11-30 | 2005-06-15 | 英特尔公司 | 一种在声音信道上进行语音识别的方法和装置 |
CN1571536A (zh) * | 2003-07-19 | 2005-01-26 | 华为技术有限公司 | 实现半双工ip语音通信的方法 |
CN1601604A (zh) * | 2003-09-19 | 2005-03-30 | 株式会社Ntt都科摩 | 说话时段检测设备及方法、语音识别处理设备 |
CN1819017A (zh) * | 2004-12-13 | 2006-08-16 | Lg电子株式会社 | 提取特征向量用于语音识别的方法 |
CN102299988A (zh) * | 2010-06-24 | 2011-12-28 | 杭州华三通信技术有限公司 | 一种电话录音的实现方法和装置 |
CN104702576A (zh) * | 2013-12-09 | 2015-06-10 | 腾讯科技(深圳)有限公司 | 语音传输方法、装置和语音服务系统 |
CN105632498A (zh) * | 2014-10-31 | 2016-06-01 | 株式会社东芝 | 生成会议记录的方法、装置和系统 |
CN105551483A (zh) * | 2015-12-11 | 2016-05-04 | 百度在线网络技术(北京)有限公司 | 语音识别的建模方法和装置 |
CN105869446A (zh) * | 2016-03-29 | 2016-08-17 | 广州阿里巴巴文学信息技术有限公司 | 一种电子阅读装置和语音阅读加载方法 |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107919130A (zh) * | 2017-11-06 | 2018-04-17 | 百度在线网络技术(北京)有限公司 | 基于云端的语音处理方法和装置 |
US11024332B2 (en) | 2017-11-06 | 2021-06-01 | Baidu Online Network Technology (Beijing) Co., Ltd. | Cloud-based speech processing method and apparatus |
CN108364652A (zh) * | 2018-01-16 | 2018-08-03 | 成都易讯呼科技有限公司 | 一种用于人工智能电话的智能语音对答交互控制系统 |
CN112825248A (zh) * | 2019-11-19 | 2021-05-21 | 阿里巴巴集团控股有限公司 | 语音处理方法、模型训练方法、界面显示方法及设备 |
CN111081248A (zh) * | 2019-12-27 | 2020-04-28 | 安徽仁昊智能科技有限公司 | 一种人工智能语音识别装置 |
CN111857041A (zh) * | 2020-07-30 | 2020-10-30 | 东莞市易联交互信息科技有限责任公司 | 一种智能设备的运动控制方法、装置、设备和存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN106792048B (zh) | 2020-08-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107437415B (zh) | 一种智能语音交互方法及系统 | |
CN106792048A (zh) | 一种识别智能电视用户语音命令的方法和装置 | |
US8532992B2 (en) | System and method for standardized speech recognition infrastructure | |
CN108509619B (zh) | 一种语音交互方法及设备 | |
US9767805B2 (en) | Voice recognition method, voice controlling method, information processing method, and electronic apparatus | |
CN107909998B (zh) | 语音指令处理方法、装置、计算机设备和存储介质 | |
CN103280216B (zh) | 改进依赖上下文的语音识别器对环境变化的鲁棒性 | |
US11727939B2 (en) | Voice-controlled management of user profiles | |
CN103841268A (zh) | 信息处理方法和信息处理装置 | |
CN107516526A (zh) | 一种声源跟踪定位方法、装置、设备和计算机可读存储介质 | |
CN111627423B (zh) | Vad尾点检测方法、装置、服务器和计算机可读介质 | |
CN112286485B (zh) | 通过语音控制应用的方法、装置、电子设备与存储介质 | |
CN111341315B (zh) | 语音控制方法、装置、计算机设备和存储介质 | |
CN109360551B (zh) | 一种语音识别方法及装置 | |
CN110660385A (zh) | 一种命令词检测方法及电子设备 | |
US11580974B2 (en) | Method for exiting a voice skill, apparatus, device and storage medium | |
CN113393844A (zh) | 一种语音质检的方法、装置及网络设备 | |
CN113590871A (zh) | 一种音频分类方法、装置及计算机可读存储介质 | |
CN108281145A (zh) | 语音处理方法、语音处理装置和电子设备 | |
CN112885341A (zh) | 一种语音唤醒方法、装置、电子设备和存储介质 | |
CN116721662B (zh) | 音频处理方法、装置、存储介质及电子设备 | |
CN112037772B (zh) | 基于多模态的响应义务检测方法、系统及装置 | |
US20220122593A1 (en) | User-friendly virtual voice assistant | |
CN116013257A (zh) | 语音识别、语音识别模型训练方法、装置、介质及设备 | |
CN113674744A (zh) | 语音转写方法、装置、拾音转写设备与存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
CB02 | Change of applicant information |
Address after: 516006 TCL technology building, No.17, Huifeng Third Road, Zhongkai high tech Zone, Huizhou City, Guangdong Province Applicant after: TCL Technology Group Co.,Ltd. Address before: 516006 Guangdong province Huizhou Zhongkai hi tech Development Zone No. nineteen District Applicant before: TCL RESEARCH AMERICA Inc. |
|
CB02 | Change of applicant information | ||
GR01 | Patent grant | ||
GR01 | Patent grant |