CN104217718A - 依据环境参数及群体趋向数据的语音识别方法和系统 - Google Patents
依据环境参数及群体趋向数据的语音识别方法和系统 Download PDFInfo
- Publication number
- CN104217718A CN104217718A CN201410446143.5A CN201410446143A CN104217718A CN 104217718 A CN104217718 A CN 104217718A CN 201410446143 A CN201410446143 A CN 201410446143A CN 104217718 A CN104217718 A CN 104217718A
- Authority
- CN
- China
- Prior art keywords
- voice
- environmental parameter
- colony
- feature database
- module
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Medical Treatment And Welfare Office Work (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
依据环境参数及群体趋向数据的语音识别方法和系统,首先,采集用户语音信息及与该语音信息相关的环境参数和身份识别信息,依据该身份识别信息进行用户的身份识别;其次,提取个人语音及行为习惯特征库中存储的该用户个人语音及行为习惯特征数据,结合提取群体语音及习惯特征库中存储的类似群体的群体语音及习惯特征数据,判断该语音信息适合哪些功能性语义分析模块,并将相关信息发送给这些语义分析模块进行单独或联合的语义解析,从而得到语义分析结果;最后,存储语义分析结果,并将语义分析结果及相关信息发送至个人语音及行为习惯特征库和群体语音及习惯特征库进行归类存储。本发明大幅度提高了语音识别的准确率。
Description
技术领域
本发明涉及语音识别领域,特别是一种依据环境参数及群体趋向数据的语音识别方法和系统。
背景技术
随着互联网和数字多媒体内容的发展,人与智能设备之间的交互成为重要研究方向。语音交互作为最自然方便的一种人机交互手段,是很多其他应用能够实现的基础,例如:语音拨号、语音导航,室内设备控制等等。其目标是将人类的语音中的词汇内容转换为计算机可读的输入,例如按键、二进制编码或者字符序列等。然而,语音识别的准确率一直是语音识别技术的瓶颈,主要原因在于人类对话时靠声音表达的信息只占小部分,更多的信息需要根据经验、视觉、触觉、嗅觉来提供,因此很有必要提出一种的依据语音环境等信息,提高语音识别准确率的语音识别方法和系统。
发明内容
本发明的主要目的在于克服现有技术中的上述缺点,提出一种提高语音识别准确率的依据环境参数及群体趋向数据的语音识别方法和系统。
本发明采用如下技术方案:
依据环境参数及群体趋向数据的语音识别方法,其特征在于:预先设置有个人语音及行为习惯特征库,群体语音及习惯特征库,以及多个功能性语义分析模块;该个人语音及行为习惯特征库是按照用户身份信息归类存储的数据库;该群体语音及习惯特征库用于存储提取自个人语音及行为习惯特征库的所有个人语音及行为习惯特征数据并按照多个维度记录的不同分类方法下的类似群体的语音特征和习惯特征;该功能性语义分析模块是将类似场景和类似群体中可能出现的语义构成集合,并按照出现概率的高低动态调整搜索方法和次序的功能模块;类似场景是依据环境参数的相似程度进行判定,类似群体是依据类似场景中,行为习惯的接近程度并结合用户信息的共同点进行判定,识别步骤如下:
首先,采集用户语音信息及与该语音信息相关的环境参数和身份识别信息,依据该身份识别信息进行用户的身份识别;
其次,依据身份识别信息提取个人语音及行为习惯特征库中存储的该用户个人语音及行为习惯特征数据,结合依据环境参数类型和身份识别信息类型提取群体语音及习惯特征库中存储的类似群体的群体语音及习惯特征数据,判断该语音信息适合哪些功能性语义分析模块,并将相关信息发送给这些语义分析模块进行单独或联合的语义解析,从而得到语义分析结果;
最后,存储语义分析结果,并将语义分析结果及相关信息发送至个人语音及行为习惯特征库和群体语音及习惯特征库进行归类存储,以不断完善该两个特征库的内容。
优选的,所述环境参数包括以下的一种或多种:时间、舆情、温度、湿度、亮度、气压、海拔、气味、噪音、磁场、物理位置及图像。
优选的,所述环境参数包括舆情,该舆情包括以下的一种或多种:互联网舆情、广播舆情及电视舆情。
优选的,所述的身份识别信息包括以下的一种或多种:生物信息、动作信息及电子信息。
优选的,所述相关信息至少包括提取到的用户个人语音及行为习惯特征数据、群体语音及习惯特征数据、环境参数和采集到的语音信息。
依据环境参数及群体趋向数据的语音识别系统,其特征在于:包括:
环境参数采集模块,用于采集来自环境参数检测部件的环境参数,并将采集到的环境参数的值进行标准化处理后送至语音采集及身份识别模块;
语音采集及身份识别模块,与环境参数采集模块和语音范围分析模块相连,用于采集来自语音及身份识别信息检测部件的用户语音信息和身份识别信息,并与环境参数一起发送至语义范围分析模块;
个人语音及行为习惯特征库,用于按照用户身份信息归类存储各类环境条件下的个人语音及行为习惯特征数据;
群体语音及习惯特征库,用于存储提取自所有用户的个人语音及行为习惯特征库的群体特征数据,并按照多个维度记录不同分类方法下的群体的语音特征和习惯特征;
语义范围分析模块,与个人语音及行为习惯特征库、群体语音及习惯特征库和多个功能性语义分析模块相连,依据身份识别信息提取个人语音及行为习惯特征库中存储的该用户个人语音及行为习惯特征数据,结合依据环境参数类型和身份识别信息类型提取群体语音及习惯特征库中存储的类似群体的群体语音及习惯特征数据,判断该语音文件适合哪些功能性语义分析模块,并将相关信息发送给这些语义分析模块进行单独或联合的语义解析;
功能性语义分析模块,均与语义识别结果输出模块相连,是将类似场景和类似群体中可能出现的语义构成集合,并按照出现概率的高低动态调整搜索方法和次序,用于执行语义解析;
语义识别结果输出模块,与个人语音及行为习惯特征库和群体语音及习惯特征库相连,用于存储功能性语义分析模块的语义分析结果,并将语义分析结果及相关信息发送给个人语音及行为习惯特征库和群体语音及习惯特征库进行归类存储。
优选的,所述的环境参数检测部件包括以下一种或多种:标准时间装置、舆情捕捉装置、温度检测装置、湿度检测装置、亮度检测装置、气压检测装置、海拔检测装置、气味检测装置、噪音检测装置、磁场检测装置、物理位置检测装置和图像捕捉及识别装置。
优选的,所述的环境参数检测部件包括舆情捕捉装置,该舆情捕捉装置包括以下一种或多种:互联网舆情捕捉装置、多频段无线电接收及音频采集识别装置、多频道电视信号采集及图形声音识别装置。
优选的,所述的身份识别信息检测部件包括以下一种或多种:生物信息识别装置、动作识别装置和电子信息识别装置。
由上述对本发明的描述可知,与现有技术相比,本发明具有如下有益效果:
本发明设置有群体语音及习惯特征库及个人语音及行为习惯特征库,依据环境参数信息补足视觉、触觉、嗅觉等需要的信息,再结合群体数据及个体历史数据来补足经验判断所需要的信息,再通过适合的单个或多个功能性语义分析模块进行语义分析,从而大幅度提高语音识别的准确率。
附图说明
图1为本发明系统的组成框图。
具体实施方式
以下通过具体实施方式对本发明作进一步的描述。
依据环境参数及群体趋向数据的语音识别方法,预先设置有个人语音及行为习惯特征库,群体语音及习惯特征库,以及多个功能性语义分析模块。该个人语音及行为习惯特征库是按照用户身份信息归类存储的数据库。该群体语音及习惯特征库用于存储提取自个人语音及行为习惯特征库的所有个人语音及行为习惯特征数据并按照多个维度记录的不同分类方法下的类似群体的语音特征和习惯特征。该功能性语义分析模块是将类似场景和类似群体中可能出现的语义构成集合,并按照出现概率的高低动态调整搜索方法和次序的功能模块。类似场景是依据环境参数(特定的物理地点、时间、上下文语境、舆情等)的相似程度进行判定,类似群体是依据类似场景中,行为习惯的接近程度并结合用户信息的共同点进行判定。该环境参数的具体相似程度和行为习惯的具体接近程度可预先设定,具体的舆情环境参数基于语义分析。类似事件序列及事件集群为近似环境。其它环境参数以当前检测参数及历史检测参数序列的相似性判断相似环境。行为习惯的相似性依据用户身份及个人信息、类似环境下语言、命令选择序列、动作序列来判断相似性具体识别步骤如下:
首先,采集用户语音信息及与该语音信息相关的环境参数和身份识别信息,依据该身份识别信息进行用户的身份识别。环境参数包括有以下几种:时间、舆情、温度、湿度、亮度、气压、海拔、气味、噪音、磁场、物理位置及图像等。其中,舆情包括互联网舆情、广播舆情及电视舆情,即对互联网、广播及电视中的内容进行识别、整理形成的舆情信息,(例如:新闻、电视剧、电影、小说等)。身份识别信息包括以下几种:生物信息、动作信息及电子信息,例如指纹、虹膜、手势、读卡器等。
其次,依据身份识别信息提取语义习惯特征库中存储的该用户个人语音及行为习惯特征数据,结合依据环境参数类型和身份识别信息类型提取群体语音及习惯特征库中存储的类似群体的群体语音及习惯特征数据,判断该语音信息适合哪些功能性语义分析模块,并将相关信息发送给这些语义分析模块进行单独或联合的语义解析,从而得到语义分析结果。该相关信息至少包括提取到的用户个人语音及行为习惯特征数据、群体语音及习惯特征数据、环境参数和采集到的语音信息。
最后,存储语义分析结果,并将语义分析结果及相关信息发送至个人语音及行为习惯特征库和群体语音及习惯特征库进行归类存储,以不断完善这两个数据库的内容。
本发明基于上述方法还提出依据环境参数及群体趋向数据的语音识别系统,参照图1,该系统具体包括如下装置:
环境参数采集模块,用于采集来自环境参数检测部件的环境参数,并将采集到的环境参数的值进行标准化处理后送至语音采集及身份识别模块。环境参数检测部件包括以下几种:标准时间装置、舆情捕捉装置、温度检测装置、湿度检测装置、亮度检测装置、气压检测装置、海拔检测装置、气味检测装置、噪音检测装置、磁场检测装置、物理位置检测装置和图像捕捉及识别装置。其中,舆情捕捉装置可配置以下几种:一种为可访问互联网的网络接口及互联网舆情捕捉装置;一种为多频段无线电信号接收及音频采集识别装置;一种为多频道电视信号采集及图形声音识别装置。用于对互联网、广播、电视中的内容进行识别、整理,形成舆情信息。
语音采集及身份识别模块,与环境参数采集模块和语音范围分析模块相连,用于采集来自语音及身份识别信息检测部件的用户语音信息和身份识别信息,并与环境参数一起发送至语义范围分析模块。其中的身份识别信息检测部件包括生物信息识别装置(例如指纹识别装置、虹膜识别装置)、动作识别装置(例如kinect)和电子信息识别装置(例如IC卡及读卡器)。
个人语音及行为习惯特征库,用于按照用户身份信息归类存储各类环境条件下的个人语音及行为习惯特征数据。
群体语音及习惯特征库,用于按照用户身份信息的类型及环境参数类型归类存储的群体语音及习惯特征库。
语义范围分析模块,与个人语音及行为习惯特征库、群体语音及习惯特征库和多个功能性语义分析模块相连,依据身份识别信息提取语义习惯特征库中存储的该用户个人语音及行为习惯特征数据,结合依据环境参数类型和身份识别信息类型提取群体语音及习惯特征库中存储的群体语音及习惯特征数据,判断该语音文件适合哪些功能性语义分析模块,并将相关信息发送给这些语义分析模块进行单独或联合的语义解析。
功能性语义分析模块,均与语义识别结果输出模块相连,是将同一场景中可能出现的语义构成集合,并按照出现概率的高低动态调整搜索方法和次序,用于执行语义解析。
语义识别结果输出模块,与个人语音及行为习惯特征库和群体语音及习惯特征库相连,用于存储功能性语义分析模块的语义分析结果,并将语义分析结果及相关信息发送给个人语音及行为习惯特征库和群体语音及习惯特征库进行归类存储。
本发明依据环境参数补足视觉、触觉、嗅觉等需要的信息,再结合群体数据及个体历史数据来补足经验判断所需要的信息,从而大幅度提高语音识别的准确率。
上述仅为本发明的具体实施方式,但本发明的设计构思并不局限于此,凡利用此构思对本发明进行非实质性的改动,均应属于侵犯本发明保护范围的行为。
Claims (9)
1.依据环境参数及群体趋向数据的语音识别方法,其特征在于:预先设置有个人语音及行为习惯特征库,群体语音及习惯特征库,以及多个功能性语义分析模块;该个人语音及行为习惯特征库是按照用户身份信息归类存储的数据库;该群体语音及习惯特征库用于存储提取自个人语音及行为习惯特征库的所有个人语音及行为习惯特征数据并按照多个维度记录的不同分类方法下的类似群体的语音特征和习惯特征;该功能性语义分析模块是将类似场景和类似群体中可能出现的语义构成集合,并按照出现概率的高低动态调整搜索方法和次序的功能模块;类似场景是依据环境参数的相似程度进行判定,类似群体是依据类似场景中,行为习惯的接近程度并结合用户信息的共同点进行判定,识别步骤如下:
首先,采集用户语音信息及与该语音信息相关的环境参数和身份识别信息,依据该身份识别信息进行用户的身份识别;
其次,依据身份识别信息提取个人语音及行为习惯特征库中存储的该用户个人语音及行为习惯特征数据,结合依据环境参数类型和身份识别信息类型提取群体语音及习惯特征库中存储的类似群体的群体语音及习惯特征数据,判断该语音信息适合哪些功能性语义分析模块,并将相关信息发送给这些语义分析模块进行单独或联合的语义解析,从而得到语义分析结果;
最后,存储语义分析结果,并将语义分析结果及相关信息发送至个人语音及行为习惯特征库和群体语音及习惯特征库进行归类存储,以不断完善该两个特征库的内容。
2.如权利要求1所述的依据环境参数及群体趋向数据的语音识别方法,其特征在于:所述环境参数包括以下的一种或多种:时间、舆情、温度、湿度、亮度、气压、海拔、气味、噪音、磁场、物理位置及图像。
3.如权利要求1所述的依据环境参数及群体趋向数据的语音识别方法,其特征在于:所述环境参数包括舆情,该舆情包括以下的一种或多种:互联网舆情、广播舆情及电视舆情。
4.如权利要求1所述的依据环境参数及群体趋向数据的语音识别方法,其特征在于:所述的身份识别信息包括以下的一种或多种:生物信息、动作信息及电子信息。
5.如权利要求1所述的依据环境参数及群体趋向数据的语音识别方法,其特征在于:所述相关信息至少包括提取到的用户个人语音及行为习惯特征数据、群体语音及习惯特征数据、环境参数和采集到的语音信息。
6.依据环境参数及群体趋向数据的语音识别系统,其特征在于:包括:
环境参数采集模块,用于采集来自环境参数检测部件的环境参数,并将采集到的环境参数的值进行标准化处理后送至语音采集及身份识别模块;
语音采集及身份识别模块,与环境参数采集模块和语音范围分析模块相连,用于采集来自语音及身份识别信息检测部件的用户语音信息和身份识别信息,并与环境参数一起发送至语义范围分析模块;
个人语音及行为习惯特征库,用于按照用户身份信息归类存储在各类环境条件下的个人语音及行为习惯特征数据;
群体语音及习惯特征库,用于存储提取自所有用户的个人语音及行为习惯特征库的群体特征数据,并按照多个维度记录不同分类方法下的群体的语音特征和习惯特征;
语义范围分析模块,与个人语音及行为习惯特征库、群体语音及习惯特征库和多个功能性语义分析模块相连,依据身份识别信息提取个人语音及行为习惯特征库中存储的该用户个人语音及行为习惯特征数据,结合依据环境参数类型和身份识别信息类型提取群体语音及习惯特征库中存储的类似群体的群体语音及习惯特征数据,判断该语音文件适合哪些功能性语义分析模块,并将相关信息发送给这些语义分析模块进行单独或联合的语义解析;
功能性语义分析模块,均与语义识别结果输出模块相连,是将类似场景和类似群体中可能出现的语义构成集合,并按照出现概率的高低动态调整搜索方法和次序,用于执行语义解析;
语义识别结果输出模块,与个人语音及行为习惯特征库和群体语音及习惯特征库相连,用于存储功能性语义分析模块的语义分析结果,并将语义分析结果及相关信息发送给个人语音及行为习惯特征库和群体语音及习惯特征库进行归类存储。
7.如权利要求6所述的依据环境参数及群体趋向数据的语音识别系统,其特征在于:所述的环境参数检测部件包括以下一种或多种:标准时间装置、舆情捕捉装置、温度检测装置、湿度检测装置、亮度检测装置、气压检测装置、海拔检测装置、气味检测装置、噪音检测装置、磁场检测装置、物理位置检测装置和图像捕捉及识别装置。
8.如权利要求6所述的依据环境参数及群体趋向数据的语音识别系统,其特征在于:所述的环境参数检测部件包括舆情捕捉装置,该舆情捕捉装置包括以下一种或多种:互联网舆情捕捉装置、多频段无线电接收及音频采集识别装置、多频道电视信号采集及图形声音识别装置。
9.如权利要求6所述的依据环境参数及群体趋向数据的语音识别系统,其特征在于:所述的身份识别信息检测部件包括以下一种或多种:生物信息识别装置、动作识别装置和电子信息识别装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410446143.5A CN104217718B (zh) | 2014-09-03 | 2014-09-03 | 依据环境参数及群体趋向数据的语音识别方法和系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410446143.5A CN104217718B (zh) | 2014-09-03 | 2014-09-03 | 依据环境参数及群体趋向数据的语音识别方法和系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN104217718A true CN104217718A (zh) | 2014-12-17 |
CN104217718B CN104217718B (zh) | 2017-05-17 |
Family
ID=52099128
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201410446143.5A Active CN104217718B (zh) | 2014-09-03 | 2014-09-03 | 依据环境参数及群体趋向数据的语音识别方法和系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN104217718B (zh) |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106774845A (zh) * | 2016-11-24 | 2017-05-31 | 北京智能管家科技有限公司 | 一种智能交互方法、装置及终端设备 |
CN107591156A (zh) * | 2017-10-10 | 2018-01-16 | 杭州嘉楠耘智信息科技股份有限公司 | 语音识别方法及装置 |
CN108010527A (zh) * | 2017-12-19 | 2018-05-08 | 深圳市欧瑞博科技有限公司 | 语音识别方法、装置、计算机设备和存储介质 |
CN108052506A (zh) * | 2017-12-28 | 2018-05-18 | 广东欧珀移动通信有限公司 | 自然语言处理方法、装置、存储介质及电子设备 |
CN108153158A (zh) * | 2017-12-19 | 2018-06-12 | 美的集团股份有限公司 | 家居场景的切换方法、装置、存储介质及服务器 |
WO2018171257A1 (en) * | 2017-03-21 | 2018-09-27 | Beijing Didi Infinity Technology And Development Co., Ltd. | Systems and methods for speech information processing |
CN108899017A (zh) * | 2018-06-22 | 2018-11-27 | 深圳市鸿基盛科技有限公司 | 一种基于环境数据的投票式多层次语音识别架构 |
CN109240488A (zh) * | 2018-07-27 | 2019-01-18 | 重庆柚瓣家科技有限公司 | 一种ai场景定位引擎的实现方法 |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6167376A (en) * | 1998-12-21 | 2000-12-26 | Ditzik; Richard Joseph | Computer system with integrated telephony, handwriting and speech recognition functions |
CN1172260C (zh) * | 2001-12-29 | 2004-10-20 | 浙江大学 | 基于指纹和声纹的交叉认证方法 |
CN100396133C (zh) * | 2006-02-06 | 2008-06-18 | 海信集团有限公司 | 带身份识别的环境侦听自动开启的手机及其实现方法 |
CN101673544B (zh) * | 2009-10-10 | 2012-07-04 | 上海电虹软件有限公司 | 一种基于声纹识别和定位跟踪的交叉监控方法和系统 |
CN102831195B (zh) * | 2012-08-03 | 2015-08-12 | 河南省佰腾电子科技有限公司 | 个性化语音采集与语义确定系统及其方法 |
CN103092950B (zh) * | 2013-01-15 | 2016-01-06 | 重庆邮电大学 | 一种网络舆情地理位置实时监控系统和方法 |
CN103544255B (zh) * | 2013-10-15 | 2017-01-11 | 常州大学 | 基于文本语义相关的网络舆情信息分析方法 |
-
2014
- 2014-09-03 CN CN201410446143.5A patent/CN104217718B/zh active Active
Non-Patent Citations (2)
Title |
---|
秦飞 等: "关于方言语音信息识别技术在公安工作中的应用研究", 《甘肃警察职业学院学报》 * |
闫建鹏: "基于多模态特征的新闻视频语义分析", 《中国优秀硕士学位论文全文数据库 信息科技辑》 * |
Cited By (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106774845B (zh) * | 2016-11-24 | 2020-01-31 | 北京儒博科技有限公司 | 一种智能交互方法、装置及终端设备 |
CN106774845A (zh) * | 2016-11-24 | 2017-05-31 | 北京智能管家科技有限公司 | 一种智能交互方法、装置及终端设备 |
CN109074803B (zh) * | 2017-03-21 | 2022-10-18 | 北京嘀嘀无限科技发展有限公司 | 语音信息处理系统和方法 |
WO2018171257A1 (en) * | 2017-03-21 | 2018-09-27 | Beijing Didi Infinity Technology And Development Co., Ltd. | Systems and methods for speech information processing |
CN109074803A (zh) * | 2017-03-21 | 2018-12-21 | 北京嘀嘀无限科技发展有限公司 | 语音信息处理系统和方法 |
CN107591156B (zh) * | 2017-10-10 | 2021-07-16 | 嘉楠明芯(北京)科技有限公司 | 语音识别方法及装置 |
CN107591156A (zh) * | 2017-10-10 | 2018-01-16 | 杭州嘉楠耘智信息科技股份有限公司 | 语音识别方法及装置 |
CN108153158A (zh) * | 2017-12-19 | 2018-06-12 | 美的集团股份有限公司 | 家居场景的切换方法、装置、存储介质及服务器 |
CN108010527A (zh) * | 2017-12-19 | 2018-05-08 | 深圳市欧瑞博科技有限公司 | 语音识别方法、装置、计算机设备和存储介质 |
CN108010527B (zh) * | 2017-12-19 | 2020-06-12 | 深圳市欧瑞博科技有限公司 | 语音识别方法、计算机设备和存储介质 |
CN111508489A (zh) * | 2017-12-19 | 2020-08-07 | 深圳市欧瑞博科技股份有限公司 | 语音识别方法、装置、计算机设备和存储介质 |
CN108052506A (zh) * | 2017-12-28 | 2018-05-18 | 广东欧珀移动通信有限公司 | 自然语言处理方法、装置、存储介质及电子设备 |
CN108052506B (zh) * | 2017-12-28 | 2021-06-29 | Oppo广东移动通信有限公司 | 自然语言处理方法、装置、存储介质及电子设备 |
CN108899017B (zh) * | 2018-06-22 | 2020-09-08 | 深圳市鸿基盛科技有限公司 | 一种基于环境数据的投票式多层次语音识别架构 |
CN108899017A (zh) * | 2018-06-22 | 2018-11-27 | 深圳市鸿基盛科技有限公司 | 一种基于环境数据的投票式多层次语音识别架构 |
CN109240488A (zh) * | 2018-07-27 | 2019-01-18 | 重庆柚瓣家科技有限公司 | 一种ai场景定位引擎的实现方法 |
Also Published As
Publication number | Publication date |
---|---|
CN104217718B (zh) | 2017-05-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN104217718A (zh) | 依据环境参数及群体趋向数据的语音识别方法和系统 | |
CN107169430B (zh) | 基于图像处理语义分析的阅读环境音效增强系统及方法 | |
US10733987B1 (en) | System and methods for providing unplayed content | |
CN102779509B (zh) | 语音处理设备和语音处理方法 | |
CN105874454B (zh) | 用于基于场境信息生成搜索结果的方法、系统和介质 | |
US11394675B2 (en) | Method and device for commenting on multimedia resource | |
CN111583907B (zh) | 信息处理方法、装置及存储介质 | |
CN103700370A (zh) | 一种广播电视语音识别系统方法及系统 | |
CN102799605A (zh) | 一种广告监播方法和系统 | |
CN105488025A (zh) | 模板构建方法和装置、信息识别方法和装置 | |
CN106708949A (zh) | 一种视频有害内容识别方法 | |
CN102868934A (zh) | 基于智能电视的视频对象信息检索方法及装置 | |
CN109271533A (zh) | 一种多媒体文件检索方法 | |
CN107507620A (zh) | 一种语音播报声音设置方法、装置、移动终端及存储介质 | |
CN113590850A (zh) | 多媒体数据的搜索方法、装置、设备及存储介质 | |
CN114465737B (zh) | 一种数据处理方法、装置、计算机设备及存储介质 | |
CN106791579A (zh) | 一种视频会议质量的处理方法及系统 | |
CN111583919B (zh) | 信息处理方法、装置及存储介质 | |
CN108074571A (zh) | 增强现实设备的语音控制方法、系统及存储介质 | |
CN105451029A (zh) | 一种视频图像的处理方法及装置 | |
CN113850162A (zh) | 一种视频审核方法、装置及电子设备 | |
CN109710799B (zh) | 语音交互方法、介质、装置和计算设备 | |
CN111586469A (zh) | 弹幕显示方法、装置及电子设备 | |
CN100365622C (zh) | 对压缩的视频进行分段的方法 | |
CN114372172A (zh) | 生成视频封面图像的方法、装置、计算机设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
TR01 | Transfer of patent right |
Effective date of registration: 20171102 Address after: Hangzhou City, Zhejiang province 310000 Binjiang District Albert Road, building 2 Room 202 rainbow heights Co-patentee after: Bao Kejie Patentee after: Chen Fei Address before: Hangzhou City, Zhejiang province 310000 Binjiang District Albert Road, building 2 Room 202 rainbow heights Patentee before: Chen Fei |
|
TR01 | Transfer of patent right |