CN104505091A - 人机语音交互方法及系统 - Google Patents

人机语音交互方法及系统 Download PDF

Info

Publication number
CN104505091A
CN104505091A CN201410830417.0A CN201410830417A CN104505091A CN 104505091 A CN104505091 A CN 104505091A CN 201410830417 A CN201410830417 A CN 201410830417A CN 104505091 A CN104505091 A CN 104505091A
Authority
CN
China
Prior art keywords
voice messaging
feedback
video information
voice
module
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201410830417.0A
Other languages
English (en)
Other versions
CN104505091B (zh
Inventor
周新华
王小兰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
SHANGHAI FINEKITE EXHIBITION ENGINEERING Co.,Ltd.
Original Assignee
Hunan Hua Kai Culture Intention Inc Co
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hunan Hua Kai Culture Intention Inc Co filed Critical Hunan Hua Kai Culture Intention Inc Co
Priority to CN201410830417.0A priority Critical patent/CN104505091B/zh
Publication of CN104505091A publication Critical patent/CN104505091A/zh
Application granted granted Critical
Publication of CN104505091B publication Critical patent/CN104505091B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Telephonic Communication Services (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)

Abstract

本发明公开了一种人机语音交互方法及系统,通过采集用户的语音信息,分析语音信息得出语言类型,对语音信息采用与语言类型对应的识别模式进行识别,将该语音信息与预先存储的反馈语音信息进行检索匹配,得到匹配的反馈语音信息,再将识别的语音信息与预先存储的反馈视频信息进行检索匹配,得到匹配的反馈视频信息;当得到的上述两种信息存在关联时,则将两种信息同步输出。通过上述人机语音交互方法,可识别多种语言的语音,实现多种语言的交互,且同时实现视频与语音的同步回应,使客户体验感更强,且通过判断反馈语音信息与反馈视频信息的关联性,实现反馈语音信息与反馈视频信息的一致性,提高交互准确率,且声音和画面更加的协调与同步。

Description

人机语音交互方法及系统
技术领域
本发明涉及电子产品技术领域,特别是涉及人机语音交互方法及系统。
背景技术
随着科技的进步,数字文化馆内的电子产品越来越多,也越来越智能化,人机语音交互产品就是其中一个。人机语音交互系统可以为参观的客户提供有效的人机交互功能,通过语音与机器进行交流,让机器明白人说的是什么,并给出相应的回答。例如,通过人机语音交互系统获取数字文化馆内的相关产品的介绍以及相关功能,也可通过人机语音交互系统为客户指引路径,告诉客户想要去的地方的路线等功能。
然而,现有的人机语音交互方法及系统只是通过采集语音信息,然后对语音信息进行识别,再通过该语音信息调取数据库中预先存储的语音回应信息并输出,对用户的问题进行解答,实现人机语音交互。这种人机语音交互系统功能单一,交互准确性比较低。
发明内容
基于此,有必要针对现有的人机语音交互方法及系统的交互准确性较低的问题,提供一种人机语音交互方法及系统。
一种人机语音交互方法,包括以下步骤:
采集用户的语音信息;
对所述语音信息进行分析,得出所述语音信息所对应的语言类型;
对所述语音信息采用与所述语言类型对应的识别模式进行识别;
将识别的所述语音信息与预先存储的反馈语音信息进行检索匹配,得到匹配的所述反馈语音信息;
将识别的所述语音信息与预先存储的反馈视频信息进行检索匹配,得到匹配的所述反馈视频信息;
判断匹配的所述反馈语音信息与匹配的所述反馈视频信息是否存在关联;
若匹配的所述反馈语音信息与匹配的所述反馈视频信息存在关联;
则将匹配的所述反馈语音信息与匹配的所述反馈视频信息同步输出;
显示所述反馈视频信息。
本发明还公开一种人机语音交互系统,包括:
采集模块,用于采集用户的语音信息;
语音分析模块,用于对所述语音信息进行分析,得出所述语音信息所对应的语言类型;
语音识别模块,用于对所述语音信息采用与所述语言类型对应的识别模式进行识别;
第一匹配模块,用于将识别的所述语音信息与预先存储的反馈语音信息进行检索匹配;
第二匹配模块,用于将识别的所述语音信息与预先存储的反馈视频信息进行检索匹配;
关联判断模块,用于判断匹配的所述反馈语音信息与匹配的所述反馈视频信息是否存在关联;
输出模块,用于将匹配的所述反馈语音信息与匹配的所述反馈视频信息同步输出;
显示模块,用于显示所述反馈视频信息。
上述人机语音交互方法及系统,通过不同的识别模式对不同语言的语音信息进行识别,再将识别的语音信息与预先存储的反馈语音信息进行检索匹配,得到匹配的反馈语音信息,再将识别的语音信息与预先存储的反馈视频信息进行检索匹配,得到匹配的反馈视频信息;当匹配的反馈语音信息与匹配的反馈视频信息存在关联时,则将这两种信息同步输出。通过上述人机语音交互方法,可识别多种语言的语音,实现多种语言的交互,且同时实现视频与语音的同步输出,使客户体验感更强,且通过判断反馈语音信息与反馈视频信息的关联性,实现反馈语音信息与反馈视频信息的一致性,提高交互准确率,提高声音和画面的协调性。
附图说明
图1为一种实施方式的人机语音交互方法的流程图;
图2为一种实施方式的人机语音交互系统的模块图;
图3为另一实施方式的人机语音交互系统中的结构子模块图。
具体实施方式
为了使本发明的目的、技术方案和优点更加清楚明了,以下根据附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不限定本发明。
请参考参阅1,一种人机语音交互方法,包括以下步骤:
S100:采集用户的语音信息。
只有通过采集到用户的语音信息,才能根据用户的语音信息进行后续相应的处理,整个系统是以用户的语音信息为依据,为用户提供相应的回应,实现人机语音交互。
S200:对语音信息进行分析,得出语音信息所对应的语言类型。
不同的用户可能采用不同的语言方式进行交互,即采用不同的语种进行交互,例如,采用中文、英文或其他语种,则采集的用户语音信息包括多种语言的语音信息,若对不同语言类型的语音信息均采用同样的识别模式进行识别,则识别错误率会较高,所以首先需要分析采集的用户语音信息的语言类型。
S300:对语音信息采用与语言类型对应的识别模式进行识别。
分析得出用户的语音信息的语言类型后,需要选择与语言类型对应的识别模式对语音信息进行识别,多种识别模式预先设置的。例如,分析得到用户的语音信息的语音类型为中文,则采用对应的中文识别模式对语音信息进行识别;分析得到用户的语音信息的语音类型为英文,则采用对应的英文识别模式对语音信息进行识别。这样采用对应的识别模式对不同语言类型的语音信息进行识别,可提高识别准确性。
S400:将识别的语音信息与预先存储的反馈语音信息进行检索匹配,得到匹配的反馈语音信息。
在数据库中预先存储了反馈语音信息,当语音信息经过识别后,将其与预先存储的反馈语音信息进行检索匹配,得到与用户的语音信息相对应的反馈语音信息。例如,数据库中预先存储了数字文化馆内肉眼3D电视机的功能介绍语音信息,用户询问的语音信息是需要知道肉眼3D电视机的相关信息,通过检索匹配,可以得到与用户的语音信息相对应的反馈语音信息,即肉眼3D电视机的功能介绍语音信息。
S500:将识别的语音信息与预先存储的反馈视频信息进行检索匹配,得到匹配的反馈视频信息。
同样的,在数据库中预先存储了反馈视频信息,当语音信息经过识别后,将其与预先存储的反馈视频信息进行检索匹配,得到与用户的语音信息相对应的反馈视频信息。例如,数据库中预先存储了数字文化馆内关于肉眼3D电视机的视频信息,用户询问的语音信息是需要知道肉眼3D电视机的相关信息,通过检索匹配,可以得到与用户的语音信息相对应的反馈视频信息,即肉眼3D电视机的视频信息。
S600:判断匹配的反馈语音信息与匹配的反馈视频信息是否存在关联。
在数据库中预先存储了反馈语音信息与反馈视频信息的关联关系,例如,预先存储了3D电视机功能介绍语音信息和关于3D电视机的视频信息的关联,这种关联关系可以是多对多的,即多个语音信息可关联到多个视频信息,一个语音信息可关联多个视频信息,一个视频信息可关联到多个语音信息。
若匹配的反馈语音信息与匹配的反馈视频信息存在关联,则执行以下步骤:
S700:将匹配的反馈语音信息与匹配的反馈视频信息同步输出。
S800:显示反馈视频信息。
通过识别的语音信息匹配出的反馈语音信息和反馈视频信息存在关联,则将匹配的反馈语音信息与匹配的反馈视频信息同步输出,并显示反馈视频信息,使声音和画面更为协调,且使得用户不但能听到回应的信息,而且能观看视频。
在其中一个实施例中,若匹配的反馈语音信息与匹配的反馈视频信息不存在关联,则执行以下步骤:
S610:统计关联失败的次数。
S620:判断关联失败的次数是否小于等于预设值。
若关联失败的次数小于等于预设值;则执行以下步骤:
返回并继续执行将识别的语音信息与预先存储的反馈语音信息进行检索匹配,得到匹配的反馈语音信息的步骤S400;直到匹配的反馈语音信息与匹配的反馈视频信息存在关联或者关联失败的次数大于预设值。
若匹配出的反馈语音信息与反馈视频信息不存在关联,则统计关联失败的次数,当关联失败的次数小于等于一个预设值时,再返回重新进行检索匹配,直到关联成功,再将此时匹配的反馈语音信息与反馈视频信息同步输出。
上述人机语音交互方法,通过采集用户的语音信息,对语音信息进行分析后得出语音的语言类型,对语音信息采用与语言类型对应的识别模式进行识别,将识别的语音信息与预先存储的反馈语音信息进行检索匹配,得到匹配的反馈语音信息,再将识别的语音信息与预先存储的反馈视频信息进行检索匹配,得到匹配的反馈视频信息;当得到的反馈语音信息与反馈视频信息存在关联时,则将这种信息同步输出。通过上述人机语音交互方法,可识别多种语言的语音,实现多种语言的交互,且同时实现视频与语音的同步回应,使客户体验感更强,且通过判断反馈语音信息与反馈视频信息的关联性,实现反馈语音信息与反馈视频信息的一致性,提高交互准确率,且声音和画面更加的协调与同步。
在其中一个实施例中,若关联失败的次数大于预设值,则执行以下步骤:
将匹配的反馈语音信息与匹配的反馈视频信息同步输出的步骤S700。
当关联失败的次数大于预设值,不再进行重新检索匹配,直接将此时匹配的反馈语音信息与反馈视频信息同步输出。
在每次进行采集用户的语音信息前,先将关联失败的次数清零。确保原先的关联失败次数对本次的识别过程产生影响。在其中一个实施例中,采集用户的语音信息的步骤S100之前还包括以下步骤:
判断当前的交互模式;
若当前的交互模式为人机语音交互模式,再执行采集用户的语音信息的步骤S100。
若当前的交互模式为普通播放模式,则执行以下步骤:
获取用户的切换指令;
根据切换指令,切换至人机语音交互模式。
当前的交互模式时普通播放模式时,是播放预先存储的视频语音信息,例如,数字文化馆的宣传片等视频。当用户需要进行交互时,需要切换到人机语音交互模式,才能对用户的语音信息进行采集。通过用户输入的切换指令,切换到人机语音交互模式。
在其中一个实施例中,反馈视频信息播放完毕后,自动切换至普通播放模式;或
获取用户的终止指令;
根据该终止指令,切换人机语音交互模式至普通播放模式。
根据用户的语音信息进行回应输出的反馈视频信息播放完毕后,会自动回复到普通播放模式;或者用户已经了解了相关内容,不需要再进行观看,用户可输入终止指令,切换人机语音交互模式至普通播放模式,或者另一个用户需要进行语音交互时,但当前还在播放上一个用户的反馈视频信息,也可输入终止指令,切换人机语音交互模式至普通播放模式。再通过输入切换指令切换至语音交互模式,进行下一次的语音信息采集。
在其中一个实施例中,将识别的语音信息与预先存储的反馈语音信息进行检索匹配,得到匹配的反馈语音信息的步骤S400之前包括以下步骤:
对识别的语音信息进行关键语音段提取。
对关键语音段进行整合,得到整合后的语音信息。
用户输入的语音信息中可能包含许多非必要的信息,需要对整个语音信息进行关键信息提取,再将关键信息进行整合后得到精简的语音信息,为后续的匹配提高效率。
在其中一个实施例中,将识别的语音信息与预先存储的反馈语音信息进行检索匹配,得到匹配的反馈语音信息的步骤S400具体为:
将整合后的语音信息与预先存储的反馈语音信息进行检索匹配。
将识别的语音信息与预先存储的反馈视频信息进行检索匹配,得到匹配的反馈视频信息的步骤S500具体为:
将整合后的语音信息与预先存储的反馈视频信息进行检索匹配。
经过整合后,且是对关键信息的提取,不但不会丢失用户想要表达的信息,也使语音信息更加精简,很大程度上减少了检索匹配时间,提高匹配效率。
请参阅图2,本发明还公开了一种人机语音交互系统,包括:
采集模块100,用于采集用户的语音信息。
语音分析模块200,用于对语音信息进行分析,得出语音信息所对应的语言类型。
语音识别模块300,用于对语音信息采用与语言类型对应的识别模式进行识别。
第一匹配模块400,用于将识别的语音信息与预先存储的反馈语音信息进行检索匹配。
第二匹配模块500,用于将识别的语音信息与预先存储的反馈视频信息进行检索匹配。
关联判断模块600,用于判断匹配的反馈语音信息与匹配的反馈视频信息是否存在关联。
输出模块700,用于当关联判断模块判断匹配的反馈语音信息与匹配的反馈视频信息存在关联时,将匹配的反馈语音信息与匹配的反馈视频信息同步输出。
显示模块800,用于显示反馈视频信息。
上述人机语音交互系统,通过采集模块100采集用户的语音信息,语音分析模块200对语音信息进行分析后得到语音的语言类型,语音识别模块300采用与语言类型对应的识别模式进行识别,通过第一匹配模块400将识别的语音信息与预先存储的反馈语音信息进行检索匹配,得到匹配的反馈语音信息,再通过第二匹配模块500将识别的语音信息与预先存储的反馈视频信息进行检索匹配,得到匹配的反馈视频信息;当得到的上述两种信息存在关联时,则将两种信息同步输出。通过上述人机语音交互方法,可识别多种语言的语音,实现多种语言的交互,且同时实现视频与语音的同步回应,使客户体验感更强,且通过判断反馈语音信息与反馈视频信息的关联性,实现反馈语音信息与反馈视频信息的一致性,提高交互准确率,且声音和画面更加的协调与同步。
在其中一个实施例中,请参阅图3,上述人机语音交互系统还包括:
统计模块610,用于当关联判断模块判断匹配的反馈语音信息与匹配的反馈视频信息不存在关联时,统计关联失败的次数。
第一判断模块620,用于判断关联失败的次数是否小于等于预设值。
在其中一个实施例中,上述人机语音交互系统还包括:
第二判断模块,用于判断当前的交互模式是否为人机语音交互模式。
获取模块,用于获取用户的切换指令。
切换模块,用于根据切换指令,切换至人机语音交互模式。
若判断当前的交互模式为普通播放模式时,获取用户的切换指令,根据切换指令,切换至人机语音交互模式,再通过采集模块100进行语音采集。若判断当前的交互模式为人机语音交互模式时,则可通过采集模块100采集用户的语音信息。
在其中一个实施例中,获取模块,还用于获取用户的终止指令。
切换模块,还用于当反馈视频信息播放完毕后,自动切换至普通播放模式,且用于根据终止指令切换人机语音交互模式至普通播放模式。
在其中一个实施例中,上述人机语音交互系统还包括:
关键语音段提取模块,用于对识别的语音信息进行关键语音段提取。
整合模块,用于对关键语音段进行整合,得到整合后的语音信息。
第一匹配模块400,还用于将整合后的语音信息与预先存储的反馈语音信息进行检索匹配。
第二匹配模块500,还用于将整合后的语音信息与预先存储的反馈视频信息进行检索匹配。
以上实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权利要求为准。

Claims (10)

1.一种人机语音交互方法,其特征在于,包括以下步骤:
采集用户的语音信息;
对所述语音信息进行分析,得出所述语音信息所对应的语言类型;
对所述语音信息采用与所述语言类型对应的识别模式进行识别;
将识别的所述语音信息与预先存储的反馈语音信息进行检索匹配,得到匹配的所述反馈语音信息;
将识别的所述语音信息与预先存储的反馈视频信息进行检索匹配,得到匹配的所述反馈视频信息;
判断匹配的所述反馈语音信息与匹配的所述反馈视频信息是否存在关联;
若匹配的所述反馈语音信息与匹配的所述反馈视频信息存在关联;
则将匹配的所述反馈语音信息与匹配的所述反馈视频信息同步输出;
显示所述反馈视频信息。
2.根据权利要求1所述的人机语音交互方法,其特征在于,若匹配的所述反馈语音信息与匹配的所述反馈视频信息不存在关联;
统计关联失败的次数;
若所述关联失败的次数小于等于预设值;
则返回并继续执行所述将识别的所述语音信息与预先存储的反馈语音信息进行检索匹配,得到匹配的所述反馈语音信息的步骤;直到匹配的所述反馈语音信息与匹配的所述反馈视频信息存在关联或者所述关联失败的次数大于所述预设值。
3.根据权利要求2所述的人机语音交互方法,其特征在于,若所述关联失败的次数大于预设值;
则执行所述则将匹配的所述反馈语音信息与匹配的所述反馈视频信息同步输出的步骤。
4.根据权利要求1所述的人机语音交互方法,其特征在于,所述采集用户的语音信息的步骤之前还包括以下步骤:
判断当前的交互模式是否为人机语音交互模式;
若当前的交互模式为人机语音交互模式,则执行所述采集用户的语音信息的步骤;
若判断当前的交互模式为普通播放模式,则执行以下步骤:
获取用户的切换指令;
根据所述切换指令,切换至人机语音交互模式。
5.根据权利要求1所述的人机语音交互方法,其特征在于,所述将识别的所述语音信息与预先存储的反馈语音信息进行检索匹配,得到匹配的所述反馈语音信息的步骤之前包括以下步骤:
对识别的所述语音信息进行关键语音段提取;
对所述关键语音段进行整合,得到整合后的语音信息。
6.根据权利要求5所述的人机语音交互方法,其特征在于,所述将识别的所述语音信息与预先存储的反馈语音信息进行检索匹配,得到匹配的反馈语音信息的步骤具体为:
将所述整合后的语音信息与预先存储的反馈语音信息进行检索匹配;
所述将识别的所述语音信息与预先存储的反馈视频信息进行检索匹配,得到匹配的反馈视频信息的步骤具体为:
将所述整合后的语音信息与预先存储的反馈视频信息进行检索匹配。
7.一种人机语音交互系统,其特征在于,包括:
采集模块,用于采集用户的语音信息;
语音分析模块,用于对所述语音信息进行分析,得出所述语音信息所对应的语言类型;
语音识别模块,用于对所述语音信息采用与所述语言类型对应的识别模式进行识别;
第一匹配模块,用于将识别的所述语音信息与预先存储的反馈语音信息进行检索匹配;
第二匹配模块,用于将识别的所述语音信息与预先存储的反馈视频信息进行检索匹配;
关联判断模块,用于判断匹配的所述反馈语音信息与匹配的所述反馈视频信息是否存在关联;
输出模块,用于将匹配的所述反馈语音信息与匹配的所述反馈视频信息同步输出;
显示模块,用于显示所述反馈视频信息。
8.根据权利要求7所述的人机语音交互系统,其特征在于,还包括:
统计模块,用于当所述关联判断模块判断匹配的所述反馈语音信息与匹配的所述反馈视频信息不存在关联时,统计关联失败的次数;
第一判断模块,用于判断所述关联失败的次数是否小于等于预设值。
9.根据权利要求7所述的人机语音交互系统,其特征在于,还包括:
第二判断模块,用于判断当前的交互模式是否为人机语音交互模式;
获取模块,用于获取用户的切换指令;
切换模块,用于根据所述切换指令,切换至人机语音交互模式。
10.根据权利要求7所述的人机语音交互系统,其特征在于,还包括:
关键语音段提取模块,用于对识别的所述语音信息进行关键语音段提取;
整合模块,用于对所述关键语音段进行整合,得到整合后的语音信息;
第一匹配模块,还用于将所述整合后的语音信息与预先存储的反馈语音信息进行检索匹配;
第二匹配模块,还用于将所述整合后的语音信息与预先存储的反馈视频信息进行检索匹配。
CN201410830417.0A 2014-12-26 2014-12-26 人机语音交互方法及系统 Active CN104505091B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410830417.0A CN104505091B (zh) 2014-12-26 2014-12-26 人机语音交互方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410830417.0A CN104505091B (zh) 2014-12-26 2014-12-26 人机语音交互方法及系统

Publications (2)

Publication Number Publication Date
CN104505091A true CN104505091A (zh) 2015-04-08
CN104505091B CN104505091B (zh) 2018-08-21

Family

ID=52946833

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410830417.0A Active CN104505091B (zh) 2014-12-26 2014-12-26 人机语音交互方法及系统

Country Status (1)

Country Link
CN (1) CN104505091B (zh)

Cited By (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106920552A (zh) * 2017-03-30 2017-07-04 天津中科先进技术研究院有限公司 一种具有云端交互功能的智能机器人
CN107315562A (zh) * 2017-07-18 2017-11-03 中国北方车辆研究所 一台pc上获取多usb人机语音交互设备系统编号的方法
CN107644639A (zh) * 2016-07-21 2018-01-30 北京快乐智慧科技有限责任公司 一种语音交互的方法和系统
CN107948673A (zh) * 2017-12-14 2018-04-20 南京美桥信息科技有限公司 一种可视智能演播方法及系统
CN109408024A (zh) * 2018-10-18 2019-03-01 珠海格力电器股份有限公司 信息交互方法及装置、存储介质、处理器
CN109496332A (zh) * 2016-07-28 2019-03-19 国立研究开发法人情报通信研究机构 语音对话装置、语音对话方法以及存储介质
CN110569726A (zh) * 2019-08-05 2019-12-13 北京云迹科技有限公司 一种服务机器人的交互方法及系统
CN111052229A (zh) * 2018-04-16 2020-04-21 谷歌有限责任公司 自动地确定用于经由自动化助理接口接收的口头话语的语音辨识的语言
CN111128125A (zh) * 2019-12-30 2020-05-08 深圳市优必选科技股份有限公司 语音服务配置系统及其语音服务配置方法和装置
CN111128126A (zh) * 2019-12-30 2020-05-08 上海浩琨信息科技有限公司 多语种智能语音对话的方法及系统
CN112133283A (zh) * 2019-06-24 2020-12-25 武汉慧人信息科技有限公司 一种多语言环境下语音应答系统设计
CN112297016A (zh) * 2019-07-26 2021-02-02 深圳百诺明医说科技有限公司 基于用户语音的诊断建议反馈系统及医疗智能语音机器人
CN114613361A (zh) * 2022-02-14 2022-06-10 广西大学 一种语音反馈和交互系统及方法
CN114610157A (zh) * 2022-03-23 2022-06-10 北京拙河科技有限公司 一种基于手势交互的方法及系统
US11735173B2 (en) 2018-04-16 2023-08-22 Google Llc Automatically determining language for speech recognition of spoken utterance received via an automated assistant interface
CN117059080A (zh) * 2017-12-08 2023-11-14 谷歌有限责任公司 对重复的分组化数据传输的检测

Citations (36)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11272766A (ja) * 1998-03-19 1999-10-08 Toshiba Corp 自動取引装置及び自動取引方法
CN1501233A (zh) * 2002-11-13 2004-06-02 ���ǵ�����ʽ���� 使用家庭服务器的家庭机器人及其家庭网络系统
WO2004090746A1 (en) * 2003-04-14 2004-10-21 Koninklijke Philips Electronics N.V. System and method for performing automatic dubbing on an audio-visual stream
US20050049862A1 (en) * 2003-09-03 2005-03-03 Samsung Electronics Co., Ltd. Audio/video apparatus and method for providing personalized services through voice and speaker recognition
CN1851761A (zh) * 2006-03-21 2006-10-25 陈安平 一种自助导游方法及其系统
CN101119468A (zh) * 2007-09-19 2008-02-06 华为技术有限公司 视频交互方法、终端设备及其菜单选择装置
CN101242510A (zh) * 2008-02-18 2008-08-13 华为技术有限公司 一种动态音视频菜单的播放方法与实现装置
HK1128110A1 (en) * 2007-11-08 2009-10-16 Shanghai Hanshi Network Technology Co Ltd Method and apparatus for providing automatic customer services through man- computer interaction
CN101656545A (zh) * 2008-08-18 2010-02-24 顾声飞 一种手持式无线智能导游方法及系统
CN101763212A (zh) * 2009-04-30 2010-06-30 广东国笔科技股份有限公司 人机交互系统及其相关系统、设备和方法
US7801730B1 (en) * 1999-07-27 2010-09-21 Sony Corporation Voice recognition control system and voice recognition control method
CN101894548A (zh) * 2010-06-23 2010-11-24 清华大学 一种用于语种识别的建模方法及装置
CN201673683U (zh) * 2010-05-06 2010-12-15 大连交通大学 基于射频识别技术的多语种自动选择语音播放系统
CN201754335U (zh) * 2010-07-16 2011-03-02 西安欧博科工贸有限公司 一种语音智能交互装置
CN102141797A (zh) * 2010-12-15 2011-08-03 中国民航大学 航站楼服务机器人及其控制方法
CN201976253U (zh) * 2010-08-27 2011-09-14 中国移动通信集团浙江有限公司 一种导游系统
CN102314824A (zh) * 2010-06-30 2012-01-11 上海市静安区青少年活动中心 导游机器人
CN102736959A (zh) * 2012-06-07 2012-10-17 北京奇虎科技有限公司 确定终端故障解决方案的方法及装置
CN102930805A (zh) * 2012-11-09 2013-02-13 许巧智 基于mp4的具有翻译功能的导游系统及方法
CN102970424A (zh) * 2012-11-09 2013-03-13 许巧智 基于手机的具有翻译功能的导游系统及方法
CN103034632A (zh) * 2011-09-29 2013-04-10 北京神州泰岳软件股份有限公司 一种信息传送方法和系统
CN103108229A (zh) * 2013-02-06 2013-05-15 上海云联广告有限公司 一种通过音频跨屏识别视频内容的方法
CN202975917U (zh) * 2012-12-13 2013-06-05 田新山 大学生就业信息查询机
CN103186227A (zh) * 2011-12-28 2013-07-03 北京德信互动网络技术有限公司 人机互动系统和方法
CN103187051A (zh) * 2011-12-28 2013-07-03 上海博泰悦臻电子设备制造有限公司 车载互动装置
CN103219006A (zh) * 2012-01-18 2013-07-24 北京德信互动网络技术有限公司 人机互动系统和方法
CN103246520A (zh) * 2013-05-24 2013-08-14 北京小米科技有限责任公司 一种更换程序使用的语言的方法及装置
CN103324730A (zh) * 2013-06-27 2013-09-25 无锡奇纬智能视膜科技有限公司 一种智能信息查询机
CN203250321U (zh) * 2013-04-01 2013-10-23 何淑珊 一种简易带语音功能的超市商品信息查询机
CN103455626A (zh) * 2013-09-18 2013-12-18 国家电网公司 一种数据处理方法和装置
CN103533021A (zh) * 2012-07-03 2014-01-22 三星电子株式会社 显示设备、交互式系统和响应信息提供方法
CN103558916A (zh) * 2013-11-07 2014-02-05 百度在线网络技术(北京)有限公司 人机交互系统、方法及其装置
CN103594086A (zh) * 2013-10-25 2014-02-19 鸿富锦精密工业(深圳)有限公司 语音处理系统、装置及方法
CN103677261A (zh) * 2012-09-20 2014-03-26 三星电子株式会社 用户装置的情景感知服务提供方法和设备
CN103903536A (zh) * 2014-04-10 2014-07-02 陕西科技大学 一种多功能自助导游机
CN203839012U (zh) * 2014-05-21 2014-09-17 武汉传神信息技术有限公司 景点解说装置

Patent Citations (36)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11272766A (ja) * 1998-03-19 1999-10-08 Toshiba Corp 自動取引装置及び自動取引方法
US7801730B1 (en) * 1999-07-27 2010-09-21 Sony Corporation Voice recognition control system and voice recognition control method
CN1501233A (zh) * 2002-11-13 2004-06-02 ���ǵ�����ʽ���� 使用家庭服务器的家庭机器人及其家庭网络系统
WO2004090746A1 (en) * 2003-04-14 2004-10-21 Koninklijke Philips Electronics N.V. System and method for performing automatic dubbing on an audio-visual stream
US20050049862A1 (en) * 2003-09-03 2005-03-03 Samsung Electronics Co., Ltd. Audio/video apparatus and method for providing personalized services through voice and speaker recognition
CN1851761A (zh) * 2006-03-21 2006-10-25 陈安平 一种自助导游方法及其系统
CN101119468A (zh) * 2007-09-19 2008-02-06 华为技术有限公司 视频交互方法、终端设备及其菜单选择装置
HK1128110A1 (en) * 2007-11-08 2009-10-16 Shanghai Hanshi Network Technology Co Ltd Method and apparatus for providing automatic customer services through man- computer interaction
CN101242510A (zh) * 2008-02-18 2008-08-13 华为技术有限公司 一种动态音视频菜单的播放方法与实现装置
CN101656545A (zh) * 2008-08-18 2010-02-24 顾声飞 一种手持式无线智能导游方法及系统
CN101763212A (zh) * 2009-04-30 2010-06-30 广东国笔科技股份有限公司 人机交互系统及其相关系统、设备和方法
CN201673683U (zh) * 2010-05-06 2010-12-15 大连交通大学 基于射频识别技术的多语种自动选择语音播放系统
CN101894548A (zh) * 2010-06-23 2010-11-24 清华大学 一种用于语种识别的建模方法及装置
CN102314824A (zh) * 2010-06-30 2012-01-11 上海市静安区青少年活动中心 导游机器人
CN201754335U (zh) * 2010-07-16 2011-03-02 西安欧博科工贸有限公司 一种语音智能交互装置
CN201976253U (zh) * 2010-08-27 2011-09-14 中国移动通信集团浙江有限公司 一种导游系统
CN102141797A (zh) * 2010-12-15 2011-08-03 中国民航大学 航站楼服务机器人及其控制方法
CN103034632A (zh) * 2011-09-29 2013-04-10 北京神州泰岳软件股份有限公司 一种信息传送方法和系统
CN103187051A (zh) * 2011-12-28 2013-07-03 上海博泰悦臻电子设备制造有限公司 车载互动装置
CN103186227A (zh) * 2011-12-28 2013-07-03 北京德信互动网络技术有限公司 人机互动系统和方法
CN103219006A (zh) * 2012-01-18 2013-07-24 北京德信互动网络技术有限公司 人机互动系统和方法
CN102736959A (zh) * 2012-06-07 2012-10-17 北京奇虎科技有限公司 确定终端故障解决方案的方法及装置
CN103533021A (zh) * 2012-07-03 2014-01-22 三星电子株式会社 显示设备、交互式系统和响应信息提供方法
CN103677261A (zh) * 2012-09-20 2014-03-26 三星电子株式会社 用户装置的情景感知服务提供方法和设备
CN102930805A (zh) * 2012-11-09 2013-02-13 许巧智 基于mp4的具有翻译功能的导游系统及方法
CN102970424A (zh) * 2012-11-09 2013-03-13 许巧智 基于手机的具有翻译功能的导游系统及方法
CN202975917U (zh) * 2012-12-13 2013-06-05 田新山 大学生就业信息查询机
CN103108229A (zh) * 2013-02-06 2013-05-15 上海云联广告有限公司 一种通过音频跨屏识别视频内容的方法
CN203250321U (zh) * 2013-04-01 2013-10-23 何淑珊 一种简易带语音功能的超市商品信息查询机
CN103246520A (zh) * 2013-05-24 2013-08-14 北京小米科技有限责任公司 一种更换程序使用的语言的方法及装置
CN103324730A (zh) * 2013-06-27 2013-09-25 无锡奇纬智能视膜科技有限公司 一种智能信息查询机
CN103455626A (zh) * 2013-09-18 2013-12-18 国家电网公司 一种数据处理方法和装置
CN103594086A (zh) * 2013-10-25 2014-02-19 鸿富锦精密工业(深圳)有限公司 语音处理系统、装置及方法
CN103558916A (zh) * 2013-11-07 2014-02-05 百度在线网络技术(北京)有限公司 人机交互系统、方法及其装置
CN103903536A (zh) * 2014-04-10 2014-07-02 陕西科技大学 一种多功能自助导游机
CN203839012U (zh) * 2014-05-21 2014-09-17 武汉传神信息技术有限公司 景点解说装置

Cited By (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107644639A (zh) * 2016-07-21 2018-01-30 北京快乐智慧科技有限责任公司 一种语音交互的方法和系统
CN109496332A (zh) * 2016-07-28 2019-03-19 国立研究开发法人情报通信研究机构 语音对话装置、语音对话方法以及存储介质
CN106920552A (zh) * 2017-03-30 2017-07-04 天津中科先进技术研究院有限公司 一种具有云端交互功能的智能机器人
CN107315562A (zh) * 2017-07-18 2017-11-03 中国北方车辆研究所 一台pc上获取多usb人机语音交互设备系统编号的方法
CN117059080A (zh) * 2017-12-08 2023-11-14 谷歌有限责任公司 对重复的分组化数据传输的检测
CN107948673A (zh) * 2017-12-14 2018-04-20 南京美桥信息科技有限公司 一种可视智能演播方法及系统
US11735173B2 (en) 2018-04-16 2023-08-22 Google Llc Automatically determining language for speech recognition of spoken utterance received via an automated assistant interface
CN111052229B (zh) * 2018-04-16 2023-09-01 谷歌有限责任公司 自动地确定用于经由自动化助理接口接收的口头话语的语音辨识的语言
US12046233B2 (en) 2018-04-16 2024-07-23 Google Llc Automatically determining language for speech recognition of spoken utterance received via an automated assistant interface
CN111052229A (zh) * 2018-04-16 2020-04-21 谷歌有限责任公司 自动地确定用于经由自动化助理接口接收的口头话语的语音辨识的语言
US11817085B2 (en) 2018-04-16 2023-11-14 Google Llc Automatically determining language for speech recognition of spoken utterance received via an automated assistant interface
US11798541B2 (en) 2018-04-16 2023-10-24 Google Llc Automatically determining language for speech recognition of spoken utterance received via an automated assistant interface
CN109408024A (zh) * 2018-10-18 2019-03-01 珠海格力电器股份有限公司 信息交互方法及装置、存储介质、处理器
CN112133283A (zh) * 2019-06-24 2020-12-25 武汉慧人信息科技有限公司 一种多语言环境下语音应答系统设计
CN112297016A (zh) * 2019-07-26 2021-02-02 深圳百诺明医说科技有限公司 基于用户语音的诊断建议反馈系统及医疗智能语音机器人
CN110569726A (zh) * 2019-08-05 2019-12-13 北京云迹科技有限公司 一种服务机器人的交互方法及系统
CN111128126B (zh) * 2019-12-30 2023-04-07 海智讯通(上海)智能科技有限公司 多语种智能语音对话的方法及系统
CN111128126A (zh) * 2019-12-30 2020-05-08 上海浩琨信息科技有限公司 多语种智能语音对话的方法及系统
CN111128125A (zh) * 2019-12-30 2020-05-08 深圳市优必选科技股份有限公司 语音服务配置系统及其语音服务配置方法和装置
CN114613361A (zh) * 2022-02-14 2022-06-10 广西大学 一种语音反馈和交互系统及方法
CN114613361B (zh) * 2022-02-14 2024-05-28 广西大学 一种语音反馈和交互系统及方法
CN114610157A (zh) * 2022-03-23 2022-06-10 北京拙河科技有限公司 一种基于手势交互的方法及系统

Also Published As

Publication number Publication date
CN104505091B (zh) 2018-08-21

Similar Documents

Publication Publication Date Title
CN104505091A (zh) 人机语音交互方法及系统
CN102868934B (zh) 基于智能电视的视频对象信息检索方法及装置
US9710219B2 (en) Speaker identification method, speaker identification device, and speaker identification system
CN108235105B (zh) 一种弹幕呈现方法、记录介质、电子设备、信息处理系统
US10628469B2 (en) Information processing method and electronic device
JP6674942B2 (ja) インタラクションを用いたメッセンジャー検索方法、ならびに、これを実現したサーバおよびアプリケーション
CN103686344A (zh) 增强视频系统及方法
CN102467235A (zh) 多媒体设备中用户姿态识别的方法及其多媒体设备
CN105611382A (zh) 产生概要内容的电子设备及其方法
CN102473304A (zh) 元数据标记系统、图像搜索方法和设备、及其用于标记手势的方法
CN109271533A (zh) 一种多媒体文件检索方法
US10360455B2 (en) Grouping captured images based on features of the images
CN105828101A (zh) 生成字幕文件的方法及装置
CN105100911A (zh) 智能多媒体系统和方法
JP2021034003A (ja) 人物識別方法、装置、電子デバイス、記憶媒体、及びプログラム
WO2018019028A1 (zh) 一种广告信息的推送方法、装置及机顶盒
CN106462646A (zh) 控制设备、控制方法和计算机程序
CN103607635A (zh) 一种字幕识别方法、装置和终端
KR20180068113A (ko) 음성 인식 장치, 방법 그리고 이를 위한 사용자 인터페이스 표시 방법
CN107809654A (zh) 电视机系统及电视机控制方法
CN107547942A (zh) 一种二进制电视系统及方法
KR102298066B1 (ko) 영상 콘텐츠 제공 방법 및 영상 콘텐츠 제공 장치
WO2017104089A1 (ja) ヘッドマウントディスプレイ連携表示システム、及び、表示装置とヘッドマウントディスプレイとを含むシステム、及び、その表示装置
CN104853223A (zh) 视频流的插播方法及终端设备
CN103414720A (zh) 交互式3d语音服务方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right

Effective date of registration: 20200914

Address after: Room 301, No. 2, Lane 3088, Gonghe new road, Jing'an District, Shanghai

Patentee after: SHANGHAI FINEKITE EXHIBITION ENGINEERING Co.,Ltd.

Address before: Lugu high tech Zone International Industrial Park in Hunan province 410205 city Changsha

Patentee before: HUNAN HUAKAI CULTURE CREATIVE Co.,Ltd.

TR01 Transfer of patent right