CN111161706A - 交互方法、装置、设备和系统 - Google Patents

交互方法、装置、设备和系统 Download PDF

Info

Publication number
CN111161706A
CN111161706A CN201811230934.9A CN201811230934A CN111161706A CN 111161706 A CN111161706 A CN 111161706A CN 201811230934 A CN201811230934 A CN 201811230934A CN 111161706 A CN111161706 A CN 111161706A
Authority
CN
China
Prior art keywords
voice instruction
response result
language type
determining
user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201811230934.9A
Other languages
English (en)
Inventor
张平
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alibaba Group Holding Ltd
Original Assignee
Alibaba Group Holding Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alibaba Group Holding Ltd filed Critical Alibaba Group Holding Ltd
Priority to CN201811230934.9A priority Critical patent/CN111161706A/zh
Publication of CN111161706A publication Critical patent/CN111161706A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/005Language recognition
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

本发明实施例提供一种交互方法、装置、设备和系统,该方法包括:智能设备接收语音指令,并识别此语音指令的语言类型。进一步地,再根据此语音指令对应的语言类型确定对应于此语音指令的响应结果,发送响应结果至语音指令对应的用户,以实现用户与智能设备之间的交互。由于同一个词语在不同类型的语言中可能具有不同的含义,而上述交互方法中存在对接收到的语音指令确定语言类型的过程,因此,此过程能够保证智能设备是基于此种语言类型来确定响应结果。从而提高确定出的响应结果的准确性。通过增加语言类型的识别过程,对于不同语言类型的用户发出的语音指令,智能设备都能准确地返回响应结果。

Description

交互方法、装置、设备和系统
技术领域
本发明涉及计算机技术领域,尤其涉及一种交互方法、装置和设备。
背景技术
语音识别技术已经广泛应用于多种智能设备中,比如,家庭中的音箱、电视机或者公共场所中的服务型机器人等等。上述两种场景都属于使用用户众多的复杂应用场景。此种应用场景中通常可以包括普通用户和特殊用户,其中,普通用户可以流畅地使用普通话进行交流,而特殊用户通常具有较低的普通话水平,比如口音较重或者只会说方言的老人、小孩等等。
现有的语音识别技术都是以普通话为基础进行的,智能设备在进行语音识别时并没有考虑到用户使用方言的情况,因此,对于上述的特殊用户发出的语音指令,设备通常不能准确的识别出用户的意图,导致智能设备返回的语音指令的响应结果是不准确的,也即是不能为特殊用户提供优质的服务。因此,如何使智能设备能够准确识别出上述特殊用户发出的语音指令就成为一个亟待解决的问题。
发明内容
有鉴于此,本发明实施例提供一种交互方法、装置、设备和系统,用以提高语音识别的准确性,使智能设备返回准确的响应结果。
第一方面,本发明实施例提供一种交互方法,包括:
接收语音指令;
识别所述语音指令对应的语言类型;
根据所述语言类型确定对应于所述语音指令的响应结果。
第二方面,本发明实施例提供一种交互装置,包括:
接收模块,用于接收语音指令;
语言类型识别模块,用于识别所述语音指令对应的语言类型;
响应结果确定模块,用于根据所述语言类型确定对应于所述语音指令的响应结果。
第三方面,本发明实施例提供一种电子设备,包括处理器和存储器,所述存储器用于存储一条或多条计算机指令,其中,所述一条或多条计算机指令被所述处理器执行时实现上述第一方面中的交互方法。该电子设备还可以包括通信接口,用于与其他设备或通信网络通信。
本发明实施例提供了一种计算机存储介质,用于储存存储计算机程序,所述计算机程序使计算机执行时实现上述第一方面中的交互方法。
第四方面,本发明实施例提供一种交互方法,应用于终端设备,包括:
接收用户产生的语音指令;
发送所述语音指令至服务器,以使所述服务器确定对应于所述语音指令的响应结果;
输出所述服务器发送的响应结果。
第五方面,本发明实施例提供一种交互装置,包括:
接收模块,用于接收用户产生的语音指令;
发送模块,用于发送所述语音指令至服务器,以使所述服务器确定对应于所述语音指令的响应结果;
输出模块,用于输出所述服务器发送的响应结果。
第六方面,本发明实施例提供一种终端设备,包括处理器和存储器,所述存储器用于存储一条或多条计算机指令,其中,所述一条或多条计算机指令被所述处理器执行时实现上述第四方面中的交互方法。该终端设备还可以包括通信接口,用于与其他设备或通信网络通信。
本发明实施例提供了一种计算机存储介质,用于储存存储计算机程序,所述计算机程序使计算机执行时实现上述第四方面中的交互方法。
第七方面,本发明实施例提供一种交互方法,应用于服务器,包括:
接收终端设备发送的语音指令;
识别所述语音指令对应的语言类型;
根据所述语言类型确定对应于所述语音指令的响应结果;
发送所述响应结果至所述终端设备,以使所述终端设备输出所述响应结果。
第八方面,本发明实施例提供一种交互装置,应用于服务器,包括:
接收模块,用于接收终端设备发送的语音指令;
识别模块,用于识别所述语音指令对应的语言类型;
确定模块,用于根据所述语言类型确定对应于所述语音指令的响应结果;
发送模块,用于发送所述响应结果至所述终端设备,以使所述终端设备输出所述响应结果。
第九方面,本发明实施例提供一种服务器,包括处理器和存储器,所述存储器用于存储一条或多条计算机指令,其中,所述一条或多条计算机指令被所述处理器执行时实现上述第七方面中的交互方法。该服务器还可以包括通信接口,用于与其他设备或通信网络通信。
本发明实施例提供了一种计算机存储介质,用于储存存储计算机程序,所述计算机程序使计算机执行时实现上述第七方面中的交互方法。
第十方面,本发明实施例提供一种交互方法,应用于终端设备,包括:
接收用户发出的语音指令;
识别所述语音指令对应的语言类型;
根据所述语言类型确定对应于所述语音指令的搜索关键词;
发送所述搜索关键词至服务器,以使所述服务器根据所述搜索关键词确定对应于所述语音指令的响应结果;
输出所述响应结果。
第十一方面,本发明实施例提供一种交互装置,应用于终端设备,包括:
接收模块,用于接收用户发出的语音指令;
识别模块,用于识别所述语音指令对应的语言类型;
确定模块,用于根据所述语言类型确定对应于所述语音指令的搜索关键词;
发送模块,用于发送所述搜索关键词至服务器,以使所述服务器根据所述搜索关键词确定对应于所述语音指令的响应结果;
输出模块,用于输出所述响应结果。
第十二方面,本发明实施例提供一种终端设备,包括处理器和存储器,所述存储器用于存储一条或多条计算机指令,其中,所述一条或多条计算机指令被所述处理器执行时实现上述第十方面中的交互方法。该终端设备还可以包括通信接口,用于与其他设备或通信网络通信。
本发明实施例提供了一种计算机存储介质,用于储存存储计算机程序,所述计算机程序使计算机执行时实现上述第十方面中的交互方法。
第十三方面,本发明实施例提供一种交互方法,应用于服务器,包括:
接收终端设备发送的对应于语音指令的搜索关键词;
根据所述搜索关键词确定对应于所述语音指令的响应结果;
发送所述响应结果至所述终端设备,以使所述终端设备输出所述响应结果。
第十四方面,本发明实施例提供一种交互装置,应用于服务器,包括:
接收模块,用于接收终端设备发送的对应于语音指令的搜索关键词;
确定模块,用于根据所述搜索关键词确定对应于所述语音指令的响应结果;
发送模块,用于发送所述响应结果至所述终端设备,以使所述终端设备输出所述响应结果。
第十五方面,本发明实施例提供一种服务器,包括处理器和存储器,所述存储器用于存储一条或多条计算机指令,其中,所述一条或多条计算机指令被所述处理器执行时实现上述第十三方面中的交互方法。该服务器还可以包括通信接口,用于与其他设备或通信网络通信。
本发明实施例提供了一种计算机存储介质,用于储存存储计算机程序,所述计算机程序使计算机执行时实现上述第十三方面中的交互方法。
第十六方面,本发明实施例提供一种交互系统,包括:服务器和终端设备;
所述终端设备,用于接收用户产生的语音指令;以及发送所述语音指令至所述服务器;
所述服务器,用于识别所述语音指令对应的语言类型;根据所述语言类型确定对应于所述语音指令的响应结果;以及发送所述响应结果至所述终端设备;
所述终端设备,还用于输出所述响应结果。
第十七方面,本发明实施例提供一种交互系统,包括:服务器和终端设备;
所述终端设备,用于接收用户发出的语音指令;识别所述语音指令对应的语言类型;根据所述语言类型确定对应于所述语音指令的搜索关键词;以及发送所述搜索关键词至所述服务器;
所述服务器,用于接收所述搜索关键词;根据所述搜索关键词确定对应于所述语音指令的响应结果;以及发送所述响应结果至所述终端设备;
所述终端设备,还用于输出所述响应结果。
本发明实施例提供的交互方法,智能设备接收语音指令,对此语音指令进行类型识别,以得到此语音指令对应的语言类型,语言类型可以是不同语种的语言或者不同地区的方言等等。进一步地,再根据此语音指令对应的语言类型确定对应于此语音指令的响应结果,并将此响应结果发送至语音指令对应的用户,从而实现用户与智能设备之间的交互。由于同一个词语在不同类型的语言中可能具有不同的含义,而上述交互方法中存在对接收到的语音指令确定语言类型的过程,这能够保证智能设备是基于此种语言类型来确定语音指令对应的搜索关键词的,并基于此搜索关键词得到的语音指令的响应结果,以提高确定出的响应结果的准确性。通过增加语言类型的识别过程,对于不同语言类型的用户发出的语音指令,智能设备都能准确地返回响应结果。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的一种交互方法的流程图;
图2为本发明实施例提供的另一种交互方法的流程图;
图3为本发明实施例提供的另一种交互方法的流程图;
图4为本发明实施例提供的又一种交互方法的流程图;
图5为本发明实施例提供的又一种交互方法的流程图;
图6为本发明实施例提供的又一种交互方法的流程图;
图7为本发明实施例提供的一种交互装置的结构示意图;
图8为与图7所示实施例提供的交互装置对应的电子设备的结构示意图;。
图9为本发明实施例提供的另一种交互装置的结构示意图;
图10为与图9所示实施例提供的交互装置对应的终端设备的结构示意图;
图11为本发明实施例提供的又一种交互装置的结构示意图;
图12为与图11所示实施例提供的交互装置对应的服务器的结构示意图;
图13为本发明实施例提供的又一种交互装置的结构示意图;
图14为与图13所示实施例提供的交互装置对应的终端设备的结构示意图;
图15为本发明实施例提供的又一种交互装置的结构示意图;
图16为与图15所示实施例提供的交互装置对应的服务器的结构示意图;
图17为本发明实施例提供的一种交互系统的结构示意图;
图18为本发明实施例提供的另一种交互系统的结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
在本发明实施例中使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本发明。在本发明实施例和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义,“多种”一般包含至少两种,但是不排除包含至少一种的情况。
应当理解,本文中使用的术语“和/或”仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,本文中字符“/”,一般表示前后关联对象是一种“或”的关系。
取决于语境,如在此所使用的词语“如果”、“若”可以被解释成为“在……时”或“当……时”或“响应于确定”或“响应于识别”。类似地,取决于语境,短语“如果确定”或“如果识别(陈述的条件或事件)”可以被解释成为“当确定时”或“响应于确定”或“当识别(陈述的条件或事件)时”或“响应于识别(陈述的条件或事件)”。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的商品或者系统不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种商品或者系统所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的商品或者系统中还存在另外的相同要素。
另外,下述各方法实施例中的步骤时序仅为一种举例,而非严格限定。
图1为本发明实施例提供的一种交互方法的流程图,本发明实施例提供的该交互方法可以由具有问答功能的智能设备来执行。如图1所示,该方法包括如下步骤:
S101,接收语音指令。
S102、识别语音指令对应的语言类型。
S103,根据语言类型确定对应于语音指令的响应结果。
承接现有技术中的描述,智能设备可以应用于家庭场景或者公共场景中。在不同的场景下,用户都可能存在与智能设备交互的需求。用户可以根据自身需求发出语音指令,智能设备通过自身配置的语音接收组件,比如麦克风阵列来接收用户发出的语音指令,其中,语音指令可以是与智能设备进行对话的对话指令,可以是希望智能设备返回搜索结果的搜索指令,也可以是对其他设备进行控制的控制指令等等。
在接收到语音指令后,智能设备会对语音指令进行特征提取,再利用声学模型分别计算各个特征的第一概率,第一概率表示语音到音节的概率;利用语言模型分别计算各个特征的第二概率,第二概率表示音节到字的概率。最终根据各特征各自的第一概率和第二概率得到语音指令的识别结果。此识别结果可以理解成一个搜索关键词。智能设备可以利用此搜索关键词进行搜索,并最终得到搜索结果也即是对应于语音指令的响应结果。智能设备将响应结果返回给用户后也即是完成了用户与智能设备之间的交互。
而在实际应用中,由于一个相同的词语在不同的语言类型中可能表示的是不同的含义。其中,语言类型可以一地理区域的方言,也可以是某一国家的语言。并且语言类型可以用于表示语音指令对应的用户地域信息。比如,河南人说的“吃饭”是吃面的意思,而浙江人说“吃饭”是吃米饭的意思。再比如,“ventilador”在英语中是呼吸器的意思,在西班牙语中是电风扇的意思。
在这种情况下,使用上述没有考虑语言类型确定出的搜索关键词进行搜索后得到的响应结果显然准确性是不够的。因此,在接收到语音指令后,智能设备还会对进一步识别此语音指令对应的语言类型。然后,结合语言类型来最终确定语音指令对应的搜索关键词。再以此搜索关键词进行搜索,并将得到的搜索结果作为对应于语音指令的响应结果返回给用户,从而实现用户与智能设备之间的交互。
承接上述举例,智能设备对一语音指令进行识别得到的搜索关键词为“吃饭”。此时,若不考虑语言类型,则智能设备会直接以“吃饭”为关键词进行搜索以得到搜索结果即响应结果。若语音指令的语言类型是河南方言,考虑语言类型后,则智能设备会以“吃面”为关键词进行搜索,从而得到响应结果。而以“吃面”为搜索关键词进行搜索得到的响应结果显然是更加符合发出此语音指令并且地域信息为河南的用户的需求的。
对于上述描述中提到的语音类型识别,一种可选地方式,智能设备可以利用已经训练好的语种识别器识别语言类型。对于语种识别器,可以预先搜集不同语言类型的语句,并将搜集到的语句以及各语句对应的语言类型作为训练样本输入到语种识别器中,以完成语种识别器的训练。由于模型训练过程已经是一个较为成熟的技术,因此,具体训练过程在此不再赘述。
另外,在实际应用中,语音指令也可以是多种多样的,例如问答式指令和控制式指令等等。若语音指令是问答式指令,比如附近有什么人气美食等,则智能设备在根据语言类型确定出搜索关键词后,会将所有包含此搜索关键词的搜索结果返回给用户。可选地,智能设备可以按照搜索结果的热度高低,将搜索结果以语音的形式返回给此语音指令对应的用户。若语音指令是一种控制指令,比如播放一首歌曲,购买产品A等等,则智能设备可以直接控制对应的音乐应用或者购物应用来完成用户的指令。在完成指令后,智能设备同样可以以语音的形式通知用户语音指令已完成。
本发明实施例中,智能设备接收语音指令,对此语音指令进行类型识别,以得到此语音指令对应的语言类型。进一步地,再根据此语音指令对应的语言类型确定对应于此语音指令的响应结果,并将此响应结果发送至语音指令对应的用户,从而实现用户与智能设备之间的交互。由于同一个词语在不同类型的语言中可能具有不同的含义,而上述交互方法中存在对接收到的语音指令确定语言类型的过程,这能够保证智能设备是基于此种语言类型来确定语音指令对应的搜索关键词的,并基于此搜索关键词得到的语音指令的响应结果,以提高确定出的响应结果的准确性。通过增加语言类型的识别过程,对于不同语言类型的用户发出的语音指令,智能设备都能准确地返回响应结果。
上述实施例也提及到了本发明提供的交互方法可以适用于不同场景中,对于使用用户数量有限并且使用频率较高的家庭场景或者办公场景中,每个家庭成员或部门成员都会出现多次使用智能设备的情况。
基于此,图2为本发明实施例提供的另一种交互方法的流程图,如图2所示,该交互方法可以包括如下步骤:
S201,接收语音指令
S202,识别语音指令对应的语言类型。
上述步骤201~202的执行过程与上述实施例的相应步骤相似,可以参见如图1所示实施例中的相关描述,在此不再赘述。
S203,根据语音指令的声纹特征识别语音指令对应的用户。
S204,获取用户对应的历史使用行为。
智能设备在接收到语音指令后,还会对此语音指令进行分析,以得到此语音指令的声纹特征,可选地,声纹特征可以包括语音信号的波长、频率、强度、等等。由于每个人发出的语音指令的声纹特征都是不用的,因此,声纹特征和用户之间具有一一对应的关系。智能设备中已经存储有所有使用过此智能设备的用户的声纹信息,因此,在接收到语音指令后,智能设备可以通过比对语音指令的声纹特征与已经存储的各用户的声纹特征来确定发出语音指令的用户即语音指令对应的用户。
其中,智能设备中可以存储有注册用户的声纹特征,并且注册用户又可以分为主动注册用户和被动注册用户。具体来说,用户I可以在智能设备首次开机时主动向智能设备发出预设数量的语音指令,此时,智能设备会存储此用户I的声纹特征,用户I则可以称为主动注册用户。当用户II向此智能设备发出语音指令后,此智能设备在返回对应于用户II发出的语音指令的响应结果的同时,还会记录此用户II的声纹特征,并且暂时标注此用户II为陌生用户。当用户II再次向智能设备发出语音指令后,智能设备通过声纹识别和比对,确定此以语音指令对应于用户II,则智能设备会重新标注此用户II为注册用户,用户II则可以称为被动注册用户。
可选地,考虑到智能设备的存储空间,智能设备可以定期删除活跃度较低的注册用户的声纹信息。用户的活跃度可以用用户在预设时间段内发出的语音指令的数量来体现。
在确定出语音指令对应的用户后,一种常见的情况,语音指令对应的用户是注册用户,则智能设备会进一步获取此用户的历史使用行为。可选地,历史使用行为可以包括历史购买行为、历史问答行为等等。
需要说明的是,上述过程是先识别语音指令的语言类型,再识别语音指令对应的用户,但这只是一种示意,本发明并不限定两个过程的执行先后顺序。当然,上述两个过程也可以同时进行。
S205,根据语言类型和历史使用行为确定语音指令对应的响应结果。
在确定出语音指令的语言类型和用户的历史使用行为之后,智能设备会结合这两方面信息来确定语音指令的响应结果。
可选地,首先,智能设备可以根据获取到的用户的历史使用行为确定用户的个人使用行为词语。
根据上述实施例可知,每一条语音指令都对应于一个搜索关键词,而最终确定出的语音指令的响应结果也即是此搜索关键词的搜索结果。因此,用户的每个历史使用行为也都对应于一个历史搜索关键词。一种可选地方式,智能设备可以直接将此全部历史搜索关键词确定为用户的个人使用行为词语。但考虑智能设备的存储空间以及使用行为的频繁程度,另一种可选地方式,智能设备可以统计历史使用行为各自对应的历史搜索关键词的出现次数,并将出现次数高于预设阈值的历史搜索关键词确定为个人使用行为词语,或者将出现次数最多的预设数目的历史搜索关键词确定为个人使用行为词语。
可选地,上述的个人使用行为词语可以存储于一张个人热词表中。
接着,智能设备可以根据语言类型和个人使用行为词语确定语音指令对应的搜索关键词。
最后,智能设备可以将与搜索关键词对应的搜索结果作为响应结果。
此时,智能设备已经知晓语音指令的语言类型、发出此语音指令的用户以及此用户的个人使用行为词语。同时智能设备中还会记录有用户的每条历史语音指令对应的搜索关键词和对应于语音指令的响应结果之间的关联关系。这样的话,当同一用户发出的语音指令a和一历史语音指令b对应的搜索关键词相同时,则智能设备可以直接利用搜索关键词和响应结果之间的关联关系确定出对应于语音指令a的响应结果,提高了响应结果的确定速度。
同时,由于在确定此历史语音指令b对应的搜索关键词时是考虑到语言类型的,则确定出的对应于此历史语音指令b的响应结果是具有较高准确度的,因此,智能设备确定出的对应于此语音指令a的响应结果同样也是具有较高准确度的。
再实际应用中,可选地,在根据历史使用行为确定用户的个人使用行为词语之后,该交互方法还可以包括如下步骤:根据个人使用行为词语确定与个人使用行为词语属于同一领域的补充词语。
具体来说,用户的个人使用行为词语可以包括众多领域,比如医药领域或者娱乐明星等等。个人使用行为词语中某一领域的词语越多,则表明用户对于此领域具有较强的交互需求。因此,智能设备还可以将此领域的其他高频词语确定为补充词语。可选地,此补充词语和上述的个人使用行为词语都可以存放于一张个人热词表中。智能设备在确定出补充词语的同时,还可以得到补充词语与搜索结果之间的关联关系,此搜索结果也即是以补充词语为搜索关键词得到的搜索结果。
在确定出补充词语后,以医药领域为例,当用户再次发出语音指令并且其对应的搜索关键词为医药领域的词语时,智能设备则可以利用上述补充词语与搜索结果之间的关联关系快速、准确的得到对应于语音指令的响应结果。
举例来说,用户的个人热词表中包含众多医药领域的词语,当确定出语音指令对应的搜索关键词是葡萄糖时,则语音指令的响应结果是医用葡萄糖相关的内容。用户的个人热词表中包含众多美食领域的词语,当确定出语音指令对应的搜索关键词是葡萄糖时,则语音指令的响应结果是糖果相关的内容。对于具有不同语言类型、不同历史使用行为的用户,即使发出相同的语音指令,由于用户的偏好是不同,则其响应结果也是不同的,得到的响应结果都是与用户的个人偏好相关的。
本发明实施例中,智能设备在识别出语音指令的语言类型后,再识别语音指令对应的用户,进一步地获取此用户的个人偏好也即是个人使用行为词语以及补充词语,然后结合语言类型以及用户的个人偏好确定语音指令对应的搜索关键词,并以此搜索关键词进行搜索得到的符合用户个人偏好的响应结果,将此响应结果返回给用户,在实现用户与智能设备之间的交互的基础上保证响应结果的准确性。
综上所述,如图1所示的实施例是根据语音指令的语言类型确定对应于语音指令的响应结果,以提高确定出的响应结果的准确性。如图2所示的实施例是同时结合语音指令的语言类型以及语音指令对应的用户的个人偏好,其中,用户的个人偏好可以包括对应与用户历史行为的个人使用行为词语以及补充词语。与图1所示的实施例相比,图2所示的实施例可以进一步提高确定出的响应结果的准确性。
另外,上述实施例中是以确定出语音指令对应的用户是注册用户前提进行说明的。在实际应用中,尤其是公共场景下,经过步骤203确定出的用户很容易是陌生用户,此时,由于用户是陌生用户,所以无法也无需参考用户的个人偏好来确定响应结果。则智能设备则可以按照图1所示实施例中步骤103中的相关描述来确定对应于语音指令的响应结果,并将响应结果返回给此陌生用户。
除此之外,上述各实施例中并未限定接收到的语音指令的数量。在实际应用中,还有可能出现多个用户连续向智能设备发出语音指令的情况,而智能设备对于每条语音指令的处理方式都是相同。但由于智能设备同一时间只能处理一条语音指令,因此,可选地,智能设备可以按照下述方式为多条语音指令设置处理的先后顺序。
智能设备先获取多条语音指令各自对应的用户的等级,然后按照等级由高到低依次对多条语音指令进行处理。具体处理过程可以参见上述各实施例中的相关描述。
对于用户的等级的确定方式,一种可选地方式,智能设备会定期或不定期对预设时间段内用户各自发出的语音指令的数量进行统计并记录。因此,智能设备可以直接获取到预设时间段内用户各自发出的语音指令的数量。再根据语音指令的数量所处的数值区间与用户等级之间的对应关系确定用户的等级。用户等级属于用户的属性之一,因此,在确定出语音指令对应的用户后也即是得到了此用户的等级。
另外,需要说明的是,上述如图1、图2所述的方法实施例中,是以智能设备作即终端设备为执行主体进行说明的,但在实际应用中,上述各方法中的不同步骤也可以分别由智能设备和服务器分别执行。比如,S101由智能设备执行,S102~S103由服务器执行,或者S101~S102由智能设备执行,S103由服务器执行等等。
基于此,图3为本发明实施例提供的另一种交互方法的流程图,如图3所示,该交互方法可以由终端设备也即上述各实施例中的智能设备执行,方法可以包括如下步骤:
S301,接收用户产生的语音指令。
S302,发送语音指令至服务器,以使服务器确定对应于语音指令的响应结果。
S303,输出服务器发送的响应结果。
用户可以根据自身需求向终端设备发出语音指令,终端设备接收此语音设备,并将其发送至服务器。服务器则会对语音指令进行语言类型识别等处理,从而确定出对应于语音指令的响应结果,最终,服务器会将此响应结果发送至终端设备。终端设备接收并输出此响应结果,以使用户可以获得此响应结果。
为了了解用户的使用体验,可选地,S303之后,该交互方法还可以包括:
S304,输出对应于响应结果的提示信息,以提示用户对响应结果的准确性进行判断。
终端设备在输出响应结果的同时,还可以输出提示信息,此提示信息可以是语音形式或者文字界面的形式,以提示用户对响应结果的准确性进行判断,终端设备可以将用户输入的准确性的结果发送至服务器,以使服务器根据准确性的高低,不断优化响应结果的确定算法,提高响应结果的准确度。
本实施例中未详细描述的部分,可参考对图1至图2所示实施例的相关说明。该技术方案的执行过程和技术效果参见图1至图2所示实施例中的描述,在此不再赘述。
图4为本发明实施例提供的又一种交互方法的流程图,如图4所示,该交互方法可以由服务器执行,方法可以包括如下步骤:
S401,接收终端设备发送的语音指令。
S402,识别语音指令对应的语言类型。
S403,根据语言类型确定对应于语音指令的响应结果。
S404,发送响应结果至终端设备,以使终端设备输出响应结果。
服务器接收终端设备发送的语音指令,并识别语音指令对应的语言类,再根据语言类型确定对应于语音指令的响应结果,最终发送响应结果至终端设备。最终,终端设备通过对响应结果进行输出,以使用户获得此响应结果。
可选地,对于用户发出的搜索语音指令,服务器还会结合语音指令和语音指令对应的语言类型确定出搜索关键词,并利用此搜索关键词进行搜索,搜索结果也即是发送至终端设备的响应结果。
可选地,服务器还可以根据语音指令的声纹特征识别语音指令对应的用户,从而进一步获得发出此语音指令的用户的历史使用行为,并根据语言类型以及历史使用行为确定出响应结果。
可选地,若多个用户同时向终端设备发出语音指令,服务器可以先根据声纹特征识别出发出此语音指令的用户,并根据用户的等级先后确定语音指令的响应结果。其中,用户的等级可以根据用户发出的历史语音指令的数量来确定。
本实施例中未详细描述的部分,比如语言类型的识别以及响应结果的确定过程等,可参考对图1至图2所示实施例的相关说明。该技术方案的执行过程和技术效果参见图1至图2所示实施例中的描述,在此不再赘述。
可见,终端设备和服务器分别执行如图3、图4所示交互方法则可以完整地实现对语音指令的各种处理,最终可以使用户通过终端设备获得对应于语音指令的响应结果。
图5为本发明实施例提供的又一种交互方法的流程图,如图5所示,该交互方法可以由终端设备即智能设备执行,方法可以包括如下步骤:
S501,接收用户发出的语音指令。
S502,识别语音指令对应的语言类型。
S503,根据语言类型确定对应于语音指令的搜索关键词。
S504,发送搜索关键词至服务器,以使服务器根据搜索关键词确定对应于语音指令的响应结果。
S505,输出响应结果。
终端设备接收用户发出的语音指令后,会对语音指令进行语言类型识别。再根据识别出的语音指令对应的语言类型确定语音指令对应的搜索关键词。终端设备再发送此搜索关键词至服务器,以使服务器根据此搜索关键词确定对应于语音指令的响应结果。最终,终端设备接收服务器发送的响应结果,并将其进行输出,以使用户获得语音指令对应的响应结果。
可选地,终端设备还可以根据语音指令的声纹特征识别语音指令对应的用户,从而进一步获得发出此语音指令的用户的历史使用行为,并根据语言类型以及历史使用行为确定出对应于语音指令的搜索关键词。
可选地,与图3所示实施例相同的,输出响应结果的同时,终端设备还可以输出一个提示信息,以提示用户对响应结果的准确性进行确定。
可选地,若终端设备接收到多个用户发出的语音指令后,与图3所示实施例相同的,终端设备同样可以根据用户等级来先后确定出语音指令对应的搜索关键词,其中,用户等级根据用户发出的历史语音指令的数量确定。
本实施例中未详细描述的部分,比如语言类型的识别以及搜索关键词的确定过程等,可参考对图1至图3所示实施例的相关说明。该技术方案的执行过程和技术效果参见图1至图3所示实施例中的描述,在此不再赘述。
图6为本发明实施例提供的又一种交互方法的流程图,如图6所示,该交互方法可以由服务器执行,方法可以包括如下步骤:
S601,接收终端设备发送的对应于语音指令的搜索关键词。
S602,根据搜索关键词确定对应于语音指令的响应结果。
S603,发送响应结果至终端设备,以使终端设备输出响应结果。
终端设备在接收到用户发出的语音指令后,可以确定出此语音指令对应的语言类型和语音指令对应的搜索关键词。服务器接收终端设备发送的语音指令对应的搜索关键词,并利用此搜索关键词进行搜索,从而确定出对应于语音指令的响应结果。最终,将此响应结果发送至终端设备,终端设备通过对响应结果的输出,以使用户获取此响应结果。
本实施例中未详细描述的部分,可参考对图1至图2所示实施例的相关说明。该技术方案的执行过程和技术效果参见图1至图2所示实施例中的描述,在此不再赘述。
可见,终端设备和服务器分别执行如图5、图6所示交互方法则可以完整地实现对语音指令的各种处理,最终可以使用户通过终端设备获得对应于语音指令的响应结果。
以下将详细描述本发明的一个或多个实施例的交互装置。本领域技术人员可以理解,这些交互装置均可使用市售的硬件组件通过本方案所教导的步骤进行配置来构成。
图7为本发明实施例提供的一种交互装置的结构示意图,如图7所示,该装置包括:接收模块11、语言类型识别模块12以及响应结果确定模块13。
所述接收模块11,用于接收语音指令。
所述语言类型识别模块12,用于识别所述语音指令对应的语言类型。
所述响应结果确定模块13,用于根据所述语言类型确定对应于所述语音指令的响应结果。
可选地,所述语言类型为对应于一地理区域的方言;
所述响应结果确定模块13包括:关键词确定单元131和响应结果确定单元132。
所述关键词确定单元131用于:根据所述语言类型确定所述语音指令对应的搜索关键词。
所述响应结果确定单元132,用于将与所述搜索关键词对应的搜索结果作为所述响应结果。
可选地,所述装置还包括:用户识别模块21和历史行为获取模块22。
所述用户识别模块21,用于根据所述语音指令的声纹特征识别所述语音指令对应的用户。
所述历史行为获取模块22,用于获取所述用户对应的历史使用行为。
所述响应结果确定模块13,用于根据所述语言类型和所述历史使用行为确定所述语音指令对应的响应结果。
可选地,所述响应结果确定模块13还包括:第一类词语获取单元133,用于根据所述历史使用行为确定所述用户的个人使用行为词语。
所述关键词确定单元131,用于根据所述语言类型和所述个人使用行为词语确定所述语音指令对应的搜索关键词。
所述响应结果确定单元132,用于将与所述搜索关键词对应的搜索结果作为所述响应结果。
可选地,所述第一类词语确定单元133具体用于:统计所述历史使用行为各自对应的历史搜索关键词的出现次数;以及将出现次数高于预设阈值的历史搜索关键词确定为所述个人使用行为词语。
可选地,所述装置还包括:第二类词语确定模块23,用于根据所述个人使用行为词语确定与所述个人使用行为词语属于同一领域的补充词语。
所述关键词确定单元131,用于根据所述语言类型、所述个人使用行为词语以及所述补充词语确定所述语音指令对应的搜索关键词。
可选地,所述语音指令包括对应于不同用户的多条语音指令;
所述装置还包括:用户等级获取模块24,用于获取所述多条语音指令各自对应的用户的等级。
所述语言类型识别模块12,还用于按照等级由高到低依次对所述多条语音指令执行所述识别所述语音指令对应的语言类型的步骤。
可选地,所述装置还包括:数量获取模块25和用户等级确定模块26。
所述数量获取模块25,用于分别获取预设时间段内用户各自发出的语音指令的数量。
所述用户等级确定模块26,用于根据所述语音指令的数量确定用户的等级。
图7所示装置可以执行图1至图2所示实施例的方法,本实施例未详细描述的部分,可参考对图1至图2所示实施例的相关说明。该技术方案的执行过程和技术效果参见图1至图2所示实施例中的描述,在此不再赘述。
以上描述了交互装置的内部功能和结构,在一个可能的设计中,交互装置的结构可实现为一电子设备,该电子设备可以是具有语音问答功能的智能设备,比如家庭场景中的智能音箱、电视机或者公共场景中的服务型问答机器人,如图8所示,该电子设备可以包括:处理器31和存储器32。其中,所述存储器32用于存储支持该电子设备执行上述图1至图2所示实施例中提供的交互方法的程序,所述处理器31被配置为用于执行所述存储器32中存储的程序。
所述程序包括一条或多条计算机指令,其中,所述一条或多条计算机指令被所述处理器31执行时能够实现如下步骤:
接收语音指令;
识别所述语音指令对应的语言类型;
根据所述语言类型确定对应于所述语音指令的响应结果。
可选地,所述处理器31还用于执行前述图1至图2所示实施例中的全部或部分步骤。
其中,所述电子设备的结构中还可以包括通信接口33,用于该电子设备与其他设备或通信网络通信。
另外,本发明实施例提供了一种计算机存储介质,用于储存上述电子设备所用的计算机软件指令,其包含用于执行上述图1至图2所示方法实施例中交互方法所涉及的程序。
图9为本发明实施例提供的另一种交互装置的结构示意图,如图9所示,该装置包括:接收模块41、发送模块42和输出模块43。
所述接收模块41,用于接收用户产生的语音指令。
所述发送模块42,用于发送所述语音指令至服务器,以使所述服务器确定对应于所述语音指令的响应结果。
所述输出模块43,用于输出所述服务器发送的响应结果。
可选地,该交互装置中的输出模块43,还用于输出对应于所述响应结果的提示信息,以提示所述用户对所述响应结果的准确性进行判断。
图9所示装置可以执行图3所示实施例的方法,本实施例未详细描述的部分,可参考对图3所示实施例的相关说明。该技术方案的执行过程和技术效果参见图3所示实施例中的描述,在此不再赘述。
以上描述了交互装置的内部功能和结构,在一个可能的设计中,交互装置的结构可实现为一终端设备,该终端设备可以是具有语音问答功能的智能设备,比如家庭场景中的智能音箱、电视机或者公共场景中的服务型问答机器人,如图10所示,该终端设备可以包括:处理器51和存储器52。其中,所述存储器52用于存储支持该终端设备执行上述图3所示实施例中提供的交互方法的程序,所述处理器51被配置为用于执行所述存储器52中存储的程序。
所述程序包括一条或多条计算机指令,其中,所述一条或多条计算机指令被所述处理器51执行时能够实现如下步骤:
接收用户产生的语音指令;
发送所述语音指令至服务器,以使所述服务器确定对应于所述语音指令的响应结果;
输出所述服务器发送的响应结果。
可选地,所述处理器51还用于执行前述图3所示实施例中的全部或部分步骤。
其中,所述终端设备的结构中还可以包括通信接口53,用于该终端设备与其他设备或通信网络通信。
另外,本发明实施例提供了一种计算机存储介质,用于储存上述终端设备所用的计算机软件指令,其包含用于执行上述图3所示方法实施例中交互方法所涉及的程序。
图11为本发明实施例提供的又一种交互装置的结构示意图,如图11所示,该装置包括:接收模块61、识别模块62、确定模块63和发送模块64。
所述接收模块61,用于接收终端设备发送的语音指令。
所述识别模块62,用于识别所述语音指令对应的语言类型。
所述确定模块63,用于根据所述语言类型确定对应于所述语音指令的响应结果。
所述发送模块64,用于发送所述响应结果至所述终端设备,以使所述终端设备输出所述响应结果。
图11所示装置可以执行图4所示实施例的方法,本实施例未详细描述的部分,可参考对图4所示实施例的相关说明。该技术方案的执行过程和技术效果参见图4所示实施例中的描述,在此不再赘述。
以上描述了交互装置的内部功能和结构,在一个可能的设计中,交互装置的结构可实现为一服务器。如图12所示,该服务器可以包括:处理器71和存储器72。其中,所述存储器72用于存储支持该服务器执行上述图4所示实施例中提供的交互方法的程序,所述处理器71被配置为用于执行所述存储器72中存储的程序。
所述程序包括一条或多条计算机指令,其中,所述一条或多条计算机指令被所述处理器71执行时能够实现如下步骤:
接收终端设备发送的语音指令;
识别所述语音指令对应的语言类型;
根据所述语言类型确定对应于所述语音指令的响应结果;
发送所述响应结果至所述终端设备,以使所述终端设备输出所述响应结果。
可选地,所述处理器71还用于执行前述图4所示实施例中的全部或部分步骤。
其中,所述服务器的结构中还可以包括通信接口73,用于该服务器与其他设备或通信网络通信。
另外,本发明实施例提供了一种计算机存储介质,用于储存上述服务器所用的计算机软件指令,其包含用于执行上述图4所示方法实施例中交互方法所涉及的程序。
图13为本发明实施例提供的又一种交互装置的结构示意图,如图13所示,该装置包括:接收模块81、识别模块82、确定模块83、发送模块84和输出模块85。
所述接收模块81,用于接收用户发出的语音指令。
所述识别模块82,用于识别所述语音指令对应的语言类型。
所述确定模块83,用于根据所述语言类型确定对应于所述语音指令的搜索关键词。
所述发送模块84,用于发送所述搜索关键词至服务器,以使所述服务器根据所述搜索关键词确定对应于所述语音指令的响应结果。
所述输出模块85,用于输出所述响应结果。
图13所示装置可以执行图5所示实施例的方法,本实施例未详细描述的部分,可参考对图5所示实施例的相关说明。该技术方案的执行过程和技术效果参见图5所示实施例中的描述,在此不再赘述。
以上描述了交互装置的内部功能和结构,在一个可能的设计中,交互装置的结构可实现为一终端设备,该终端设备可以是具有语音问答功能的智能设备,比如家庭场景中的智能音箱、电视机或者公共场景中的服务型问答机器人,如图14所示,该终端设备可以包括:处理器91和存储器92。其中,所述存储器92用于存储支持该终端设备执行上述图5所示实施例中提供的交互方法的程序,所述处理器91被配置为用于执行所述存储器92中存储的程序。
所述程序包括一条或多条计算机指令,其中,所述一条或多条计算机指令被所述处理器91执行时能够实现如下步骤:
接收用户发出的语音指令;
识别所述语音指令对应的语言类型;
根据所述语言类型确定对应于所述语音指令的搜索关键词;
发送所述搜索关键词至服务器,以使所述服务器根据所述搜索关键词确定对应于所述语音指令的响应结果;
输出所述响应结果。
可选地,所述处理器91还用于执行前述图5所示实施例中的全部或部分步骤。
其中,所述终端设备的结构中还可以包括通信接口93,用于该终端设备与其他设备或通信网络通信。
另外,本发明实施例提供了一种计算机存储介质,用于储存上述终端设备所用的计算机软件指令,其包含用于执行上述图5所示方法实施例中交互方法所涉及的程序。
图15为本发明实施例提供的又一种交互装置的结构示意图,如图15所示,该装置包括:接收模块101、识别模块102和发送模块103。
所述接收模块101,用于接收终端设备发送的对应于语音指令的搜索关键词。
所述确定模块102,用于根据所述搜索关键词确定对应于所述语音指令的响应结果。
所述发送模块103,用于发送所述响应结果至所述终端设备,以使所述终端设备输出所述响应结果。
图15所示装置可以执行图6所示实施例的方法,本实施例未详细描述的部分,可参考对图6所示实施例的相关说明。该技术方案的执行过程和技术效果参见图6所示实施例中的描述,在此不再赘述。
以上描述了交互装置的内部功能和结构,在一个可能的设计中,交互装置的结构可实现为一服务器。如图16所示,为了与图7所示实施例中的标号区别开来,该服务器可以包括:处理器11-1和存储器11-2。其中,所述存储器11-2用于存储支持该服务器执行上述图6所示实施例中提供的交互方法的程序,所述处理器11-1被配置为用于执行所述存储器11-2中存储的程序。
所述程序包括一条或多条计算机指令,其中,所述一条或多条计算机指令被所述处理器11-1执行时能够实现如下步骤:
接收终端设备发送的对应于语音指令的搜索关键词;
根据所述搜索关键词确定对应于所述语音指令的响应结果;
发送所述响应结果至所述终端设备,以使所述终端设备输出所述响应结果。
可选地,所述处理器11-1还用于执行前述图6所示实施例中的全部或部分步骤。
其中,所述服务器的结构中还可以包括通信接口11-3,用于该服务器与其他设备或通信网络通信。
另外,本发明实施例提供了一种计算机存储介质,用于储存上述服务器所用的计算机软件指令,其包含用于执行上述图6所示方法实施例中交互方法所涉及的程序。
图17为本发明实施例提供的一种交互系统的结构示意图,如图17所示,该系统包括:终端设备1和服务器2。
所述终端设备1,用于接收用户产生的语音指令;以及发送所述语音指令至所述服务器。
所述服务器2,用于识别所述语音指令对应的语言类型;根据所述语言类型确定对应于所述语音指令的响应结果;以及发送所述响应结果至所述终端设备。
所述终端设备1,还用于输出所述响应结果。
可选地,所述终端设备1还用于:输出对应于所述响应结果的提示信息,以提示所述用户对所述响应结果的准确性进行判断。
本实施例未详细描述的部分,可参考对图1至图4所示实施例的相关说明。该技术方案的执行过程和技术效果参见图1至图4所示实施例中的描述,在此不再赘述。
图18为本发明实施例提供的另一种交互系统的结构示意图,如图18所示,该系统包括:终端设备3和服务器4。
所述终端设备3,用于接收用户发出的语音指令;识别所述语音指令对应的语言类型;根据所述语言类型确定对应于所述语音指令的搜索关键词;以及发送所述搜索关键词至所述服务器。
所述服务器4,用于接收所述搜索关键词;根据所述搜索关键词确定对应于所述语音指令的响应结果;以及发送所述响应结果至所述终端设备。
所述终端设备3,还用于输出所述响应结果。
本实施例未详细描述的部分,可参考对图1~2以及图5~6所示实施例的相关说明。该技术方案的执行过程和技术效果参见图1~2以及图5~6所示实施例中的描述,在此不再赘述。
以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助加必需的通用硬件平台的方式来实现,当然也可以通过硬件和软件结合的方式来实现。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以计算机产品的形式体现出来,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (26)

1.一种交互方法,其特征在于,包括:
接收语音指令;
识别所述语音指令对应的语言类型;
根据所述语言类型确定对应于所述语音指令的响应结果。
2.根据权利要求1所述的方法,其特征在于,所述语言类型为对应于一地理区域的方言;
根据所述语言类型确定对应于所述语音指令的响应结果,包括:
根据所述语言类型确定所述语音指令对应的搜索关键词;
将与所述搜索关键词对应的搜索结果作为所述响应结果。
3.根据权利要求1所述的方法,其特征在于,所述方法还包括:
根据所述语音指令的声纹特征识别所述语音指令对应的用户;
获取所述用户对应的历史使用行为;
所述根据所述语言类型确定所述语音指令对应的响应结果,包括:
根据所述语言类型和所述历史使用行为确定所述语音指令对应的响应结果。
4.根据权利要求3所述的方法,其特征在于,所述根据所述语言类型和所述历史使用行为确定所述语音指令对应的响应结果,包括:
根据所述历史使用行为确定所述用户的个人使用行为词语;
根据所述语言类型和所述个人使用行为词语确定所述语音指令对应的搜索关键词;
将与所述搜索关键词对应的搜索结果作为所述响应结果。
5.根据权利要求4所述的方法,其特征在于,所述根据所述历史使用行为确定所述用户的个人使用行为词语,包括:
统计所述历史使用行为各自对应的历史搜索关键词的出现次数;
将出现次数高于预设阈值的历史搜索关键词确定为所述个人使用行为词语。
6.根据权利要求4所述的方法,其特征在于,所述根据所述历史使用行为确定所述用户的个人使用行为词语之后,所述方法还包括:
根据所述个人使用行为词语确定与所述个人使用行为词语属于同一领域的补充词语;
所述根据所述语言类型和所述个人使用行为词语确定所述语音指令对应的搜索关键词,包括:
根据所述语言类型、所述个人使用行为词语以及所述补充词语确定所述语音指令对应的搜索关键词。
7.根据权利要求3至6中任一项所述的方法,其特征在于,所述语音指令包括对应于不同用户的多条语音指令;
所述根据所述语义指令的声纹特征识别所述语音指令对应的用户之后,所述方法还包括:
获取所述多条语音指令各自对应的用户的等级;
按照等级由高到低依次对所述多条语音指令执行所述识别所述语音指令对应的语言类型的步骤。
8.根据权利要求7所述的方法,其特征在于,所述方法还包括:
分别获取预设时间段内用户各自发出的语音指令的数量;
根据所述语音指令的数量确定用户的等级。
9.一种交互方法,其特征在于,应用于终端设备,包括:
接收用户产生的语音指令;
发送所述语音指令至服务器,以使所述服务器确定对应于所述语音指令的响应结果;
输出所述服务器发送的响应结果。
10.根据权利要求9所述的方法,其特征在于,所述输出所述服务器发送的响应结果之后,所述方法还包括:
输出对应于所述响应结果的提示信息,以提示所述用户对所述响应结果的准确性进行判断。
11.一种交互方法,其特征在于,应用于服务器,包括:
接收终端设备发送的语音指令;
识别所述语音指令对应的语言类型;
根据所述语言类型确定对应于所述语音指令的响应结果;
发送所述响应结果至所述终端设备,以使所述终端设备输出所述响应结果。
12.一种交互方法,其特征在于,应用于终端设备,包括:
接收用户发出的语音指令;
识别所述语音指令对应的语言类型;
根据所述语言类型确定对应于所述语音指令的搜索关键词;
发送所述搜索关键词至服务器,以使所述服务器根据所述搜索关键词确定对应于所述语音指令的响应结果;
输出所述响应结果。
13.一种交互方法,其特征在于,应用于服务器,包括:
接收终端设备发送的对应于语音指令的搜索关键词;
根据所述搜索关键词确定对应于所述语音指令的响应结果;
发送所述响应结果至所述终端设备,以使所述终端设备输出所述响应结果。
14.一种交互装置,其特征在于,包括:
接收模块,用于接收语音指令;
语言类型识别模块,用于识别所述语音指令对应的语言类型;
响应结果确定模块,用于根据所述语言类型确定对应于所述语音指令的响应结果。
15.一种电子设备,其特征在于,包括:存储器、处理器;其中,
所述存储器用于存储一条或多条计算机指令,其中,所述一条或多条计算机指令被所述处理器执行时实现如权利要求1至8中任一项所述的交互方法。
16.一种交互装置,其特征在于,应用于终端设备,包括:
接收模块,用于接收用户产生的语音指令;
发送模块,用于发送所述语音指令至服务器,以使所述服务器确定对应于所述语音指令的响应结果;
输出模块,用于输出所述服务器发送的响应结果。
17.一种终端设备,其特征在于,包括:存储器、处理器;其中,
所述存储器用于存储一条或多条计算机指令,其中,所述一条或多条计算机指令被所述处理器执行时实现如权利要求9至10中任一项所述的交互方法。
18.一种交互装置,其特征在于,应用于服务器,包括:
接收模块,用于接收终端设备发送的语音指令;
识别模块,用于识别所述语音指令对应的语言类型;
确定模块,用于根据所述语言类型确定对应于所述语音指令的响应结果;
发送模块,用于发送所述响应结果至所述终端设备,以使所述终端设备输出所述响应结果。
19.一种服务器,其特征在于,包括:存储器、处理器;其中,
所述存储器用于存储一条或多条计算机指令,其中,所述一条或多条计算机指令被所述处理器执行时实现如权利要求11所述的交互方法。
20.一种交互装置,其特征在于,应用于终端设备,包括:
接收模块,用于接收用户发出的语音指令;
识别模块,用于识别所述语音指令对应的语言类型;
确定模块,用于根据所述语言类型确定对应于所述语音指令的搜索关键词;
发送模块,用于发送所述搜索关键词至服务器,以使所述服务器根据所述搜索关键词确定对应于所述语音指令的响应结果;
输出模块,用于输出所述响应结果。
21.一种终端设备,其特征在于,包括:存储器、处理器;其中,
所述存储器用于存储一条或多条计算机指令,其中,所述一条或多条计算机指令被所述处理器执行时实现如权利要求12所述的交互方法。
22.一种交互装置,其特征在于,应用于服务器,包括:
接收模块,用于接收终端设备发送的对应于语音指令的搜索关键词;
确定模块,用于根据所述搜索关键词确定对应于所述语音指令的响应结果;
发送模块,用于发送所述响应结果至所述终端设备,以使所述终端设备输出所述响应结果。
23.一种服务器,其特征在于,包括:存储器、处理器;其中,
所述存储器用于存储一条或多条计算机指令,其中,所述一条或多条计算机指令被所述处理器执行时实现如权利要求13所述的交互方法。
24.一种交互系统,其特征在于,包括:服务器和终端设备;
所述终端设备,用于接收用户产生的语音指令;以及发送所述语音指令至所述服务器;
所述服务器,用于识别所述语音指令对应的语言类型;根据所述语言类型确定对应于所述语音指令的响应结果;以及发送所述响应结果至所述终端设备;
所述终端设备,还用于输出所述响应结果。
25.根据权利要求24所述的系统,其特征在于,所述终端设备还用于:输出对应于所述响应结果的提示信息,以提示所述用户对所述响应结果的准确性进行判断。
26.一种交互系统,其特征在于,包括:服务器和终端设备;
所述终端设备,用于接收用户发出的语音指令;识别所述语音指令对应的语言类型;根据所述语言类型确定对应于所述语音指令的搜索关键词;以及发送所述搜索关键词至所述服务器;
所述服务器,用于接收所述搜索关键词;根据所述搜索关键词确定对应于所述语音指令的响应结果;以及发送所述响应结果至所述终端设备;
所述终端设备,还用于输出所述响应结果。
CN201811230934.9A 2018-10-22 2018-10-22 交互方法、装置、设备和系统 Pending CN111161706A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811230934.9A CN111161706A (zh) 2018-10-22 2018-10-22 交互方法、装置、设备和系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811230934.9A CN111161706A (zh) 2018-10-22 2018-10-22 交互方法、装置、设备和系统

Publications (1)

Publication Number Publication Date
CN111161706A true CN111161706A (zh) 2020-05-15

Family

ID=70555021

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811230934.9A Pending CN111161706A (zh) 2018-10-22 2018-10-22 交互方法、装置、设备和系统

Country Status (1)

Country Link
CN (1) CN111161706A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022057283A1 (zh) * 2020-09-21 2022-03-24 北京沃东天骏信息技术有限公司 声纹注册方法、装置和计算机可读存储介质

Citations (32)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20040006560A1 (en) * 2000-05-01 2004-01-08 Ning-Ping Chan Method and system for translingual translation of query and search and retrieval of multilingual information on the web
CN1503163A (zh) * 2002-11-22 2004-06-09 �Ҵ���˾ 提供个性化为特定语言的搜索结果的国际搜索和传送系统
CN1526132A (zh) * 2000-10-10 2004-09-01 ض� 基于语音的不受语言限制的搜索系统
CN1815551A (zh) * 2006-02-28 2006-08-09 安徽中科大讯飞信息科技有限公司 在方言语音合成系统中进行文本方言化处理的方法
JP2009069875A (ja) * 2007-09-10 2009-04-02 Sharp Corp コンテンツ検索装置、コンテンツ検索方法、プログラム、および記録媒体
CN102479208A (zh) * 2010-11-26 2012-05-30 苗玉水 汉语语音码多样网页信息搜索转换翻译方法
CN203249629U (zh) * 2013-04-03 2013-10-23 北京中欧美经济技术发展中心 具有语音识别和人机交互功能的导航装置
CN103838735A (zh) * 2012-11-21 2014-06-04 大连灵动科技发展有限公司 一种提高检索效率和质量的数据检索方法
JP2014178380A (ja) * 2013-03-13 2014-09-25 Toshiba Corp 音声認識装置、音声認識プログラム及び音声認識方法
CN104143329A (zh) * 2013-08-19 2014-11-12 腾讯科技(深圳)有限公司 进行语音关键词检索的方法及装置
CN104239463A (zh) * 2014-09-02 2014-12-24 百度在线网络技术(北京)有限公司 搜索方法和搜索引擎
CN105279227A (zh) * 2015-09-11 2016-01-27 百度在线网络技术(北京)有限公司 同音词的语音搜索处理方法及装置
CN105653547A (zh) * 2014-11-12 2016-06-08 北大方正集团有限公司 一种提取文本关键词的方法和装置
CN106227873A (zh) * 2016-07-29 2016-12-14 乐视控股(北京)有限公司 搜索方法及装置
US20170164049A1 (en) * 2015-12-02 2017-06-08 Le Holdings (Beijing) Co., Ltd. Recommending method and device thereof
CN106874402A (zh) * 2017-01-16 2017-06-20 腾讯科技(深圳)有限公司 搜索方法和装置
CN106897319A (zh) * 2015-12-21 2017-06-27 北京奇虎科技有限公司 搜索方法和装置
CN107204185A (zh) * 2017-05-03 2017-09-26 深圳车盒子科技有限公司 车载语音交互方法、系统及计算机可读存储介质
CN107220292A (zh) * 2017-04-25 2017-09-29 上海庆科信息技术有限公司 智能对话装置、反馈式智能语音控制系统及方法
CN107341251A (zh) * 2017-07-10 2017-11-10 江西博瑞彤芸科技有限公司 一种医药偏方与关键字的提取和处理方法
CN107346182A (zh) * 2016-05-05 2017-11-14 北京搜狗科技发展有限公司 一种构建用户词库的方法、及用于构建用户词库的装置
CN107357875A (zh) * 2017-07-04 2017-11-17 北京奇艺世纪科技有限公司 一种语音搜索方法、装置及电子设备
CN107391706A (zh) * 2017-07-28 2017-11-24 湖北文理学院 一种基于移动互联网的城市旅游问答系统
CN107451131A (zh) * 2016-05-30 2017-12-08 贵阳朗玛信息技术股份有限公司 一种语音识别方法及装置
CN107526826A (zh) * 2017-08-31 2017-12-29 百度在线网络技术(北京)有限公司 语音搜索处理方法、装置及服务器
CN107577726A (zh) * 2017-08-22 2018-01-12 努比亚技术有限公司 一种搜索方法、服务器及计算机可读存储介质
CN107610696A (zh) * 2017-08-09 2018-01-19 上海斐讯数据通信技术有限公司 基于用户输入的对话消息的路由器控制方法及路由器
CN107679091A (zh) * 2017-09-07 2018-02-09 北京海融兴通信息安全技术有限公司 一种基于大数据的搜索系统及方法
CN107846336A (zh) * 2017-10-30 2018-03-27 北京聚鼎和科技有限公司 物联网设备控制的方法及装置
CN108062354A (zh) * 2017-11-22 2018-05-22 上海博泰悦臻电子设备制造有限公司 信息推荐方法、系统、存储介质、电子设备及车辆
CN108255939A (zh) * 2017-12-08 2018-07-06 北京搜狗科技发展有限公司 一种跨语言搜索方法和装置、一种用于跨语言搜索的装置
CN108346073A (zh) * 2017-01-23 2018-07-31 北京京东尚科信息技术有限公司 一种语音购物方法和装置

Patent Citations (32)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20040006560A1 (en) * 2000-05-01 2004-01-08 Ning-Ping Chan Method and system for translingual translation of query and search and retrieval of multilingual information on the web
CN1526132A (zh) * 2000-10-10 2004-09-01 ض� 基于语音的不受语言限制的搜索系统
CN1503163A (zh) * 2002-11-22 2004-06-09 �Ҵ���˾ 提供个性化为特定语言的搜索结果的国际搜索和传送系统
CN1815551A (zh) * 2006-02-28 2006-08-09 安徽中科大讯飞信息科技有限公司 在方言语音合成系统中进行文本方言化处理的方法
JP2009069875A (ja) * 2007-09-10 2009-04-02 Sharp Corp コンテンツ検索装置、コンテンツ検索方法、プログラム、および記録媒体
CN102479208A (zh) * 2010-11-26 2012-05-30 苗玉水 汉语语音码多样网页信息搜索转换翻译方法
CN103838735A (zh) * 2012-11-21 2014-06-04 大连灵动科技发展有限公司 一种提高检索效率和质量的数据检索方法
JP2014178380A (ja) * 2013-03-13 2014-09-25 Toshiba Corp 音声認識装置、音声認識プログラム及び音声認識方法
CN203249629U (zh) * 2013-04-03 2013-10-23 北京中欧美经济技术发展中心 具有语音识别和人机交互功能的导航装置
CN104143329A (zh) * 2013-08-19 2014-11-12 腾讯科技(深圳)有限公司 进行语音关键词检索的方法及装置
CN104239463A (zh) * 2014-09-02 2014-12-24 百度在线网络技术(北京)有限公司 搜索方法和搜索引擎
CN105653547A (zh) * 2014-11-12 2016-06-08 北大方正集团有限公司 一种提取文本关键词的方法和装置
CN105279227A (zh) * 2015-09-11 2016-01-27 百度在线网络技术(北京)有限公司 同音词的语音搜索处理方法及装置
US20170164049A1 (en) * 2015-12-02 2017-06-08 Le Holdings (Beijing) Co., Ltd. Recommending method and device thereof
CN106897319A (zh) * 2015-12-21 2017-06-27 北京奇虎科技有限公司 搜索方法和装置
CN107346182A (zh) * 2016-05-05 2017-11-14 北京搜狗科技发展有限公司 一种构建用户词库的方法、及用于构建用户词库的装置
CN107451131A (zh) * 2016-05-30 2017-12-08 贵阳朗玛信息技术股份有限公司 一种语音识别方法及装置
CN106227873A (zh) * 2016-07-29 2016-12-14 乐视控股(北京)有限公司 搜索方法及装置
CN106874402A (zh) * 2017-01-16 2017-06-20 腾讯科技(深圳)有限公司 搜索方法和装置
CN108346073A (zh) * 2017-01-23 2018-07-31 北京京东尚科信息技术有限公司 一种语音购物方法和装置
CN107220292A (zh) * 2017-04-25 2017-09-29 上海庆科信息技术有限公司 智能对话装置、反馈式智能语音控制系统及方法
CN107204185A (zh) * 2017-05-03 2017-09-26 深圳车盒子科技有限公司 车载语音交互方法、系统及计算机可读存储介质
CN107357875A (zh) * 2017-07-04 2017-11-17 北京奇艺世纪科技有限公司 一种语音搜索方法、装置及电子设备
CN107341251A (zh) * 2017-07-10 2017-11-10 江西博瑞彤芸科技有限公司 一种医药偏方与关键字的提取和处理方法
CN107391706A (zh) * 2017-07-28 2017-11-24 湖北文理学院 一种基于移动互联网的城市旅游问答系统
CN107610696A (zh) * 2017-08-09 2018-01-19 上海斐讯数据通信技术有限公司 基于用户输入的对话消息的路由器控制方法及路由器
CN107577726A (zh) * 2017-08-22 2018-01-12 努比亚技术有限公司 一种搜索方法、服务器及计算机可读存储介质
CN107526826A (zh) * 2017-08-31 2017-12-29 百度在线网络技术(北京)有限公司 语音搜索处理方法、装置及服务器
CN107679091A (zh) * 2017-09-07 2018-02-09 北京海融兴通信息安全技术有限公司 一种基于大数据的搜索系统及方法
CN107846336A (zh) * 2017-10-30 2018-03-27 北京聚鼎和科技有限公司 物联网设备控制的方法及装置
CN108062354A (zh) * 2017-11-22 2018-05-22 上海博泰悦臻电子设备制造有限公司 信息推荐方法、系统、存储介质、电子设备及车辆
CN108255939A (zh) * 2017-12-08 2018-07-06 北京搜狗科技发展有限公司 一种跨语言搜索方法和装置、一种用于跨语言搜索的装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022057283A1 (zh) * 2020-09-21 2022-03-24 北京沃东天骏信息技术有限公司 声纹注册方法、装置和计算机可读存储介质

Similar Documents

Publication Publication Date Title
CN109616108B (zh) 多轮对话交互处理方法、装置、电子设备及存储介质
US20200301954A1 (en) Reply information obtaining method and apparatus
US20190057697A1 (en) Better resolution when referencing to concepts
CN107886949B (zh) 一种内容推荐方法及装置
US11392970B2 (en) Administering a digital survey over voice-capable devices
EP2896039B1 (en) Improving phonetic pronunciation
RU2693184C2 (ru) Моделирование контекста сеанса для систем понимания разговорной речи
CN107797984B (zh) 智能交互方法、设备及存储介质
US11106983B2 (en) Intelligent interaction method and intelligent interaction system
US20190102381A1 (en) Exemplar-based natural language processing
EP3032532B1 (en) Disambiguating heteronyms in speech synthesis
US9734193B2 (en) Determining domain salience ranking from ambiguous words in natural speech
US8972265B1 (en) Multiple voices in audio content
US20160379106A1 (en) Human-computer intelligence chatting method and device based on artificial intelligence
US10803850B2 (en) Voice generation with predetermined emotion type
CN111081220B (zh) 车载语音交互方法、全双工对话系统、服务器和存储介质
US20130246392A1 (en) Conversational System and Method of Searching for Information
WO2017097061A1 (zh) 智能应答方法及装置
KR20190082900A (ko) 음성 인식 방법, 전자 디바이스, 및 컴퓨터 저장 매체
CN110415679B (zh) 语音纠错方法、装置、设备和存储介质
JP7132090B2 (ja) 対話システム、対話装置、対話方法、及びプログラム
CN109979450B (zh) 信息处理方法、装置及电子设备
US20170018268A1 (en) Systems and methods for updating a language model based on user input
CN110580516B (zh) 一种基于智能机器人的交互方法及装置
CN110457454A (zh) 一种对话方法、服务器、对话系统及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination