CN109033265A - 一种人机交互方法及装置 - Google Patents

一种人机交互方法及装置 Download PDF

Info

Publication number
CN109033265A
CN109033265A CN201810745415.XA CN201810745415A CN109033265A CN 109033265 A CN109033265 A CN 109033265A CN 201810745415 A CN201810745415 A CN 201810745415A CN 109033265 A CN109033265 A CN 109033265A
Authority
CN
China
Prior art keywords
interactive
voice
wish
value
project
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201810745415.XA
Other languages
English (en)
Other versions
CN109033265B (zh
Inventor
张家重
董毅
索春宝
胡焱
生伟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Inspur Financial Information Technology Co Ltd
Original Assignee
Suzhou Wave Intelligent Software Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Suzhou Wave Intelligent Software Co Ltd filed Critical Suzhou Wave Intelligent Software Co Ltd
Priority to CN201810745415.XA priority Critical patent/CN109033265B/zh
Publication of CN109033265A publication Critical patent/CN109033265A/zh
Application granted granted Critical
Publication of CN109033265B publication Critical patent/CN109033265B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

本发明提供了一种人机交互方法及装置,该方法包括:构建语义几何体序列;其中,所述语义几何体序列包括至少一个标准词以及每一个所述标准词对应的位置坐标;获取用户输入的交互语音信息;从所述交互语音信息中解析出至少一个特征词;根据所述语义几何体序列中与每一个所述特征词相对应的标准词,确定每一个所述特征词在所述语义几何体序列中的目标位置坐标;根据确定出的所述目标位置坐标,确定所述交互语音信息对应的当前语态;确定与所述当前语态以及各个所述特征词相对应的交互项目,并向所述用户输出所述交互项目。本方案能提高用户的交互体验。

Description

一种人机交互方法及装置
技术领域
本发明涉及计算机技术领域,特别涉及一种人机交互方法及装置。
背景技术
随着科学技术的发展,具有人机交互的功能的设备越来越多的走入了人们的生活,提高了人们的生活体验。
人机交互的过程主要为识别用户输入的交互信号,并反馈给用户与交互信号相匹配的项目。当用户输入的交互信号为语音信息时,主要是对语音信息中的内容进行识别,例如用户输入的语音信息中包括A,则从数据库中查找与A相匹配的项目输出给用户。
这种人机交互方式不知道反馈给用户的结果是否正确,对输出结果的判断完全取决于单纯的查询-反馈序列,若数据库发生了问题,则会反馈错误信息给用户,从而使得用户的交互体验较差。
发明内容
本发明实施例提供了一种人机交互方法及装置,能提高用户的交互体验。
第一方面,本发明实施例提供了一种人机交互方法,包括:
构建语义几何体序列;其中,所述语义几何体序列包括至少一个标准词以及每一个所述标准词对应的位置坐标;
获取用户输入的交互语音信息;
从所述交互语音信息中解析出至少一个特征词;
根据所述语义几何体序列中与每一个所述特征词相对应的标准词,确定每一个所述特征词在所述语义几何体序列中的目标位置坐标;
根据确定出的所述目标位置坐标,确定所述交互语音信息对应的当前语态;
确定与所述当前语态以及各个所述特征词相对应的交互项目,并向所述用户输出所述交互项目。
可选地,
所述当前语态包括:交互语态;
在所述从所述交互语音信息中解析出至少一个特征词之后,在所述根据确定出的所述目标位置坐标,确定所述交互语音信息对应的当前语态之前,进一步包括:
根据预设的语法信息确定各个所述特征词的连接顺序;
根据所述连接顺序以及各个所述目标位置坐标,确定每相邻两个所述特征词对应的语态向量;
则,所述根据确定出的所述目标位置坐标,确定所述交互语音信息对应的当前语态,包括:
根据确定出的所述语态向量,确定所述交互语音信息对应的所述交互语态。
可选地,
所述至少一个标准词包括:至少一个疑问语气词;
所述构建语义几何体序列,包括:
在预设的二维数据空间中构建所述语义几何体序列;其中,每一个所述疑问语气词的位置坐标位于所述二维数据空间中的第一象限;
则,当确定出与所述特征词相对应的标准词中存在至少一个所述疑问语气词时,
所述根据确定出的所述语态向量,确定所述交互语音信息对应的交互语态,包括:
确定每一个所述疑问语气词对应的目标语态向量,并确定所述目标语态向量的方向为指向所述第一象限的方向;
根据确定出的指向所述第一象限的各个所述目标语态向量,确定所述交互语态对应的交互值。
可选地,
所述根据确定出的指向所述第一象限的各个所述目标语态向量,确定所述交互语态对应的交互值,包括:
利用下述计算公式,计算所述交互值;
其中,y表征所述交互值,n表征确定出的所述疑问语气词的数量,(xi0,yi0)表征所述疑问语气词对应的位置坐标,(xi1,yi1)表征所述目标语态向量中除所述疑问语气词以外的特征词对应的位置坐标;
可选地,
所述确定与所述当前语态以及各个所述特征词相对应的交互项目,并输出所述交互项目,包括:
确定所述交互语态对应的交互值是否大于预设的交互阈值;
如果是,则从预设的项目数据库中选择与所述特征词相对应的至少一个待选项目;
从所述至少一个待选项目中确定出字符串长度最短的目标项目,并将所述目标项目作为所述交互项目进行输出。
可选地,
所述当前语态进一步包括:意愿语态;
所述至少一个标准词包括:至少一个意愿表达词;
当确定出与所述特征词相对应的标准词中存在至少一个所述意愿表达词时,
所述根据确定出的所述目标位置坐标,确定所述交互语音信息对应的当前语态,包括:
确定每一个所述意愿表达词对应的褒贬权重值;
根据所述意愿表达词对应的所述褒贬权重值以及所述目标位置坐标,利用以下计算公式,计算所述交互语音信息对应的意愿语态的意愿值;
其中,z表征所述意愿值,αj表征第j个意愿表达词对应的褒贬权重值,当所述意愿表达词为褒义时,0<αj<1,当所述意愿表达词为贬义时,-1<αj<0,(xj,yj)表征第j个所述意愿表达词对应的位置坐标,k表征所述意愿表达词的数量。
可选地,
在所述确定与所述当前语态以及各个所述特征词相对应的交互项目之后,进一步包括:
确定计算出的所述意愿值是否高于预设的意愿阈值,如果是,则将所述交互项目与所述用户相关联;
根据与所述用户相关联的交互项目,确定所述用户对应的喜好交互模式;
当再次接收到所述用户输入的目标交互语音信息时,根据所述喜好交互模式,输出与所述目标交互语音信息相对应的目标交互项目;
可选地,
在所述计算所述交互语音信息对应的意愿语态对应的意愿值之后,进一步包括:
确定所述意愿值是否等于预设标准意愿值,如果是,则确定所述交互值是否等于预设交互标准值,如果是,则生成交互结束信息,并将所述交互结束信息作为所述交互项目进行输出。
第二方面,本发明实施例提供了一种人机交互装置,包括:构建模块、解析模块和处理模块;其中,
所述构建模块,用于构建语义几何体序列;其中,所述语义几何体序列包括至少一个标准词以及每一个所述标准词对应的位置坐标;
所述解析模块,用于获取用户输入的交互语音信息,并从所述交互语音信息中解析出至少一个特征词;
所述处理模块,用于根据所述语义几何体序列中与每一个所述特征词相对应的标准词,确定每一个所述特征词在所述语义几何体序列中的目标位置坐标;根据确定出的所述目标位置坐标,确定所述交互语音信息对应的当前语态;确定与所述当前语态以及各个所述特征词相对应的交互项目,并向所述用户输出所述交互项目。
可选地,
所述当前语态包括:交互语态;
所述处理模块,用于根据预设的语法信息确定各个所述特征词的连接顺序;根据所述连接顺序以及各个所述目标位置坐标,确定每相邻两个所述特征词对应的语态向量;根据确定出的所述语态向量,确定所述交互语音信息对应的所述交互语态。
可选地,
所述至少一个标准词包括:至少一个疑问语气词;
所述构建模块,用于在预设的二维数据空间中构建所述语义几何体序列;其中,每一个所述疑问语气词的位置坐标位于所述二维数据空间中的第一象限;
所述处理模块,用于当确定出与所述特征词相对应的标准词中存在至少一个所述疑问语气词时,确定每一个所述疑问语气词对应的目标语态向量,并确定所述目标语态向量的方向为指向所述第一象限的方向;根据确定出的指向所述第一象限的各个所述目标语态向量,利用下述计算公式,计算所述交互语态对应的交互值;
其中,y表征所述交互值,n表征确定出的所述疑问语气词的数量,(xi0,yi0)表征所述疑问语气词对应的位置坐标,(xi1,yi1表征所述目标语态向量中除所述疑问语气词以外的特征词对应的位置坐标;
可选地,
所述当前语态包括:意愿语态;
所述至少一个标准词包括:至少一个意愿表达词;
所述处理模块,用于当确定出与所述特征词相对应的标准词中存在至少一个所述意愿表达词时,确定每一个所述意愿表达词对应的褒贬权重值,并根据所述意愿表达词对应的所述褒贬权重值以及所述目标位置坐标,利用以下计算公式,计算所述交互语音对应的意愿语态的意愿值;
其中,z表征所述意愿值,αj表征第j个意愿表达词对应的褒贬权重值,当所述意愿表达词为褒义时,0<αj<1,当所述意愿表达词为贬义时,-1<αj<0,(xj,yj)表征第j个所述意愿表达词对应的位置坐标,k表征所述意愿表达词的数量。
可选地,
所述处理模块,用于确定所述交互语态对应的交互值是否大于预设的交互阈值;如果是,则从预设的项目数据库中选择与所述特征词相对应的至少一个待选项目;从所述至少一个待选项目中确定出字符串长度最短的目标项目,并将所述目标项目作为所述交互项目进行输出;
可选地,
所述处理模块,进一步用于确定计算出的所述意愿值是否高于预设的意愿阈值,如果是,则将所述交互项目与所述用户相关联;根据与所述用户相关联的交互项目,确定所述用户对应的喜好交互模式;当再次接收到所述用户输入的目标交互语音信息时,根据所述喜好交互模式,输出与所述目标交互语音信息相对应的目标交互项目;
可选地,
所述处理模块,用于确定所述意愿值是否等于预设标准意愿值,如果是,则确定所述交互值是否等于预设交互标准值,如果是,则生成交互结束信息,并将所述交互结束信息作为所述交互项目进行输出。
本发明实施例提供了一种人机交互方法及装置,通过预先构建语义几何体序列,当获取到用户输入的语音交互信息时,从语音交互信息中解析出特征词,并确定每个特征词在语义几何体序列中的目标位置坐标,然后根据确定出的目标位置坐标,确定交互语音信息对应的当前语态,最后确定并输出与当前语态和各个特征词相对应的交互项目。由此,输出给用户的交互项目不仅与用户输入的内容相关,还与用户的交互语态相关,因此输出的交互项目更符合用户的需求,从而有利于提高用户的交互体验。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明一个实施例提供的一种人机交互方法的流程图;
图2是本发明一个实施例提供的一种人机交互装置的结构示意图;
图3是本发明另一个实施例提供的一种人机交互装置的结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例,基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。
如图1所示,本发明实施例提供了一种人机交互方法,该方法可以包括以下步骤:
步骤101:构建语义几何体序列;其中,所述语义几何体序列包括至少一个标准词以及每一个所述标准词对应的位置坐标;
步骤102:获取用户输入的交互语音信息;
步骤103:从所述交互语音信息中解析出至少一个特征词;
步骤104:根据所述语义几何体序列中与每一个所述特征词相对应的标准词,确定每一个所述特征词在所述语义几何体序列中的目标位置坐标;
步骤105:根据确定出的所述目标位置坐标,确定所述交互语音信息对应的当前语态;
步骤106:确定与所述当前语态以及各个所述特征词相对应的交互项目,并向所述用户输出所述交互项目。
上述实施例中,通过预先构建语义几何体序列,当获取到用户输入的语音交互信息时,从语音交互信息中解析出特征词,并确定每个特征词在语义几何体序列中的目标位置坐标,然后根据确定出的目标位置坐标,确定交互语音信息对应的当前语态,最后确定并输出与当前语态和各个特征词相对应的交互项目。由此,输出给用户的交互项目不仅与用户输入的内容相关,还与用户的交互语态相关,因此输出的交互项目更符合用户的需求,从而有利于提高用户的交互体验。
本发明一个实施例中,所述当前语态包括:交互语态;
在步骤103之后,在步骤105之前,可以进一步包括:
根据预设的语法信息确定各个所述特征词的连接顺序;
根据所述连接顺序以及各个所述目标位置坐标,确定每相邻两个所述特征词对应的语态向量;
则步骤105的具体实施方式,可以包括:
根据确定出的所述语态向量,确定所述交互语音信息对应的所述交互语态。
构建出的语义几何体序列中,语义、语调和褒贬义等相关属性各有不同,因此可以很方便的计算出人机交互过程中用户的情绪和目的。为了在数据空间中有效表达交互语态的含义,我们设计出了一个独立的维度用以实时记录并定位交互语态的改变,并由此准确把握用户的交流意图。
在语音识别系统中,一般先对语音信息进行分析和处理,除去冗余信息,然后提取出影响语音识别的关键信息和表达语言含义的特征信息,即提取出多个特征词。然后紧扣特征信息,用最小单元识别字词,之后按照不同语言的各自语法,依照先后次序识别特征词。将各个特征词的前后意思当作辅助识别条件,便于分析和识别语音信息的语态信息。之后按照语义分析,给关键信息划分段落,取出所识别的特征词并连接起来,同时根据语句意思调整句子构成,再结合语义,仔细分析上下文的相互联系,对当前正在处理的语句进行适当修正。
在这里,确定出多个特征词之后,根据语法信息确定各个特征词的连接顺序,以便于根据前后特征词的联系,确定交互语音信息的交互语态。结合语义几何体序列,根据每个特征词在语义几何体序列中的目标位置坐标,确定各个特征词对应的语态向量,然后可根据确定出的语态向量,确定交互语音信息对应的交互语态。
具体地,所述至少一个标准词包括:至少一个疑问语气词;
步骤101的具体实施方式,可以包括:
在预设的二维数据空间中构建所述语义几何体序列;其中,每一个所述疑问语气词的位置坐标位于所述二维数据空间中的第一象限;
则,当确定出与所述特征词相对应的标准词中存在至少一个所述疑问语气词时,所述根据确定出的所述语态向量,确定所述交互语音信息对应的交互语态,包括:
确定每一个所述疑问语气词对应的目标语态向量,并确定所述目标语态向量的方向为指向所述第一象限的方向;
根据确定出的指向所述第一象限的各个所述目标语态向量,确定所述交互语态对应的交互值。
例如,当用户使用询问口吻咨询问题时,所表达的就是一种引起关注并渴望沟通的交互状态,在这里称为交互语态。当交互语态趋向于一种渴望沟通的意愿时,我们在二维数据空间中的语态维度中为当前交互状态设置一个较高的交流位,表示当前交流需要引起足够的关注,并保持持续交流的意愿。一般来说,当交互语音信息中包括疑问语气词时,说明该交互语音信息对应于较为渴望沟通的状态。为了使得对应于渴望沟通的交互语态处于一个较高的交流位,在构建语义几何体序列时,将疑问语气词对应的位置坐标均设置在二维数据空间中的第一象限,并确定疑问语气词对应的目标语态向量的方向指向第一象限,由此,当用户输入的交互语音信息中含有疑问词时,说明该交互语态为咨询语态,则在根据目标语态向量确定交互语态对应的交互值时,可保证交互语态对应的交互值较高,即语态维度中的交流位较高,以便于交互系统及时向用户反馈信息,把握用户的交流意图。
具体地,所述根据确定出的指向所述第一象限的各个所述目标语态向量,确定所述交互语态对应的交互值,包括:
利用下述计算公式,计算所述交互值;
其中,y表征所述交互值,n表征确定出的所述疑问语气词的数量,(xi0,yi0)表征所述疑问语气词对应的位置坐标,(xi1,yi1)表征所述目标语态向量中除所述疑问语气词以外的特征词对应的位置坐标。
采用上述计算公式对交互语态对应的交互值进行计算,可使得当用户输入的交互语音信息中含有疑问词时,交互语态对应的交互值较高,以便于交互系统及时向用户反馈信息,解决用户的疑问。
本发明一个实施例中,步骤106的具体实施方式,可以包括:
确定所述交互语态对应的交互值是否大于预设的交互阈值;
如果是,则从预设的项目数据库中选择与所述特征词相对应的至少一个待选项目;
从所述至少一个待选项目中确定出字符串长度最短的目标项目,并将所述目标项目作为所述交互项目进行输出。
当交互语态对应的交互值较高时,说明用户迫切需要计算机反馈一些结果数据,此时计算机则选择较为简洁明确的语言进行快速交流。在这里,从与特征词相对应的至少一个待选项目中,确定出字符串长度最短的目标项目,并将确定出的目标项目输出给用户,以与用户进行快速交流,尽快解决用户的疑问,有利于提高用户体验。并且,在词义调整的过程中,交互系统会自动对交流中的问题保持一种沟通和期待反馈的意愿,例如在输出目标项目的末尾加上一句“请问这个回答可以帮助到你吗”,以此促使用户保持一种沟通的意愿。
当交互系统反馈的结果已经足以满足用户的交流意愿时,用户的迫切性和渴望沟通的状态都会降低,即交互语态对应的交互值降低,表示用户的交互意愿并不十分迫切。此时可通过中性语言的几何体序列判断出其陈述语气或表示希望中断交流的交互语态,如通过交互语音信息中的“谢谢”和“再见”等特征词确定出用户的交流意愿较低,此时可使用一些合适的结束语结束交互,例如“感谢您的使用”等。
另外,若交互语态对应的交互值较低时,也可根据环境的不同对交互进行实时调整。例如,交互现场较为繁忙、等待咨询的人数较多时,输出简洁的交互项目,以节省沟通时间并减少沟通次数。而当系统较为空闲时,则可以使用一些较为有趣的内容来勾起用户的交互意愿,提升用户体验。
本发明一个实施例中,所述当前语态进一步包括:意愿语态;所述至少一个标准词包括:至少一个意愿表达词;
当确定出与所述特征词相对应的标准词中存在至少一个所述意愿表达词时,步骤105的具体实施方式,可以包括:
确定每一个所述意愿表达词对应的褒贬权重值;
根据所述意愿表达词对应的所述褒贬权重值以及所述目标位置坐标,利用以下计算公式,计算所述交互语音信息对应的意愿语态的意愿值;
其中,z表征所述意愿值,αj表征第j个意愿表达词对应的褒贬权重值,当所述意愿表达词为褒义时,0<αj<1,当所述意愿表达词为贬义时,-1<αj<0,(xj,yj)表征第j个所述意愿表达词对应的位置坐标,k表征所述意愿表达词的数量。
在处理一些较为复杂的交互语音信息时,交互语态的位置可能时高时低,甚至在沟通不畅时,用户还可能产生一些较为负面的反馈,甚至是包含贬义属性的词义或用法。这时在处理交互语态之外,还需要使用另一个独立的用于计算褒贬词性的维度来精准把握交互的流畅性,我们将其称为意愿语态。与交互语态不同,意愿语态的负面信息往往是一种试图促进沟通的意愿。因此,在得出意愿负-面信息时,交互系统需要做出一些试图提高用户意愿语态的词汇用法,方才可以正确保持交互的流畅性。相应的,这时候反馈的结果往往需要包含一些更为正面、褒义较多的词汇来替代之前较为平台的陈述,以实时适应用户在交互过程中的改变。
在交互过程中,交互系统确定出交互语音信息中包括意愿表达词时,则确定出每一个意愿表达词的褒贬权重值,再根据每一个意愿表达词对应的褒贬权重值及其目标位置坐标,准确计算出意愿语态的意愿值。当意愿表达词为褒义性质时,其褒贬权重值为正值,当意愿表达词为贬义性质时,其褒贬权重值为负值,因此,当交互语音信息中的贬义词较多时,意愿语态对应的意愿值较低,证明用户对当前的交互结果并不满意,需要尽快调整交互方法或信息反馈方式,以便尽量提升用户的意愿语态,避免用户中途放弃沟通,造成沟通失败,影响用户体验。
而当意愿语态较高时,证明用户对当前的沟通较为满意,则可选择性记录并学习该沟通方法,并与该用户进行关联,以便完成自学习过程,持续提升用户的个性化体验。具体地,在步骤106之后,可以进一步包括:
确定计算出的所述意愿值是否高于预设的意愿阈值,如果是,则将所述交互项目与所述用户相关联;
根据与所述用户相关联的交互项目,确定所述用户对应的喜好交互模式;
当再次接收到所述用户输入的目标交互语音信息时,根据所述喜好交互模式,输出与所述目标交互语音信息相对应的目标交互项目。
在这里,通过将用户反馈的意愿值高于意愿阈值的交互项目与该用户关联起来,通过同一用户关联的多个交互项目,可确定出用户的喜好交互模式,例如该用户喜好简明快捷的沟通方式,则再次接收到该用户输入的交互语音信息时,根据其喜好交互模式,输出相对简短的交互项目,以符合用户的喜好模式,提升用户体验。
本发明一个实施例中,在所述计算所述交互语音信息对应的意愿语态对应的意愿值之后,进一步包括:
确定所述意愿值是否等于预设标准意愿值,如果是,则确定所述交互值是否等于预设交互标准值,如果是,则生成交互结束信息,并将所述交互结束信息作为所述交互项目进行输出。
在交互过程中实时分析并理解用户的交互语态和意愿语态,根据环境和交互性质的不同,自动把控交互时间和次数,但最终结果都是将两个维度重置为0,才表示正常结束交互,即意愿语态对应的意愿值和交互语态对应的交互值均为0时,才表示交互正确结束,否则表示交互可能失败或包含某些需要改进的缺陷。另外,如果两个维度未能重置为0就中断了交互,表示在语义几何体序列中存在需要改进的节点,调整这些节点中的语法和词性的内容,以便在下次交互过程中测试并学习新的交互方法,以利于提高用户体验。
如图2、图3所示,本发明实施例提供了一种人机交互装置。装置实施例可以通过软件实现,也可以通过硬件或者软硬件结合的方式实现。从硬件层面而言,如图2所示,为本发明实施例提供的人机交互装置所在设备的一种硬件结构图,除了图2所示的处理器、内存、网络接口、以及非易失性存储器之外,实施例中装置所在的设备通常还可以包括其他硬件,如负责处理报文的转发芯片等等。以软件实现为例,如图3所示,作为一个逻辑意义上的装置,是通过其所在设备的CPU将非易失性存储器中对应的计算机程序指令读取到内存中运行形成的。本实施例提供的一种人机交互装置,包括:构建模块301、解析模块302和处理模块303;其中,
所述构建模块301,用于构建语义几何体序列;其中,所述语义几何体序列包括至少一个标准词以及每一个所述标准词对应的位置坐标;
所述解析模块302,用于获取用户输入的交互语音信息,并从所述交互语音信息中解析出至少一个特征词;
所述处理模块303,用于根据所述语义几何体序列中与每一个所述特征词相对应的标准词,确定每一个所述特征词在所述语义几何体序列中的目标位置坐标;根据确定出的所述目标位置坐标,确定所述交互语音信息对应的当前语态;确定与所述当前语态以及各个所述特征词相对应的交互项目,并向所述用户输出所述交互项目。
本发明一个实施例中,所述当前语态包括:交互语态;
所述处理模块303,用于根据预设的语法信息确定各个所述特征词的连接顺序;根据所述连接顺序以及各个所述目标位置坐标,确定每相邻两个所述特征词对应的语态向量;根据确定出的所述语态向量,确定所述交互语音信息对应的所述交互语态。
本发明一个实施例中,所述至少一个标准词包括:至少一个疑问语气词;
所述构建模块301,用于在预设的二维数据空间中构建所述语义几何体序列;其中,每一个所述疑问语气词的位置坐标位于所述二维数据空间中的第一象限;
所述处理模块303,用于当确定出与所述特征词相对应的标准词中存在至少一个所述疑问语气词时,确定每一个所述疑问语气词对应的目标语态向量,并确定所述目标语态向量的方向为指向所述第一象限的方向;根据确定出的指向所述第一象限的各个所述目标语态向量,利用下述计算公式,计算所述交互语态对应的交互值;
其中,y表征所述交互值,n表征确定出的所述疑问语气词的数量,(xi0,yi0)表征所述疑问语气词对应的位置坐标,(xi1,yi1)表征所述目标语态向量中除所述疑问语气词以外的特征词对应的位置坐标。
本发明一个实施例中,所述当前语态包括:意愿语态;
所述至少一个标准词包括:至少一个意愿表达词;
所述处理模块303,用于当确定出与所述特征词相对应的标准词中存在至少一个所述意愿表达词时,确定每一个所述意愿表达词对应的褒贬权重值,并根据所述意愿表达词对应的所述褒贬权重值以及所述目标位置坐标,利用以下计算公式,计算所述交互语音对应的意愿语态的意愿值;
其中,z表征所述意愿值,αj表征第j个意愿表达词对应的褒贬权重值,当所述意愿表达词为褒义时,0<αj<1,当所述意愿表达词为贬义时,-1<αj<0,(xj,yj)表征第j个所述意愿表达词对应的位置坐标,k表征所述意愿表达词的数量。
本发明一个实施例中,所述处理模块303,用于确定所述交互语态对应的交互值是否大于预设的交互阈值;如果是,则从预设的项目数据库中选择与所述特征词相对应的至少一个待选项目;从所述至少一个待选项目中确定出字符串长度最短的目标项目,并将所述目标项目作为所述交互项目进行输出。
本发明一个实施例中,所述处理模块303,进一步用于确定计算出的所述意愿值是否高于预设的意愿阈值,如果是,则将所述交互项目与所述用户相关联;根据与所述用户相关联的交互项目,确定所述用户对应的喜好交互模式;当再次接收到所述用户输入的目标交互语音信息时,根据所述喜好交互模式,输出与所述目标交互语音信息相对应的目标交互项目。
本发明一个实施例中,所述处理模块303,用于确定所述意愿值是否等于预设标准意愿值,如果是,则确定所述交互值是否等于预设交互标准值,如果是,则生成交互结束信息,并将所述交互结束信息作为所述交互项目进行输出。
上述装置内的各单元之间的信息交互、执行过程等内容,由于与本发明方法实施例基于同一构思,具体内容可参见本发明方法实施例中的叙述,此处不再赘述。
本发明实施例提供了一种可读介质,包括执行指令,当存储控制器的处理器执行所述执行指令时,所述存储控制器执行本发明上述任一实施例提供的方法。
本发明实施例提供了一种存储控制器,包括:处理器、存储器和总线;所述存储器用于存储执行指令,所述处理器与所述存储器通过所述总线连接,当所述存储控制器运行时,所述处理器执行所述存储器存储的所述执行指令,以使所述存储控制器执行本发明上述任一实施例提供的方法。
综上所述,本发明以上各个实施例至少具有如下有益效果:
1、在本发明实施例中,通过预先构建语义几何体序列,当获取到用户输入的语音交互信息时,从语音交互信息中解析出特征词,并确定每个特征词在语义几何体序列中的目标位置坐标,然后根据确定出的目标位置坐标,确定交互语音信息对应的当前语态,最后确定并输出与当前语态和各个特征词相对应的交互项目。由此,输出给用户的交互项目不仅与用户输入的内容相关,还与用户的交互语态相关,因此输出的交互项目更符合用户的需求,从而有利于提高用户的交互体验。
2、在本发明实施例中,当交互语态对应的交互值较高时,从与特征词相对应的至少一个待选项目中,确定出字符串长度最短的目标项目,并将确定出的目标项目输出给用户,以与用户进行快速交流,尽快解决用户的疑问,有利于提高用户体验。
3、在本发明一个实施例中,将用户反馈的意愿值高于意愿阈值的交互项目与该用户关联起来,通过同一用户关联的多个交互项目,可确定出用户的喜好交互模式。当再次接收到该用户输入的交互语音信息时,根据其喜好交互模式,输出相应的交互项目,以符合用户的喜好模式,进一步提升用户体验。
需要说明的是,在本文中,诸如第一和第二之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个······”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同因素。
本领域普通技术人员可以理解:实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成,前述的程序可以存储在计算机可读取的存储介质中,该程序在执行时,执行包括上述方法实施例的步骤;而前述的存储介质包括:ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质中。
最后需要说明的是:以上所述仅为本发明的较佳实施例,仅用于说明本发明的技术方案,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内所做的任何修改、等同替换、改进等,均包含在本发明的保护范围内。

Claims (10)

1.一种人机交互方法,其特征在于,包括:
构建语义几何体序列;其中,所述语义几何体序列包括至少一个标准词以及每一个所述标准词对应的位置坐标;
获取用户输入的交互语音信息;
从所述交互语音信息中解析出至少一个特征词;
根据所述语义几何体序列中与每一个所述特征词相对应的标准词,确定每一个所述特征词在所述语义几何体序列中的目标位置坐标;
根据确定出的所述目标位置坐标,确定所述交互语音信息对应的当前语态;
确定与所述当前语态以及各个所述特征词相对应的交互项目,并向所述用户输出所述交互项目。
2.根据权利要求1所述的方法,其特征在于,
所述当前语态包括:交互语态;
在所述从所述交互语音信息中解析出至少一个特征词之后,在所述根据确定出的所述目标位置坐标,确定所述交互语音信息对应的当前语态之前,进一步包括:
根据预设的语法信息确定各个所述特征词的连接顺序;
根据所述连接顺序以及各个所述目标位置坐标,确定每相邻两个所述特征词对应的语态向量;
则,所述根据确定出的所述目标位置坐标,确定所述交互语音信息对应的当前语态,包括:
根据确定出的所述语态向量,确定所述交互语音信息对应的所述交互语态。
3.根据权利要求2所述的方法,其特征在于,
所述至少一个标准词包括:至少一个疑问语气词;
所述构建语义几何体序列,包括:
在预设的二维数据空间中构建所述语义几何体序列;其中,每一个所述疑问语气词的位置坐标位于所述二维数据空间中的第一象限;
则,当确定出与所述特征词相对应的标准词中存在至少一个所述疑问语气词时,
所述根据确定出的所述语态向量,确定所述交互语音信息对应的交互语态,包括:
确定每一个所述疑问语气词对应的目标语态向量,并确定所述目标语态向量的方向为指向所述第一象限的方向;
根据确定出的指向所述第一象限的各个所述目标语态向量,确定所述交互语态对应的交互值。
4.根据权利要求3所述的方法,其特征在于,
所述根据确定出的指向所述第一象限的各个所述目标语态向量,确定所述交互语态对应的交互值,包括:
利用下述计算公式,计算所述交互值;
其中,y表征所述交互值,n表征确定出的所述疑问语气词的数量,(xi0,yi0)表征所述疑问语气词对应的位置坐标,(xi1,yi1)表征所述目标语态向量中除所述疑问语气词以外的特征词对应的位置坐标;
和/或,
所述确定与所述当前语态以及各个所述特征词相对应的交互项目,并输出所述交互项目,包括:
确定所述交互语态对应的交互值是否大于预设的交互阈值;
如果是,则从预设的项目数据库中选择与所述特征词相对应的至少一个待选项目;
从所述至少一个待选项目中确定出字符串长度最短的目标项目,并将所述目标项目作为所述交互项目进行输出。
5.根据权利要求3所述的方法,其特征在于,
所述当前语态进一步包括:意愿语态;
所述至少一个标准词包括:至少一个意愿表达词;
当确定出与所述特征词相对应的标准词中存在至少一个所述意愿表达词时,
所述根据确定出的所述目标位置坐标,确定所述交互语音信息对应的当前语态,包括:
确定每一个所述意愿表达词对应的褒贬权重值;
根据所述意愿表达词对应的所述褒贬权重值以及所述目标位置坐标,利用以下计算公式,计算所述交互语音信息对应的意愿语态的意愿值;
其中,z表征所述意愿值,αj表征第j个意愿表达词对应的褒贬权重值,当所述意愿表达词为褒义时,0<αj<1,当所述意愿表达词为贬义时,-1<αj<0,(xj,yj)表征第j个所述意愿表达词对应的位置坐标,k表征所述意愿表达词的数量。
6.根据权利要求5所述的方法,其特征在于,
在所述确定与所述当前语态以及各个所述特征词相对应的交互项目之后,进一步包括:
确定计算出的所述意愿值是否高于预设的意愿阈值,如果是,则将所述交互项目与所述用户相关联;
根据与所述用户相关联的交互项目,确定所述用户对应的喜好交互模式;
当再次接收到所述用户输入的目标交互语音信息时,根据所述喜好交互模式,输出与所述目标交互语音信息相对应的目标交互项目;
和/或,
在所述计算所述交互语音信息对应的意愿语态对应的意愿值之后,进一步包括:
确定所述意愿值是否等于预设标准意愿值,如果是,则确定所述交互值是否等于预设交互标准值,如果是,则生成交互结束信息,并将所述交互结束信息作为所述交互项目进行输出。
7.一种人机交互装置,其特征在于,包括:构建模块、解析模块和处理模块;其中,
所述构建模块,用于构建语义几何体序列;其中,所述语义几何体序列包括至少一个标准词以及每一个所述标准词对应的位置坐标;
所述解析模块,用于获取用户输入的交互语音信息,并从所述交互语音信息中解析出至少一个特征词;
所述处理模块,用于根据所述语义几何体序列中与每一个所述特征词相对应的标准词,确定每一个所述特征词在所述语义几何体序列中的目标位置坐标;根据确定出的所述目标位置坐标,确定所述交互语音信息对应的当前语态;确定与所述当前语态以及各个所述特征词相对应的交互项目,并向所述用户输出所述交互项目。
8.根据权利要求7所述的装置,其特征在于,
所述当前语态包括:交互语态;
所述处理模块,用于根据预设的语法信息确定各个所述特征词的连接顺序;根据所述连接顺序以及各个所述目标位置坐标,确定每相邻两个所述特征词对应的语态向量;根据确定出的所述语态向量,确定所述交互语音信息对应的所述交互语态。
9.根据权利要求8所述的装置,其特征在于,
所述至少一个标准词包括:至少一个疑问语气词;
所述构建模块,用于在预设的二维数据空间中构建所述语义几何体序列;其中,每一个所述疑问语气词的位置坐标位于所述二维数据空间中的第一象限;
所述处理模块,用于当确定出与所述特征词相对应的标准词中存在至少一个所述疑问语气词时,确定每一个所述疑问语气词对应的目标语态向量,并确定所述目标语态向量的方向为指向所述第一象限的方向;根据确定出的指向所述第一象限的各个所述目标语态向量,利用下述计算公式,计算所述交互语态对应的交互值;
其中,y表征所述交互值,n表征确定出的所述疑问语气词的数量,(xi0,yi0)表征所述疑问语气词对应的位置坐标,(xi1,yi1)表征所述目标语态向量中除所述疑问语气词以外的特征词对应的位置坐标;
和/或,
所述当前语态包括:意愿语态;
所述至少一个标准词包括:至少一个意愿表达词;
所述处理模块,用于当确定出与所述特征词相对应的标准词中存在至少一个所述意愿表达词时,确定每一个所述意愿表达词对应的褒贬权重值,并根据所述意愿表达词对应的所述褒贬权重值以及所述目标位置坐标,利用以下计算公式,计算所述交互语音对应的意愿语态的意愿值;
其中,z表征所述意愿值,αj表征第j个意愿表达词对应的褒贬权重值,当所述意愿表达词为褒义时,0<αj<1,当所述意愿表达词为贬义时,-1<αj<0,(xj,yj)表征第j个所述意愿表达词对应的位置坐标,k表征所述意愿表达词的数量。
10.根据权利要求9所述的装置,其特征在于,
所述处理模块,用于确定所述交互语态对应的交互值是否大于预设的交互阈值;如果是,则从预设的项目数据库中选择与所述特征词相对应的至少一个待选项目;从所述至少一个待选项目中确定出字符串长度最短的目标项目,并将所述目标项目作为所述交互项目进行输出;
和/或,
所述处理模块,进一步用于确定计算出的所述意愿值是否高于预设的意愿阈值,如果是,则将所述交互项目与所述用户相关联;根据与所述用户相关联的交互项目,确定所述用户对应的喜好交互模式;当再次接收到所述用户输入的目标交互语音信息时,根据所述喜好交互模式,输出与所述目标交互语音信息相对应的目标交互项目;
和/或,
所述处理模块,用于确定所述意愿值是否等于预设标准意愿值,如果是,则确定所述交互值是否等于预设交互标准值,如果是,则生成交互结束信息,并将所述交互结束信息作为所述交互项目进行输出。
CN201810745415.XA 2018-07-09 2018-07-09 一种人机交互方法及装置 Active CN109033265B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810745415.XA CN109033265B (zh) 2018-07-09 2018-07-09 一种人机交互方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810745415.XA CN109033265B (zh) 2018-07-09 2018-07-09 一种人机交互方法及装置

Publications (2)

Publication Number Publication Date
CN109033265A true CN109033265A (zh) 2018-12-18
CN109033265B CN109033265B (zh) 2020-10-16

Family

ID=64641524

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810745415.XA Active CN109033265B (zh) 2018-07-09 2018-07-09 一种人机交互方法及装置

Country Status (1)

Country Link
CN (1) CN109033265B (zh)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1349145A2 (en) * 2002-03-29 2003-10-01 Samsung Electronics Co., Ltd. System and method for providing information using spoken dialogue interface
CN105224278A (zh) * 2015-08-21 2016-01-06 百度在线网络技术(北京)有限公司 语音交互服务处理方法及装置
CN105929964A (zh) * 2016-05-10 2016-09-07 海信集团有限公司 人机交互方法及装置
CN106874363A (zh) * 2016-12-30 2017-06-20 北京光年无限科技有限公司 智能机器人的多模态输出方法及装置
CN107436916A (zh) * 2017-06-15 2017-12-05 百度在线网络技术(北京)有限公司 智能提示答案的方法及装置
CN107798032A (zh) * 2017-02-17 2018-03-13 平安科技(深圳)有限公司 自助语音会话中的应答消息处理方法和装置

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1349145A2 (en) * 2002-03-29 2003-10-01 Samsung Electronics Co., Ltd. System and method for providing information using spoken dialogue interface
CN105224278A (zh) * 2015-08-21 2016-01-06 百度在线网络技术(北京)有限公司 语音交互服务处理方法及装置
CN105929964A (zh) * 2016-05-10 2016-09-07 海信集团有限公司 人机交互方法及装置
CN106874363A (zh) * 2016-12-30 2017-06-20 北京光年无限科技有限公司 智能机器人的多模态输出方法及装置
CN107798032A (zh) * 2017-02-17 2018-03-13 平安科技(深圳)有限公司 自助语音会话中的应答消息处理方法和装置
CN107436916A (zh) * 2017-06-15 2017-12-05 百度在线网络技术(北京)有限公司 智能提示答案的方法及装置

Also Published As

Publication number Publication date
CN109033265B (zh) 2020-10-16

Similar Documents

Publication Publication Date Title
CN108984683B (zh) 结构化数据的提取方法、系统、设备及存储介质
CN107329967B (zh) 基于深度学习的问答系统以及方法
CN106649742B (zh) 数据库维护方法和装置
CN1457041B (zh) 为一个自然语言理解系统用来自动注解训练数据的一个系统
WO2021068352A1 (zh) Faq问答对自动构建方法、装置、计算机设备及存储介质
CN106776936B (zh) 智能交互方法和系统
US9483459B1 (en) Natural language correction for speech input
US20140019116A1 (en) System and methods for semiautomatic generation and tuning of natural language interaction applications
US20140351228A1 (en) Dialog system, redundant message removal method and redundant message removal program
CN109360550A (zh) 语音交互系统的测试方法、装置、设备和存储介质
CN109857846B (zh) 用户问句与知识点的匹配方法和装置
US10977155B1 (en) System for providing autonomous discovery of field or navigation constraints
US11934781B2 (en) Systems and methods for controllable text summarization
CN112036153B (zh) 工单纠错方法、装置、计算机可读存储介质和计算机设备
CN108762743A (zh) 一种数据表操作代码生成方法及装置
CN110008308B (zh) 针对用户问句补充信息的方法和装置
WO2021169485A1 (zh) 一种对话生成方法、装置及计算机设备
US7328199B2 (en) Componentized slot-filling architecture
CN109616101A (zh) 声学模型训练方法、装置、计算机设备和可读存储介质
CN111581074A (zh) 通话场景覆盖测试方法、装置、计算机设备及存储介质
US20240020458A1 (en) Text formatter
CN114360678A (zh) 信息处理方法、装置、设备和存储介质
CN112329437B (zh) 一种智能客服语音质检评分方法、设备及存储介质
CN117591885A (zh) 数据标注方法、装置、终端设备以及存储介质
CN117494814A (zh) 提示词全生命周期管理方法、系统、电子设备、存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20210805

Address after: 215100 building 3, Fumin phase III plant, No. 818, Songjia Road, Guoxiang street, Wuzhong Economic Development Zone, Suzhou City, Jiangsu Province

Patentee after: INSPUR FINANCIAL INFORMATION TECHNOLOGY Co.,Ltd.

Address before: 215100 Building 1, 178 Tayun Road, Yuexi street, Wuzhong District, Suzhou City, Jiangsu Province

Patentee before: SUZHOU INSPUR INTELLIGENT SOFTWARE Co.,Ltd.