CN115328321B - 基于身份转换的人机交互方法及相关装置 - Google Patents
基于身份转换的人机交互方法及相关装置 Download PDFInfo
- Publication number
- CN115328321B CN115328321B CN202211257371.9A CN202211257371A CN115328321B CN 115328321 B CN115328321 B CN 115328321B CN 202211257371 A CN202211257371 A CN 202211257371A CN 115328321 B CN115328321 B CN 115328321B
- Authority
- CN
- China
- Prior art keywords
- target
- target object
- user
- reply
- scheme
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 50
- 230000003993 interaction Effects 0.000 title claims abstract description 42
- 238000006243 chemical reaction Methods 0.000 title claims abstract description 18
- 230000009471 action Effects 0.000 claims description 27
- 230000004044 response Effects 0.000 claims description 21
- 238000004590 computer program Methods 0.000 claims description 18
- 238000004891 communication Methods 0.000 claims description 9
- 238000012544 monitoring process Methods 0.000 claims description 4
- 230000006870 function Effects 0.000 description 10
- 230000008569 process Effects 0.000 description 10
- 238000010586 diagram Methods 0.000 description 6
- 238000012545 processing Methods 0.000 description 4
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 230000009466 transformation Effects 0.000 description 3
- 239000004065 semiconductor Substances 0.000 description 2
- 230000001360 synchronised effect Effects 0.000 description 2
- 238000004422 calculation algorithm Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000012790 confirmation Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 230000001052 transient effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/01—Input arrangements or combined input and output arrangements for interaction between user and computer
- G06F3/011—Arrangements for interaction with the human body, e.g. for user immersion in virtual reality
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/332—Query formulation
- G06F16/3329—Natural language query formulation or dialogue systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/12—Use of codes for handling textual entities
- G06F40/151—Transformation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
- G06F40/35—Discourse or dialogue representation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
- G10L17/22—Interactive procedures; Man-machine interfaces
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- Human Computer Interaction (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Mathematical Physics (AREA)
- General Health & Medical Sciences (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- User Interface Of Digital Computer (AREA)
- Machine Translation (AREA)
Abstract
本申请实施例提供了一种基于身份转换的人机交互方法及相关装置,方法应用于语义识别系统中的服务器,通过用户通过终端设备输入的语义信息,对语义信息进行语义分析,在确定用户的第一用户意图后,直接查询对应的第一答复方案,并根据答复方案生成第一答复语句;若未能查询到第一答复方案,则确定语义信息中是否存在与身份有关的关键词,若存在关键词,则查询关键词对应的第一目标对象;根据第一目标对象将第一文本信息或第二文本信息转换为第一目标文本;根据第一目标文本查询第一答复方案;根据第一答复方案生成第一答复语句,并向终端设备发送第一答复语句。这样,提高了所述人机对话引擎的智能性和语音识别效率。
Description
技术领域
本申请属于互联网产业的一般数据处理技术领域,具体涉及一种基于身份转换的人机交互方法及相关装置。
背景技术
目前,用户通过语音引擎输入导航需求时,确定的目的地不是具体的地址,而是用户日常口语化的内容,比如用户输入语音引擎的导航目的为“导航去女朋友家”若无法直接将“女朋友”这个词转换为用户实际的女朋友,则无法查询到目的地,则语音引擎就还需要向用户提问,使得语音引擎智能性不高,语音识别效率低。
发明内容
本申请实施例提供了一种基于身份转换的人机交互方法及相关装置,以期提高了所述人机对话引擎的智能性和语音识别效率。
第一方面,本申请实施例提供了一种基于身份转换的人机交互方法,应用于语义识别系统中的服务器,所述语义识别系统包括所述服务器和安装有与所述服务器对应的客户端的终端设备,其中,所述服务器包括人机对话引擎,所述人机对话引擎用于在导航场景下根据多个答复方案与所述终端设备进行人机交互,单个答复方案与对应的用户意图进行关联,所述用户意图用于指示用户需要所述人机对话引擎完成的目标动作;所述方法包括:
获取来自所述终端设备的语义信息,所述语义信息由所述终端设备对应的用户输入,所述语义信息的类型包括第一文本信息和语音信息中的至少一种;
若所述语义信息为语音信息,则将所述语义信息转换为对应的第二文本信息;
对所述语义信息进行语义分析,确定所述用户的第一用户意图,所述用户意图包括所述第一用户意图;
根据所述第一用户意图查询是否存在对应的第一答复方案;
若查询到所述第一答复方案,则根据所述第一答复方案生成第一答复语句,并向所述客户端发送所述第一答复语句;
若未能查询到所述第一答复方案,则确定所述第一文本信息或所述第二文本信息中是否存在与身份有关的关键词;若存在所述关键词,则查询所述关键词对应的第一目标对象;
根据所述第一目标对象将所述第一文本信息或所述第二文本信息转换为第一目标文本;
根据所述第一目标文本查询所述第一答复方案;
根据所述第一答复方案生成第一答复语句,并向所述终端设备发送所述第一答复语句。
第二方面,本申请实施例提供了一种基于身份转换的人机交互装置,应用于语义识别系统中的服务器,所述语义识别系统包括所述服务器和安装有与所述服务器对应的客户端的终端设备,其中,所述服务器包括人机对话引擎,所述人机对话引擎用于在导航场景下根据多个答复方案与所述终端设备进行人机交互,所述导航专用人机对话剧本包括多个答复方案,单个答复方案与对应的用户意图进行关联,所述用户意图用于指示用户需要所述人机对话引擎完成的目标动作;所述方法包括:
获取单元,用于获取来自所述终端设备的语义信息,所述语义信息由所述终端设备对应的用户输入,所述语义信息的类型包括第一文本信息和语音信息中的至少一种;
第一转换单元,用于在所述语义信息为语音信息时,将所述语义信息转换为对应的第二文本信息;
分析单元,用于对所述语义信息进行语义分析,确定所述用户的第一用户意图,所述用户意图包括所述第一用户意图;
第一查询单元,用于根据所述第一用户意图查询是否存在对应的第一答复方案;
第一生成单元,用于若查询到所述第一答复方案,则根据所述第一答复方案生成第一答复语句,并向所述客户端发送所述第一答复语句;
确定单元,用于在未能查询到所述第一答复方案时,确定所述第一文本信息或所述第二文本信息中是否存在与身份有关的关键词;
第二查询单元,用于当存在所述关键词时,查询所述关键词对应的第一目标对象;
第二转换单元,用于根据所述第一目标对象将所述第一文本信息或所述第二文本信息转换为第一目标文本;
第三查询单元,用于根据所述第一目标文本查询所述第一答复方案;
第二生成单元, 用于根据所述第一答复方案生成第一答复语句;
发送单元,用于向所述终端设备发送所述第一答复语句。
第三方面,本申请实施例提供了一种电子设备,包括处理器、存储器、通信接口,以及一个或多个程序,所述一个或多个程序被存储在所述存储器中,并且被配置由所述处理器执行,所述程序包括用于执行本申请实施例第一方面和第二方面中任一方面的步骤的指令。
第四方面,本申请实施例提供了一种计算机存储介质,存储用于电子数据交换的计算机程序,其中,所述计算机程序使得计算机执行如本实施例第一方面和第二方面中任一方面所描述的部分或全部步骤。
第五方面,本申请实施例提供了一种计算机程序产品,其中,上述计算机程序产品包括存储了计算机程序的非瞬时性计算机可读存储介质,上述计算机程序可操作来使计算机执行如本申请实施例第一方面和第二方面中任一方面所描述的部分或全部步骤。该计算机程序产品可以为一个软件安装包。
可以看出,本申请实施例中,首先通过获取用户通过所述终端设备输入的语义信息,所述语义信息的类型包括第一文本信息和语音信息中的至少一种;若所述语义信息为语音信息,则将所述语义信息转换为对应的第二文本信息;对所述语义信息进行语义分析,确定所述用户的第一用户意图;根据所述第一用户意图查询是否存在对应的第一答复方案;若查询到所述第一答复方案,则根据所述第一答复方案生成第一答复语句,并向所述客户端发送所述第一答复语句; 若未能查询到所述第一答复方案,则确定所述第一文本信息或所述第二文本信息中是否存在与身份有关的关键词;若存在所述关键词,则查询所述关键词对应的第一目标对象;根据所述第一目标对象将所述第一文本信息或所述第二文本信息转换为第一目标文本;根据所述第一目标文本查询所述第一答复方案;根据所述第一答复方案生成第一答复语句,并向所述终端设备发送所述第一答复语句。这样,提高了所述人机对话引擎的智能性和语音识别效率。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1a是本申请实施例提供的语义识别系统的结构示意图;
图1b是本申请实施例提供的一种系统架构示意图;
图2是本申请实施例提供的一种基于身份转换的人机交互方法的流程示意图;
图3是本申请实施例提供的一种人机交互界面示意图;
图4是本申请实施例提供的另一种人机交互界面示意图;
图5是本申请实施例提供的一种基于身份转换的人机交互装置的结构示意图。
具体实施方式
为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别不同对象,而不是用于描述特定顺序。此外,术语“包括”和“具有”以及它们任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元,而是可选地还包括没有列出的步骤或单元,或可选地还包括对于这些过程、方法、系统、产品或设备固有的其他步骤或单元。
在本文中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本申请的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是,本文所描述的实施例可以与其它实施例相结合。
下面先对本申请涉及到的相关术语进行介绍。
目前,由于现有的人机对话引擎在没有明确提到对应的目标对象时,无法查询到目标对象的目的地,因此人机对话引擎就还需要向用户提问,使得语音引擎智能性不高,语音识别效率低。
为解决上述问题,本申请实施例提供了一种基于身份转换的人机交互方法。该基于身份转换的人机交互方法可以应用于导航时与用户进行人机交互的场景中。可以通过获取用户通过所述终端设备输入的语义信息,所述语义信息的类型包括第一文本信息和语音信息中的至少一种;若所述语义信息为语音信息,则将所述语义信息转换为对应的第二文本信息;对所述语义信息进行语义分析,确定所述用户的第一用户意图;根据所述第一用户意图查询是否存在对应的第一答复方案;若查询到所述第一答复方案,则根据所述第一答复方案生成第一答复语句,并向所述客户端发送所述第一答复语句; 若未能查询到所述第一答复方案,则确定所述第一文本信息或所述第二文本信息中是否存在与身份有关的关键词;若存在所述关键词,则查询所述关键词对应的第一目标对象;根据所述第一目标对象将所述第一文本信息或所述第二文本信息转换为第一目标文本;根据所述第一目标文本查询所述第一答复方案;根据所述第一答复方案生成第一答复语句,并向所述终端设备发送所述第一答复语句。本方案可以适用于多种场景,包括但不限于上述提到的应用场景。
下面介绍本申请实施例涉及的系统架构。
请参阅图1a,图1a为本申请实施例提供的一种语义识别系统100的结构示意图。所述语义识别系统100包括所述服务器110和安装有与所述服务器110对应的客户端121的终端设备120,其中,所述服务器110包括人机对话引擎111,所述人机对话引擎111用于在导航场景下根据多个答复方案与所述终端设备120进行人机交互,单个答复方案与对应的用户意图进行关联,所述用户意图用于指示用户需要所述人机对话引擎111完成的目标动作。具体的,在导航过程中,用户通过所述终端设备120输入语义信息,所述终端设备120向所述服务器110发送所述语义信息,所述服务器110确定所述语义信息的类型,若是语义信息,则需要将所述语义信息转换为文本信息,再对文本信息进行语义分析。确定所述用户的用户意图,根据所述用户意图查询对应的答复方案,根据答复方案生成相应的答复语句发送至所述终端设备120以与所述用户进行人机交互,进而确定用户所要到达的目的地。进一步的,若未能查询到对应的答复方案,则确定文本信息中是否存在与身份有关的关键词;若存在所述关键词,则查询所述关键词对应的第一目标对象;根据所述第一目标对象将所述第一文本信息或所述第二文本信息转换为第一目标文本;根据所述第一目标文本查询所述第一答复方案;根据所述第一答复方案生成第一答复语句,并向所述终端设备120发送所述第一答复语句。这样,提高了所述人机对话引擎111的智能性和语音识别效率。
本申请还提供了一种电子设备10,如图1b所示,所述电子设备10包括至少一个处理器(processor)11;显示屏12;以及存储器(memory)13,还可以包括通信接口(Communications Interface)15和总线14。其中,处理器11、显示屏12、存储器13和通信接口15可以通过总线14完成相互间的通信。显示屏12设置为显示初始设置模式中预设的用户引导界面。通信接口15可以传输信息。处理器11可以调用存储器13中的逻辑指令,以执行上述实施例中的方法。
可选的,所述电子设备10可以是移动电子设备,也可以是电子设备或其他设备,在此不做唯一性限定。
此外,上述的存储器13中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。
存储器13作为一种计算机可读存储介质,可设置为存储软件程序、计算机可执行程序,如本公开实施例中的方法对应的程序指令或模块。处理器11通过运行存储在存储器13中的软件程序、指令或模块,从而执行功能应用以及数据处理,即实现上述实施例中的方法。
存储器13可包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序;存储数据区可存储根据电子设备10的使用所创建的数据等。此外,存储器13可以包括高速随机存取存储器,还可以包括非易失性存储器。例如,U盘、移动硬盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等多种可以存储程序代码的介质,也可以是暂态存储介质。
下面对具体的方法进行详细的介绍。
请参阅图2,本申请还提供了一种基于身份转换的人机交互方法,应用于语义识别系统中的服务器,所述语义识别系统包括所述服务器和安装有与所述服务器对应的客户端的终端设备,其中,所述服务器包括人机对话引擎,所述人机对话引擎用于在导航场景下根据多个答复方案与所述终端设备进行人机交互,单个答复方案与对应的用户意图进行关联,所述用户意图用于指示用户需要所述人机对话引擎完成的目标动作;所述方法包括:
步骤201、获取来自所述终端设备的语义信息,所述语义信息由所述终端设备对应的用户输入,所述语义信息的类型包括第一文本信息和语音信息中的至少一种。
具体实现中,当用户需要导航时,可以通过所述终端设备中的客户端输入所述语义信息,可以是在输入框中输入第一文本信息,也可以是在所述客户端中输入语音信息,根据所述用户的需要进行选择。
步骤202、若所述语义信息为语音信息,则将所述语义信息转换为对应的第二文本信息。
具体实现中,当用户输入的语义信息为语音信息时,需要先转换成文本信息才能够进行语义分析,而输入的是所述第一文本信息时,则可以直接进行语义分析。
步骤203、对所述语义信息进行语义分析,确定所述用户的第一用户意图,所述用户意图包括所述第一用户意图。
具体实现中,在获得文本信息之后,需要对文本信息进行语义分析,进而确定所述用户的第一用户意图。所述用户意图可以是用户想要所述人机对话引擎执行的动作,例如,用户需要人机对话引擎规划导航路线到某个地点,所述用户意图则为 “导航”这个动作。
步骤204、根据所述第一用户意图查询是否存在对应的第一答复方案。
具体实现中,不同的用户意图对应的答复方案不同。以导航为例,当所述用户意图为导航时,则查询与所述导航相关的第一答复方案。
步骤205、若查询到所述第一答复方案,则根据所述第一答复方案生成第一答复语句,并向所述客户端发送所述第一答复语句。
具体实现中,根据用户当前的语义,在所述第一答复方案中查询相关的第一答复语句,例如,所述用户的语义信息为“找条最快去我女朋友家的路”,那么则在所述第一答复方案中查询女朋友家的地址,然后规划当前位置到女朋友家的路线,并生成第一答复语句,告知所述用户去女朋友家的路线和预计耗时等。
步骤206、若未能查询到所述第一答复方案,则确定所述第一文本信息或所述第二文本信息中是否存在与身份有关的关键词;若存在所述关键词,则查询所述关键词对应的第一目标对象。
其中,所述查询所述关键词对应的第一目标对象,包括:查询出与所述关键词关联的多个第三目标对象;确定所述第一文本信息或第二文本信息中的目标动作;统计历史导航数据中与所述目标动作共同出现频率最高的第三目标对象作为所述第一目标对象。
具体实现中,若未查询到所述第一答复方案,提取出所述第一文本信息或所述第二文本信息中的与身份有关的关键词,如图3所示,用户输入语义信息“找条最快去我女朋友家的路”,其中的“女朋友”即为所述关键词;然后查询与“女朋友”关联的第一目标对象,其中目的地点A为所述女朋友的家。
可以理解的是,一个身份可以关联多个第三目标对象,所述多个第三目标对象包括所述第一目标对象。在查询到多个第三目标对象时,可以先确定当前需要所述人机对话引擎完成的所述目标动作,确定该动作常对应的该身份下的第三目标对象是哪个,则将该第三目标对象作为所述第一目标对象。
进一步的,若未查询到所述关键词,则确定所述第一文本信息或所述第二文本信息中身份存在身份表中的身份所对应的关键词的同义词或近义词,若存在则继续查询所述关键词对应的第一目标对象。若不存在,则向所述终端设备发送提问语句,以向所述用户询问具体的目的。
可以看出,本实施例中,通过将身份与地址进行关联,并在与用户的人机交互中提取与身份有关的关键词,使得在用户使用口语化进行交流时,也能够准确识别目标对象,进而进行导航。
步骤207、根据所述第一目标对象将所述第一文本信息或所述第二文本信息转换为第一目标文本。
具体实现中,在确定出所述第一目标对象之后,将“找条最快去我女朋友家的路”中的女朋友替换为所述第一目标对象,例如,所述第一目标对象的名字为“张三”,那么得到的第一目标文本则为“找条最快去我张三家的路”。
步骤208、根据所述第一目标文本查询所述第一答复方案。
具体实现中,查询与“张三”的家的地址,然后规划当前位置到该地址的路线,并生成第一答复语句,告知所述用户去女朋友家的路线和预计耗时等。
步骤209、根据所述第一答复方案生成第一答复语句,并向所述终端设备发送所述第一答复语句。
在一个可能的实施例中,所述方法还包括:获取来自所述终端设备的第一关联关系,所述第一关联关系用于指示所述关键词与所述第一目标对象之间的关联关系;或者,监听用户与所述人机对话引擎的对话;从所述对话中获取所述第一关联关系。
具体实现中,由所述用户通过所述终端设备向所述服务器上传所述第一关联关系,所述服务器将所述第一关联关系保存在数据库中,以使得所述服务器能够在与所述用户进行人机交互的过程中根据所述关键词查询到所述第一目标对象。例如用户存储“女朋友”这个身份对应的目标对象为“张三”。
进一步的,还可以由所述终端设备监听所述用户与所述人机对话引擎的对话,在对话过程中提取关键词与所述第一目标对象的关系,得到所述第一关联关系,将所述第一关联关系保存在数据库中。
可以看出,本实施例中,通过用户上传或者监听数据的方式获取关键词与第一目标对象的关系,以预存关键词与所述第一目标对象的关联关系,使得在与所述用户进行人机交互的过程中能够根据关键词查询第一目标对象。
在一个可能的实施例中,所述方法还包括:确定所述第一关联关系是否发生改变;当所述第一关联关系发生变更时,获取第二目标对象;将所述第一目标对象替换为所述第二目标对象;获取所述第二目标对象对应的第二目标地点;将所述第二目标对象与所述第二目标地点进行关联,得到第二用户意图,所述用户意图包括所述第二用户意图。
其中,所述终端设备为车载终端;所述确定所述第一关联关系是否发生改变,包括:获取来自所述终端设备的使用数据,所述使用数据用于指示车辆副驾驶位置的所述第二目标对象对所述终端设备的使用习惯;若所述使用数据发生改变,则判断所述第一目标对象发生变更。
具体的,所述获取所述第二目标对象对应的第二目标地点,包括:获取历史导航数据;从所述历史导航数据中确定出所述第二目标对象所对应的第二目标地点。
具体实现中,由所述终端设备汇总日常使用数据,来判断某一个身份是否发生改变。如在车载场景中,可以根据副驾驶位置的情况来判断“女朋友”这个身份对应的人物是否更换,例如副驾驶使用语音助手时的说话方式或者听歌喜好等。
进一步的,当所述用户未主动上传所述第二目标对象对应的第二目标地点时,可以由所述服务器根据用户与所述人机对话引擎的人机交互中产生的历史导航数据来确定所述第二目标对象对应的第二目标地点。若所述历史导航数据中也未查询到所述第二目标地点,则向所述终端设备发送第一提示信息,以提示所述用户主动上传所述第二目标地点。
更进一步的,当所述服务器主动变更所述第一关联关系时,向所述终端设备发送确认信息,由所述用户确认是否进行更改。再预设时间所述用户未进行确认,则向所述用户的手机等设备发送第二提示信息,以提示用户第一关联关系已更改。
可以看出,本实施例中,通过对日常使用数据的分析,可以自动对所述第一关联关系进行变更,使得所述人机对话引擎更加智能,人机对话效率也进一步提高。
在一个可能的实施例中,接收到第二语义信息时,对所述第二语义信息进行语义分析,判断当前所述第二语义信息与所述第一语义信息是否处于同一对话情景中,若是,则确定所述第二语义信息中是否存在与身份有关的第二关键词,若不存在,则以所述第一关键词所对应的身份为基础,查询对应的第二答复方案,根据所述第二答复方案生成第二答复语句,向所述终端设备发送所述第二答复语句。
具体实现中,请参阅图4,第二语义信息为“附近有电影院嘛,吃完饭想去看电影B”,人机对话引擎确定不存在第二关键词之后,直接以第一关键词为基础,结合所述第二语义信息的用户意图,生成第二答复语句为“推荐影城C,距您女朋友家步行5分钟,可选八点整的D影厅,单价298元,需要帮您购买吗”。
若存在第二关键词,则执行步骤203-步骤209的步骤,生成相应的第三答复语句,并向所述终端设备发送所乘车的第三答复语句。
可以看出,本实施例中,可以根据身份信息是否发生改变来确定当前对话是否与上一对话处于同一对话情景中,在确定当前对话与上一对话处于同一对话情景中时,基于上一对话中的身份信息来生成第二答复语句,使得人机对话引擎与所述用户的人机交互具有连贯性,进一步提高了所述人机对话引擎的智能性和人机交互效率。
上述主要从方法侧执行过程的角度对本申请实施例的方案进行了介绍。可以理解的是,移动电子设备为了实现上述功能,其包含了执行各个功能相应的硬件结构和/或软件模块。本领域技术人员应该很容易意识到,结合本文中所提供的实施例描述的各示例的单元及算法步骤,本申请能够以硬件或硬件和计算机软件的结合形式来实现。某个功能究竟以硬件还是计算机软件驱动硬件的方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。
本申请实施例可以根据上述方法示例对电子设备进行功能单元的划分,例如,可以对应各个功能划分各个功能单元,也可以将两个或两个以上的功能集成在一个处理单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。需要说明的是,本申请实施例中对单元的划分是示意性的,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。
请参阅图5,本申请还提供一种基于身份转换的人机交互装置30,应用于语义识别系统中的服务器,所述语义识别系统包括所述服务器和安装有与所述服务器对应的客户端的终端设备,其中,所述服务器包括人机对话引擎,所述人机对话引擎用于在导航场景下根据多个答复方案与所述终端设备进行人机交互,所述导航专用人机对话剧本包括多个答复方案,单个答复方案与对应的用户意图进行关联,所述用户意图用于指示用户需要所述人机对话引擎完成的目标动作;所述方法包括:
获取单元301,用于获取来自所述终端设备的语义信息,所述语义信息由所述终端设备对应的用户输入,所述语义信息的类型包括第一文本信息和语音信息中的至少一种;
第一转换单元302,用于在所述语义信息为语音信息时,将所述语义信息转换为对应的第二文本信息;
分析单元303,用于对所述语义信息进行语义分析,确定所述用户的第一用户意图,所述用户意图包括所述第一用户意图;
第一查询单元304,用于根据所述第一用户意图查询是否存在对应的第一答复方案;
第一生成单元305,用于若查询到所述第一答复方案,则根据所述第一答复方案生成第一答复语句,并向所述客户端发送所述第一答复语句;
确定单元306,用于在未能查询到所述第一答复方案时,确定所述第一文本信息或所述第二文本信息中是否存在与身份有关的关键词;
第二查询单元307,用于当存在所述关键词时,查询所述关键词对应的第一目标对象;
第二转换单元308,用于根据所述第一目标对象将所述第一文本信息或所述第二文本信息转换为第一目标文本;
第三查询单元309,用于根据所述第一目标文本查询所述第一答复方案;
第二生成单元310, 用于根据所述第一答复方案生成第一答复语句;
发送单元311,用于向所述终端设备发送所述第一答复语句。
可以看出,本申请实施例中,首先通过获取用户通过所述终端设备输入的语义信息,所述语义信息的类型包括第一文本信息和语音信息中的至少一种;若所述语义信息为语音信息,则将所述语义信息转换为对应的第二文本信息;对所述语义信息进行语义分析,确定所述用户的第一用户意图;根据所述第一用户意图查询是否存在对应的第一答复方案;若查询到所述第一答复方案,则根据所述第一答复方案生成第一答复语句,并向所述客户端发送所述第一答复语句; 若未能查询到所述第一答复方案,则确定所述第一文本信息或所述第二文本信息中是否存在与身份有关的关键词;若存在所述关键词,则查询所述关键词对应的第一目标对象;根据所述第一目标对象将所述第一文本信息或所述第二文本信息转换为第一目标文本;根据所述第一目标文本查询所述第一答复方案;根据所述第一答复方案生成第一答复语句,并向所述终端设备发送所述第一答复语句。这样,提高了所述人机对话引擎的智能性和语音识别效率。
在一个可能的实施例中,所述获取单元301,还用于获取来自所述终端设备的第一关联关系,所述第一关联关系用于指示所述关键词与所述第一目标对象之间的关联关系;或者,监听用户与所述人机对话引擎的对话;从所述对话中获取所述第一关联关系。
在一个可能的实施例中,所述装置还包括:所述确定单元306,还用于确定所述第一关联关系是否发生改变;所述获取单元301,还用于当所述第一关联关系发生变更时,获取第二目标对象;替换单元,用于将所述第一目标对象替换为所述第二目标对象;所述获取单元301,还用于获取所述第二目标对象对应的第二目标地点;关联单元, 用于将所述第二目标对象与所述第二目标地点进行关联,得到第二用户意图,所述用户意图包括所述第二用户意图。
在一个可能的实施例中,所述终端设备为车载终端;所述确定所述第一关联关系是否发生改变的方面,所述确定单元306具体用于:获取来自所述终端设备的使用数据,所述使用数据用于指示车辆副驾驶位置的所述第二目标对象对所述终端设备的使用习惯;若所述使用数据发生改变,则判断所述第一目标对象发生变更。
在一个可能的实施例中,所述获取所述第二目标对象对应的第二目标地点的方面,所述获取单元301具体用于:获取历史导航数据;从所述历史导航数据中确定出所述第二目标对象所对应的第二目标地点。
在一个可能的实施例中,所述查询所述关键词对应的第一目标对象的方面,所述第二查询单元307具体用于:查询出与所述关键词关联的多个第三目标对象;确定所述第一文本信息或第二文本信息中的目标动作;统计历史导航数据中与所述目标动作共同出现频率最高的所述第一目标对象。
上述实施例,可以全部或部分地通过软件、硬件、固件或其他任意组合来实现。当使用软件实现时,上述实施例可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令或计算机程序。在计算机上加载或执行所述计算机指令或计算机程序时,全部或部分地产生按照本申请实施例所述的流程或功能。所述计算机可以为通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线或无线方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集合的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质(例如,软盘、硬盘、磁带)、光介质(例如,DVD)、或者半导体介质。半导体介质可以是固态硬盘。
本申请实施例还提供一种计算机存储介质,其中,该计算机存储介质存储用于电子数据交换的计算机程序,该计算机程序使得计算机执行如上述方法实施例中记载的任一方法的部分或全部步骤,上述计算机包括电子设备。
本申请实施例还提供一种计算机程序产品,上述计算机程序产品包括存储了计算机程序的非瞬时性计算机可读存储介质,上述计算机程序可操作来使计算机执行如上述方法实施例中记载的任一方法的部分或全部步骤。该计算机程序产品可以为一个软件安装包,上述计算机包括电子设备。
应理解,在本申请的各种实施例中,上述各过程的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本申请实施例的实施过程构成任何限定。
在本申请所提供的几个实施例中,应该理解到,所揭露的方法、装置和系统,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的;例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式;例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理包括,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能单元的形式实现。
上述以软件功能单元的形式实现的集成的单元,可以存储在一个计算机可读取存储介质中。上述软件功能单元存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的部分步骤。而前述的存储介质包括:U盘、移动硬盘、磁碟、光盘、易失性存储器或非易失性存储器。其中,非易失性存储器可以是只读存储器(read-only memory,ROM)、可编程只读存储器(programmable ROM,PROM)、可擦除可编程只读存储器(erasable PROM,EPROM)、电可擦除可编程只读存储器(electrically EPROM,EEPROM)或闪存。易失性存储器可以是随机存取存储器(random access memory,RAM),其用作外部高速缓存。通过示例性但不是限制性说明,许多形式的随机存取存储器(random access memory,RAM)可用,例如静态随机存取存储器(static RAM,SRAM)、动态随机存取存储器(DRAM)、同步动态随机存取存储器(synchronous DRAM,SDRAM)、双倍数据速率同步动态随机存取存储器(double data rateSDRAM,DDR SDRAM)、增强型同步动态随机存取存储器(enhanced SDRAM,ESDRAM)、同步连接动态随机存取存储器(synchlink DRAM,SLDRAM)和直接内存总线随机存取存储器(directrambus RAM,DR RAM)。等各种可以存储程序代码的介质。
虽然本发明披露如上,但本发明并非限定于此。任何本领域技术人员,在不脱离本发明的精神和范围内,可轻易想到变化或替换,均可作各种更动与修改,包含上述不同功能、实施步骤的组合,包含软件和硬件的实施方式,均在本发明的保护范围。
Claims (8)
1.一种基于身份转换的人机交互方法,其特征在于,应用于语义识别系统中的服务器,所述语义识别系统包括所述服务器和安装有与所述服务器对应的客户端的终端设备,其中,所述服务器包括人机对话引擎,所述人机对话引擎用于在导航场景下根据多个答复方案与所述终端设备进行人机交互,单个答复方案与对应的用户意图进行关联,所述用户意图用于指示用户需要所述人机对话引擎完成的导航动作,所述单个答复方案是指针对所述导航动作的答复策略;所述方法包括:
获取来自所述终端设备的用户输入信息,所述用户输入信息包括第一文本信息和语音信息中的至少一种,所述第一文本信息是指由所述用户通过输入框输入的文本信息;若所述用户输入信息为语音信息,则将所述语音信息转换为对应的第二文本信息;对所述第二文本信息进行语义分析,确定所述用户的第一用户意图,所述第一用户意图用于指示所述第二文本信息需要所述人机对话引擎完成的目标导航动作;查询所述服务器中是否存在与所述第一用户意图对应的第一答复方案;
若查询到所述第一答复方案,则根据所述第一答复方案生成针对所述目标导航动作的第一答复语句,并向所述客户端发送所述第一答复语句,所述第一答复语句包括执行所述目标导航动作的目标路线和目标耗时;
若未能查询到所述第一答复方案,则确定所述第二文本信息中是否存在与身份有关的关键词;
若存在所述关键词,则查询所述关键词对应的第一目标对象,包括:查询出与所述关键词关联的多个第三目标对象;以及,根据历史导航数据统计所述多个第三目标对象中每个第三目标对象与所述目标导航动作同时出现的频率,并确定统计出的多个频率中数值最高的频率所对应的第三目标对象作为所述第一目标对象;以及,将所述第二文本信息中的所述关键词替换为所述第一目标对象的名称,得到第一目标文本;以及,根据所述第一目标文本所指示的目标用户意图查询到所述第一答复方案;以及,根据所述第一答复方案生成针对所述目标导航动作的第一答复语句,并向所述终端设备发送所述第一答复语句;若未查询到所述关键词,则查询所述第二文本信息中所述关键词对应的同义词或近义词,若存在所述同义词或所述近义词,则根据所述同义词或所述近义词查询所述第一目标对象。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:获取来自所述终端设备的第一关联关系,所述第一关联关系用于指示所述关键词与所述第一目标对象之间的关联关系;或者,
监听用户与所述人机对话引擎的对话;从所述对话中获取所述第一关联关系。
3.根据权利要求2所述的方法,其特征在于,所述方法还包括:确定所述第一关联关系是否发生改变;当所述第一关联关系发生变更时,获取第二目标对象;将所述第一目标对象替换为所述第二目标对象;获取所述第二目标对象对应的第二目标地点;
将所述第二目标对象与所述第二目标地点进行关联,得到第二用户意图,所述用户意图包括所述第二用户意图。
4.根据权利要求3所述的方法,其特征在于,所述终端设备为车载终端;所述确定所述第一关联关系是否发生改变,包括:
获取来自所述终端设备的使用数据,所述使用数据用于指示车辆副驾驶位置的所述第二目标对象对所述终端设备的使用习惯;
若所述使用数据发生改变,则判断所述第一目标对象发生变更。
5.根据权利要求4所述的方法,其特征在于,所述获取所述第二目标对象对应的第二目标地点,包括:
获取历史导航数据;
从所述历史导航数据中确定出所述第二目标对象所对应的第二目标地点。
6.一种基于身份转换的人机交互装置,其特征在于,应用于语义识别系统中的服务器,所述语义识别系统包括所述服务器和安装有与所述服务器对应的客户端的终端设备,其中,所述服务器包括人机对话引擎,所述人机对话引擎用于在导航场景下根据多个答复方案与所述终端设备进行人机交互,单个答复方案与对应的用户意图进行关联,所述用户意图用于指示用户需要所述人机对话引擎完成的导航动作,所述单个答复方案是指针对所述导航动作的答复策略;所述装置包括:
获取单元,用于获取来自所述终端设备的用户输入信息,所述用户输入信息包括第一文本信息和语音信息中的至少一种,所述第一文本信息是指由所述用户通过输入框输入的文本信息;
第一转换单元,用于在所述用户输入信息为语音信息时,将所述语音信息转换为对应的第二文本信息;
分析单元,用于对所述第二文本信息进行语义分析,确定所述用户的第一用户意图,所述第一用户意图用于指示所述第二文本信息需要所述人机对话引擎完成的目标导航动作;
第一查询单元,用于查询所述服务器中是否存在与所述第一用户意图对应的第一答复方案;
第一生成单元,用于若查询到所述第一答复方案,则根据所述第一答复方案生成针对所述目标导航动作的第一答复语句,并向所述客户端发送所述第一答复语句,所述第一答复语句包括执行所述目标导航动作的目标路线和目标耗时;
确定单元,用于在未能查询到所述第一答复方案时,确定所述第二文本信息中是否存在与身份有关的关键词;
第二查询单元,用于当存在所述关键词时,查询所述关键词对应的第一目标对象,包括:查询出与所述关键词关联的多个第三目标对象;以及,根据历史导航数据统计所述多个第三目标对象中每个第三目标对象与所述目标导航动作同时出现的频率,并确定统计出的多个频率中数值最高的频率所对应的第三目标对象作为所述第一目标对象;
第二转换单元,用于将所述第二文本信息中的所述关键词替换为所述第一目标对象的名称,得到第一目标文本;
第三查询单元,用于根据所述第一目标文本所指示的目标用户意图查询到所述第一答复方案;
第二生成单元, 用于根据所述第一答复方案生成针对所述目标导航动作的第一答复语句;
发送单元,用于向所述终端设备发送所述第一答复语句;
若未查询到所述关键词,则查询所述第二文本信息中所述关键词对应的同义词或近义词,若存在所述同义词或所述近义词,则根据所述同义词或所述近义词查询所述第一目标对象。
7.一种电子设备,其特征在于,包括处理器、存储器、通信接口,以及一个或多个程序,所述一个或多个程序被存储在所述存储器中,并且被配置由所述处理器执行,所述程序包括用于执行如权利要求1-5任一项所述的方法中的步骤的指令。
8.一种计算机可读存储介质,其特征在于,存储用于电子数据交换的计算机程序,其中,所述计算机程序使得计算机执行如权利要求1-5任一项所述的方法中的步骤的指令。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211257371.9A CN115328321B (zh) | 2022-10-14 | 2022-10-14 | 基于身份转换的人机交互方法及相关装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211257371.9A CN115328321B (zh) | 2022-10-14 | 2022-10-14 | 基于身份转换的人机交互方法及相关装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN115328321A CN115328321A (zh) | 2022-11-11 |
CN115328321B true CN115328321B (zh) | 2023-03-24 |
Family
ID=83913418
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211257371.9A Active CN115328321B (zh) | 2022-10-14 | 2022-10-14 | 基于身份转换的人机交互方法及相关装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115328321B (zh) |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110209781A (zh) * | 2018-08-13 | 2019-09-06 | 腾讯科技(深圳)有限公司 | 一种文本处理方法、装置以及相关设备 |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107590123B (zh) * | 2017-08-07 | 2022-07-05 | 大众问问(北京)信息科技有限公司 | 车载中地点上下文指代消解方法及装置 |
US11651310B2 (en) * | 2019-03-29 | 2023-05-16 | Mckesson Corporation | Methods and systems for association rule mining |
US20210157860A1 (en) * | 2019-04-30 | 2021-05-27 | Beijing Bytedance Network Technology Co., Ltd. | Object recommendation method and apparatus, storage medium and terminal device |
CN111522909B (zh) * | 2020-04-10 | 2024-04-02 | 海信视像科技股份有限公司 | 一种语音交互方法及服务器 |
CN112148847B (zh) * | 2020-08-27 | 2024-03-12 | 出门问问创新科技有限公司 | 一种语音信息的处理方法及装置 |
CN115129845A (zh) * | 2022-07-05 | 2022-09-30 | 北京有竹居网络技术有限公司 | 文本信息处理方法、装置和电子设备 |
-
2022
- 2022-10-14 CN CN202211257371.9A patent/CN115328321B/zh active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110209781A (zh) * | 2018-08-13 | 2019-09-06 | 腾讯科技(深圳)有限公司 | 一种文本处理方法、装置以及相关设备 |
Also Published As
Publication number | Publication date |
---|---|
CN115328321A (zh) | 2022-11-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6942841B2 (ja) | ダイアログ・システムにおけるパラメータ収集および自動ダイアログ生成 | |
JP6647351B2 (ja) | 候補応答情報を生成する方法及び装置 | |
US10546067B2 (en) | Platform for creating customizable dialog system engines | |
US10468024B2 (en) | Information processing method and non-temporary storage medium for system to control at least one device through dialog with user | |
CN103077714B (zh) | 信息的识别方法和装置 | |
JP2019503526A5 (zh) | ||
CN109961786B (zh) | 基于语音分析的产品推荐方法、装置、设备和存储介质 | |
JP5616390B2 (ja) | 応答生成装置、応答生成方法および応答生成プログラム | |
CN105161097A (zh) | 语音交互方法及装置 | |
CN115424624B (zh) | 一种人机互动的服务处理方法、装置及相关设备 | |
KR20200027753A (ko) | 전자 장치 및 단축 명령어에 대응하는 태스크 수행 방법 | |
CN112579031A (zh) | 一种语音交互的方法、系统和电子设备 | |
KR20210001082A (ko) | 사용자 발화를 처리하는 전자 장치와 그 동작 방법 | |
JP2005266192A5 (zh) | ||
JP2005266192A (ja) | 音声認識装置および音声認識方法 | |
CN115328321B (zh) | 基于身份转换的人机交互方法及相关装置 | |
CN110909159B (zh) | 一种用户意图识别方法、装置、终端及存储介质 | |
KR102485339B1 (ko) | 차량의 음성 명령 처리 장치 및 방법 | |
CN113468306B (zh) | 语音对话方法、装置、电子设备及存储介质 | |
JP6929960B2 (ja) | 情報処理装置及び情報処理方法 | |
CN111243588A (zh) | 一种控制设备的方法、电子设备及计算机可读存储介质 | |
US11417326B2 (en) | Hub-dialogue system and dialogue processing method | |
CN113889102A (zh) | 指令接收方法、系统、电子设备、云端服务器和存储介质 | |
CN117609452A (zh) | 一种对话回复生成方法、装置、设备和存储介质 | |
CN111246384A (zh) | 一种最佳位置确定方法、系统及电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |