CN110008314B

CN110008314B - 一种意图解析方法及装置

Info

Publication number: CN110008314B
Application number: CN201910291051.7A
Authority: CN
Inventors: 魏誉荧
Original assignee: Guangdong Genius Technology Co Ltd
Current assignee: Guangdong Genius Technology Co Ltd
Priority date: 2019-04-12
Filing date: 2019-04-12
Publication date: 2022-07-26
Anticipated expiration: 2039-04-12
Also published as: CN110008314A

Abstract

本发明属于意图识别领域，公开了一种意图解析方法及装置，其方法包括：接收用户输入的语音信息；对所述语音信息进行语义解析；当解析出的实体语义槽对应多个内容时，获取用户浏览的当前页面；根据所述用户浏览的当前页面和预设的映射关系表，确定所述语音信息对应的意图；所述映射关系表包括语料、页面和应用的映射关系。本发明的意图解析方法可用于人机交互过程中的意图解析，当解析出用户的语音信息中的实体语义槽对应多个内容时，即可结合用户在终端设备上所停留的页面状态，优先针对在此状态下的内容进行语义理解，从而提高意图解析的准确率。

Description

一种意图解析方法及装置

技术领域

本发明属于意图识别技术领域，特别涉及一种意图解析方法及装置。

背景技术

随着智能终端及网络技术的迅速发展，人们越来越习惯地使用智能终端完成各种需求，如在学习的过程中，碰到不理解的知识点、不会解的习题时，在智能学习设备中语音输入相关知识点，搜索对应的答案和知识讲解，以便对用户进行学习辅导。

在人机交互场景中，准确理解用户的意图是做出正确应答的基础。目前，在大部分语音产品中，针对意图的理解都是基于整个产品的知识库进行的，当用户的语音输入后，对于意图的解析是根据搜索定义的权重来获取的，会导致意图获取的偏差，使得用户的体验感较差，不利于产品的推广和使用。

发明内容

本发明的目的是提供一种意图解析方法及装置，通过结合用户语音和用户当前在设备上停留的页面来对用户语音进行意图解析，提高意图解析的准确率。

本发明提供的技术方案如下：

一方面，提供一种意图解析方法，包括：

接收用户输入的语音信息；

对所述语音信息进行语义解析；

当解析出的实体语义槽对应多个内容时，获取用户浏览的当前页面；

根据所述用户浏览的当前页面和预设的映射关系表，确定所述语音信息对应的意图；所述映射关系表包括语料、页面和应用的映射关系。

进一步地，所述映射关系表的建立方法为：

收集大量用户语料，并记录每条语料产生时的页面；

提取所述页面的特征信息；

根据所述页面的特征信息，确定所述页面对应的应用；

建立所述语料、所述页面和所述应用的映射关系，形成映射关系表。

进一步地，所述根据所述用户浏览的当前页面和映射关系表，确定所述语音信息对应的意图具体包括：

根据所述用户浏览的当前页面，确定用户当前使用的应用；

根据所述用户当前使用的应用和预设的映射关系表，在所述多个内容中确定所述实体语义槽对应的内容；

根据所述实体语义槽对应的内容，确定所述语音信息对应的意图。

进一步地，所述接收用户输入的语音信息之前还包括：

收集大量用户语料；

对所述语料进行分词标注；

对分词标注后的语料进行语法分析，生成对应的正则表达式和语义槽；

对所述语音信息进行语义解析具体包括：

根据所述正则表达式和所述语义槽对所述语音信息进行语义解析。

进一步地，所述当解析出的实体语义槽对应多个内容时，获取用户浏览的当前页面具体包括：

当解析出的实体语义槽对应多个内容时，检测屏幕上是否显示有页面信息；

若是，则通过屏幕截图获取用户浏览的当前页面；

若否，则显示提示信息；所述提示信息用于提醒用户通过摄像头获取其他显示设备上显示的当前页面。

另一方面，还提供一种意图解析装置，包括：

语音接收模块，用于接收用户输入的语音信息；

语义解析模块，用于对所述语音信息进行语义解析；

页面获取模块，用于当解析出的实体语义槽对应多个内容时，获取用户浏览的当前页面；

意图确定模块，用于根据所述用户浏览的当前页面和预设的映射关系表，确定所述语音信息对应的意图；

映射关系建立模块，用于建立所述映射关系表，所述映射关系表包括语料、页面和应用的映射关系。

进一步地，所述映射关系建立模块包括：

收集及记录单元，用于收集大量用户语料，并记录每条语料产生时的页面；

特征提取单元，用于提取所述页面的特征信息；

第一应用确定单元，用于根据所述页面的特征信息，确定所述页面对应的应用；

映射关系建立单元，用于建立所述语料、所述页面和所述应用的映射关系，形成映射关系表。

进一步地，所述意图确定模块包括：

第二应用确定单元，用于根据所述用户浏览的当前页面，确定用户当前使用的应用；

内容确定单元，用于根据所述用户当前使用的应用和预设的映射关系表，在所述多个内容中确定所述实体语义槽对应的内容；

意图确定单元，用于根据所述实体语义槽对应的内容，确定所述语音信息对应的意图。

进一步地，还包括：

语料收集模块，用于收集大量用户语料；

分词标注模块，用于对所述语料进行分词标注；

正则生成模块，用于对分词标注后的语料进行语法分析，生成对应的正则表达式和语义槽；

所述语义解析模块包括：

语义解析单元，用于根据所述正则表达式和所述语义槽对所述语音信息进行语义解析。

进一步地，所述页面获取模块包括：

检测单元，用于当解析出的实体语义槽对应多个内容时，检测屏幕上是否显示有页面信息；

截屏单元，用于当检测到屏幕上显示有页面信息时，通过屏幕截图获取用户浏览的当前页面；

提示单元，用于当检测到屏幕上未显示有页面信息时，显示提示信息；所述提示信息用于提醒用户通过摄像头获取其他显示设备上显示的当前页面。

与现有技术相比，本发明提供的一种意图解析方法及装置具有以下有益效果：本发明的意图解析方法可用于人机交互过程中的意图解析，当解析出用户的语音信息中的实体语义槽对应多个内容时，即可结合用户在终端设备上所停留的页面状态，优先针对在此状态下的内容进行语义理解，从而提高意图解析的准确率。

附图说明

下面将以明确易懂的方式，结合附图说明优选实施方式，对一种意图解析方法及装置的上述特性、技术特征、优点及其实现方式予以进一步说明。

图1是本发明一种意图解析方法的第一实施例的流程示意图；

图2是本发明一种意图解析方法的映射关系表的建立方法的流程示意图；

图3是本发明一种意图解析方法的第三实施例的流程示意图；

图4是本发明一种意图解析方法的第四实施例的流程示意图；

图5是本发明一种意图解析方法的第五实施例的流程示意图；

图6是本发明一种意图解析装置的一个实施例的结构示意框图。

附图标号说明

100、语音接收模块； 200、语义解析模块；

210、语义解析单元； 300、页面获取模块；

310、检测单元； 320、截屏单元；

330、提示单元； 400、意图确定模块；

410、第二应用确定单元； 420、内容确定单元；

430、意图确定单元； 500、映射关系建立模块；

510、收集及记录单元； 520、特征提取单元；

530、第一应用确定单元； 540、映射关系建立单元；

600、语料收集模块； 700、分词标注模块；

800、正则生成模块。

具体实施方式

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对照附图说明本发明的具体实施方式。显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图，并获得其他的实施方式。

为使图面简洁，各图中只示意性地表示出了与本发明相关的部分，它们并不代表其作为产品的实际结构。另外，以使图面简洁便于理解，在有些图中具有相同结构或功能的部件，仅示意性地绘示了其中的一个，或仅标出了其中的一个。在本文中，“一个”不仅表示“仅此一个”，也可以表示“多于一个”的情形。

根据本发明提供的第一实施例，如图1所示，一种意图解析方法，包括：

S100接收用户输入的语音信息；

具体地，在实际使用过程中，可通过智能终端上的麦克风来接收用户输入的语音信息，也可使用外接的麦克风等语音接收设备来接收用户输入的语音信息。此处对于接收用户的语音信息的方式不做任何不限定，只要能使智能终端获取到用户输入的语音信息即可。

S200对所述语音信息进行语义解析；

具体地，当接收到用户输入的语音信息后，则对该语音信息进行语义解析，语义解析可使用现有的语义解析方法进行解析。在进行语义解析时，可先将语音信息转换为文本信息，然后对文本信息进行语义解析。

S300当解析出的实体语义槽对应多个内容时，获取用户浏览的当前页面；

具体地，在使用现有的语义解析方法进行语义解析时，可能存在一个实体语义槽对应多个内容的情况。

例如，用户输入的语音信息为“我要听江南”，而解析出的实体语义槽“江南”对应多个内容，如歌曲江南和古诗江南；若仅根据语音信息“我要听江南”，则并不能很明确的知晓用户到底是要听古诗江南还是歌曲江南。再例如，用户输入的语音信息为“播放红楼梦”，而解析出的实体语义槽“红楼梦”对应多个内容，如电视剧红楼梦和对小说红楼梦的解说视频；若仅根据语音信息“播放红楼梦”，则并不能很明确的知晓用户到底是想看电视剧红楼梦，还是对红楼梦的解说视频。

因此，当解析出的实体语义槽对应多个内容时，则获取用户浏览的当前页面，即智能终端屏幕上显示的当前页面。

S400根据所述用户浏览的当前页面和预设的映射关系表，确定所述语音信息对应的意图；所述映射关系表包括语料、页面和应用的映射关系。

具体地，当获取到用户浏览的当前页面后，根据当前页面和预设的映射关系表中语料、页面和应用的映射关系，即可从多个内容中确定出用户的真实意图。

例如，若用户输入的语音信息为“我要听江南”，且用户当前停留的页面为古诗词应用，则向用户返回古诗词江南，而不是返回歌曲江南；若用户输入的语音信息为“播放红楼梦”，且用户当前停留的页面为学习类应用，则向用户返回对小说红楼梦的解说视频，而不是返回电视机红楼梦。

本实施例的意图解析方法可用于人机交互过程中的意图解析，当解析出用户的语音信息中的实体语义槽对应多个内容时，即可结合用户在终端设备上所停留的页面状态，优先针对在此状态下的内容进行语义理解，从而提高意图解析的准确率。

根据本发明提供的第二实施例，一种意图解析方法，包括：

S100接收用户输入的语音信息；

S200对所述语音信息进行语义解析；

S400根据所述用户浏览的当前页面和预设的映射关系表，确定所述语音信息对应的意图；所述映射关系表包括语料、页面和应用的映射关系；

其中，如图2所示，所述映射关系表的建立方法为：

S010收集大量用户语料，并记录每条语料产生时的页面；

具体地，收集大量用户在使用智能终端时的语料，如不同学生在使用家教机时输入的各种语料；智能终端在记录用户输入的语料时，一并记录用户在输入该语料时，智能终端的屏幕所停留的页面，即语料产生时智能终端的屏幕所停留的页面。

S020提取所述页面的特征信息；

具体地，页面的特征信息是指页面中能表示该页面属于什么应用的信息，因为每个应用都具有自己独特的设计风格，因此，可通过提取出的页面的特征信息来判断每个页面分别属于哪个应用。当某一个页面无法提取出页面的特征信息或从提取出的特征信息中无法获知该页面对应的应用时，可通过人工来分辨该页面属于什么应用。

S030根据所述页面的特征信息，确定所述页面对应的应用；

具体地，提取出每个页面的特征信息后，确定每个页面分别对应的应用，应用可包括学习类应用、音乐类应用、影视类应用，学习类应用又可以包括视频学习类应用、习题练习类应用、各个学科的学习类应用等。

S040建立所述语料、所述页面和所述应用的映射关系，形成映射关系表。

具体地，得到语料、语料产生时的页面以及页面对应的应用后，即可建立语料、语料产生时的页面以及页面对应的应用的映射关系，形成映射关系表。

本实施例中，通过收集大量语料，即可建立大量语料与页面、应用的映射关系，从而形成一个较为完整的包含了大量语料信息的映射关系表。映射关系表中的语料可以是完整地用户语料，也可以是从用户语料中提取出的关键词。

例如，第一个语料为“江南”，第一个语料产生时的页面为听歌页面，通过提取该页面的特征信息，可知该页面对应的应用为音乐类应用；第二个语料仍为“江南”，第二个语料产生时的页面为古诗词页面，通过提取该页面的特征信息，可知该页面对应的应用为语文学科的学习类应用。根据上述两个语料、语料产生的页面以及对应的应用，可在第一个语料为歌曲江南，第二个语料为音乐江南；因此，可建立歌曲江南与听歌页面和音乐类应用的映射关系，并建立古诗江南与古诗词页面和语文学的学习类应用的映射关系。

因为有的页面无法提取出特征信息，或提取出的特征信息无法判断该页面属于什么应用，因此，在本实施例中仍需要保留页面信息，即建立语料、页面和应用三者的映射关系。

在对用户新输入的语音信息进行意图解析的过程中，当可以直接知晓当前页面对应的应用时，即可直接根据映射关系表中该应用对应的语料来获取语音信息对应的意图；从而提高意图解析的速率。若不能直接知晓当前页面对应的应用时，可直接将该当前页面与映射关系表中页面进行匹配，以得到该当前页面对应的语料，从而确定语音信息对应的意图，以防止出现无法解析的情况。

建立的映射关系表中，同一个语料可能对应多个页面，而多个页面可能对应一个应用，例如，音乐类应用可包含多个页面，而语料与应用之间的对应关系的唯一的。即语料与页面之前是一对多的关系，页面与应用之间的多对一的关系。

本实施例中，通过收集用户在使用智能终端时的真实语料以及语料产生时的页面，使得形成的映射关系表真实有效，进而可提高意图解析的准确率；并且，建立语料与应用的一一对应关系，可简化后续在意图解析过程中的查找匹配过程。

根据本发明提供的第三实施例，如图3所示，一种意图解析方法，包括：

S100接收用户输入的语音信息；

S200对所述语音信息进行语义解析；

S410根据所述用户浏览的当前页面，确定用户当前使用的应用；

具体地，在用户浏览的当前页面中，先提取出当前页面的特征信息，然后根据特征信息确定当前页面对应的应用。

S420根据所述用户当前使用的应用和预设的映射关系表，在所述多个内容中确定所述实体语义槽对应的内容；所述映射关系表包括语料、页面和应用的映射关系；

具体地，得到当前页面对应的应用后，可根据预设的映射关系表和当前页面对应的应用，在多个内容中确定实体语义槽对应的内容。

例如，实体语义槽“江南”对应古诗江南和歌曲江南，当根据当前页面得到当前页面对应的应用为音乐类应用时，由于在映射关系表中已经建立了歌曲江南与音乐类应用的映射关系，因此，根据音乐类应用即可确定实体语义槽对应的内容为歌曲江南。

S430根据所述实体语义槽对应的内容，确定所述语音信息对应的意图。

具体地，根据上述步骤确定出实体语义槽对应的内容后，即可根据实体语义槽对应的内容，并结合之前语义解析出的其他实体的语义确定语音信息对应的意图，即向用户播放歌曲江南。

本实施例描述的可以直接从用户浏览的当前页面中获取当前页面对应的应用(用户当前使用的应用)的情形；当无法从当前页面中获取到当前页面对应的应用时，可直接将当前页面与预设的映射关系表中页面进行进行匹配，得到相匹配的目标页面，然后根据目标页面对应的语料，在多个内容中确定实体语义槽对应的内容，然后根据实体语义槽对应的内容，并结合之前语义解析出的其他实体的语义确定语音信息对应的意图，即向用户播放歌曲江南。

根据本发明提供的第四实施例，如图4所示，一种意图解析方法，包括：

S050收集大量用户语料；

具体地，先收集大量语料，语料可以为文本信息、语音信息或录制的音频信息；如在计算机或智能设备上存储的用户文字输入的一句话，或存储的用户语音输入的语音信息，或在其他音频信息中截取的某一句话。

S060对所述语料进行分词标注；

具体地，获取语料后，先对每条语料进行分词，若语料为语音信息，可先将语音信息转化为文本信息，然后对文本信息进行分词。分词是指将一个汉字序列切分成一个一个单独的词，即将一句话切分成一个个单独的词。将语料进行分词后，标注分词后各个词语的词性。

例如，语料为“小鸟为什么会飞”，分词后变为“小鸟”、“为什么”、“会”、“飞”。然后标注分词后各个词语的词性，如“小鸟”为名词，“为什么”为副词，“会”为助动词，“飞”为动词。

S070对分词标注后的语料进行语法分析，生成对应的正则表达式和语义槽；

具体地，正则表达式是指用来描述或者匹配一系列符合某个句法规则的字符串。正则表达式一般由普通字符和元字符组成，普通字符包括数字和大小写的字母，而元字符是具有特殊含义的字符。

例如，“s”表示任何空白字符，包括空格、制表符、换页符等，“.”表示除换行元字符“”以外的任意字符，“*”表示前面的子表达式重复零次或多次。

生成正则表达式时，可使用多种方法，如根据每条语料的句法结构生成对应的正则表达式，句法结构相同或相似的多个语料可以生成一个正则表达式。

例如：主谓宾结构可以生成一个正则表达式，生成的正则表达式为：(名词库1)*(动词库)*(名词库2)。再如，语料1：“鲸鱼为什么会喷水”和语料2：“小鸟为什么会飞”，其生成的正则表达式为“(名词库)*(为什么)*(会)*(动词库)”。

再例如，语料“我喜欢天上的朵朵白云”，生成的正则表达式为：(表示主语的词)*(表示喜欢的词)*(.？)*(表示白云的词)，其中，“.？”表示可匹配任意字符。得到该正则表达式后，还可将该正则表达式与正则表达式“(表示主语的词)*(表示喜欢的词)*(表示季节的词|表示动作的词)”进行合并，得到正则表达式：(表示主语的词)*(表示喜欢的词)*(.？)*(表示季节的词|表示动作的词|表示白云的词)。

其中，语义槽是指某一类型的词或语义相同的词，如名词库、动词库、表示主语的词、表示喜欢的词、表示季节的词等。

S100接收用户输入的语音信息；

S210根据所述正则表达式和所述语义槽对所述语音信息进行语义解析；

具体地，根据上述方法生成正则表达式和语义槽后，即可根据正则表达式和语义槽来解析语音信息的语义。

根据本发明提供的第五实施例，如图5所示，一种意图解析方法，包括：

S100接收用户输入的语音信息；

S200对所述语音信息进行语义解析；

S310当解析出的实体语义槽对应多个内容时，检测屏幕上是否显示有页面信息；

具体地，当解析出的实体语义槽对应多个内容时，智能终端检测自身屏幕上是否显示有页面信息，页面信息是指打开应用时的页面，不包括智能终端的桌面，若显示的是智能终端的桌面，则认为未显示有页面信息。

S320若是，则通过屏幕截图获取用户浏览的当前页面；

具体地，当检测到智能终端的屏幕上显示有页面信息时，则可通过屏幕截图的方式直接获取用户当前浏览的页面。

S330若否，则显示提示信息；所述提示信息用于提醒用户通过摄像头获取其他显示设备上显示的当前页面；

具体地，当未检测到智能终端的屏幕上显示有页面信息时，则提示用户是否有使用其他显示设备，或使用其他智能终端或电脑等进行页面浏览，如使用智能终端外接的显示设备在进行页面浏览，或在电脑上进行页面浏览时，则可提示用户通过智能终端上的摄像头来获取其他设备上的页面信息，以便用于结合用户使用应用的状态和语音来对用户输入的语音信息进行意图解析，从而提高意图解析的准确率。

根据本发明提供的第六实施例，如图6所示，一种意图解析装置，包括：

语音接收模块100，用于接收用户输入的语音信息；

语义解析模块200，用于对所述语音信息进行语义解析；

页面获取模块300，用于当解析出的实体语义槽对应多个内容时，获取用户浏览的当前页面；

意图确定模块400，用于根据所述用户浏览的当前页面和预设的映射关系表，确定所述语音信息对应的意图；

映射关系建立模块500，用于建立所述映射关系表，所述映射关系表包括语料、页面和应用的映射关系。

优选地，映射关系建立模块500包括：

收集及记录单元510，用于收集大量用户语料，并记录每条语料产生时的页面；

特征提取单元520，用于提取所述页面的特征信息；

第一应用确定单元530，用于根据所述页面的特征信息，确定所述页面对应的应用；

映射关系建立单元540，用于建立所述语料、所述页面和所述应用的映射关系，形成映射关系表。

具体地，得到语料、语料产生时的页面以及页面对应的应用后，即可建立语料、语料产生时的页面以及页面对应的应用的映射关系，形成映射关系表。本实施例中，通过收集大量语料，即可建立大量语料与页面、应用的映射关系，从而形成一个较为完整的包含了大量语料信息的映射关系表。映射关系表中的语料可以是完整地用户语料，也可以是从用户语料中提取出的关键词。

优选地，意图确定模块400包括：

第二应用确定单元410，用于根据所述用户浏览的当前页面，确定用户当前使用的应用；

内容确定单元420，用于根据所述用户当前使用的应用和预设的映射关系表，在所述多个内容中确定所述实体语义槽对应的内容；

意图确定单元430，用于根据所述实体语义槽对应的内容，确定所述语音信息对应的意图。

优选地，还包括：

语料收集模块600，用于收集大量用户语料；

分词标注模块700，用于对所述语料进行分词标注；

正则生成模块800，用于对分词标注后的语料进行语法分析，生成对应的正则表达式和语义槽；

语义解析模块200包括：

语义解析单元210，用于根据所述正则表达式和所述语义槽对所述语音信息进行语义解析。

优选地，页面获取模块300包括：

检测单元310，用于当解析出的实体语义槽对应多个内容时，检测屏幕上是否显示有页面信息；

截屏单元320，用于当检测到屏幕上显示有页面信息时，通过屏幕截图获取用户浏览的当前页面；

提示单元330，用于当检测到屏幕上未显示有页面信息时，显示提示信息；所述提示信息用于提醒用户通过摄像头获取其他显示设备上显示的当前页面。

应当说明的是，上述实施例均可根据需要自由组合。以上所述仅是本发明的优选实施方式，应当指出，对于本技术领域的普通技术人员来说，在不脱离本发明原理的前提下，还可以做出若干改进和润饰，这些改进和润饰也应视为本发明的保护范围。

Claims

1.一种意图解析方法，其特征在于，包括：

接收用户输入的语音信息；

对所述语音信息进行语义解析；

若是，则通过屏幕截图获取用户浏览的当前页面；

若否，则显示提示信息；所述提示信息用于提醒用户通过摄像头获取其他显示设备上显示的当前页面；

2.根据权利要求1所述的一种意图解析方法，其特征在于，所述映射关系表的建立方法为：

收集用户语料，并记录每条语料产生时的页面；

提取所述页面的特征信息；

根据所述页面的特征信息，确定所述页面对应的应用；

3.根据权利要求1或2所述的一种意图解析方法，其特征在于，所述根据所述用户浏览的当前页面和映射关系表，确定所述语音信息对应的意图具体包括：

根据所述用户浏览的当前页面，确定用户当前使用的应用；

4.根据权利要求1或2所述的一种意图解析方法，其特征在于，所述接收用户输入的语音信息之前还包括：

收集用户语料；

对所述语料进行分词标注；

对所述语音信息进行语义解析具体包括：

5.一种意图解析装置，其特征在于，包括：

语音接收模块，用于接收用户输入的语音信息；

语义解析模块，用于对所述语音信息进行语义解析；

所述页面获取模块包括：

提示单元，用于当检测到屏幕上未显示有页面信息时，显示提示信息；所述提示信息用于提醒用户通过摄像头获取其他显示设备上显示的当前页面；

6.根据权利要求5所述的一种意图解析装置，其特征在于，所述映射关系建立模块包括：

收集及记录单元，用于收集用户语料，并记录每条语料产生时的页面；

特征提取单元，用于提取所述页面的特征信息；

7.根据权利要求5或6所述的一种意图解析装置，其特征在于，所述意图确定模块包括：

8.根据权利要求5或6所述的一种意图解析装置，其特征在于，还包括：

语料收集模块，用于收集用户语料；

分词标注模块，用于对所述语料进行分词标注；

所述语义解析模块包括：