CN113076397A - 意图识别方法、装置、电子设备及存储介质 - Google Patents
意图识别方法、装置、电子设备及存储介质 Download PDFInfo
- Publication number
- CN113076397A CN113076397A CN202110335152.7A CN202110335152A CN113076397A CN 113076397 A CN113076397 A CN 113076397A CN 202110335152 A CN202110335152 A CN 202110335152A CN 113076397 A CN113076397 A CN 113076397A
- Authority
- CN
- China
- Prior art keywords
- information
- text information
- text
- intention
- entity
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 64
- 238000013507 mapping Methods 0.000 claims abstract description 25
- 230000006870 function Effects 0.000 claims description 51
- 230000015654 memory Effects 0.000 claims description 15
- 238000006243 chemical reaction Methods 0.000 claims description 13
- 230000008569 process Effects 0.000 claims description 11
- 238000003058 natural language processing Methods 0.000 abstract description 2
- 238000010586 diagram Methods 0.000 description 13
- 238000012545 processing Methods 0.000 description 10
- 238000000605 extraction Methods 0.000 description 7
- 238000004891 communication Methods 0.000 description 4
- 238000004590 computer program Methods 0.000 description 4
- 230000005540 biological transmission Effects 0.000 description 3
- 238000010411 cooking Methods 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 238000004378 air conditioning Methods 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000013527 convolutional neural network Methods 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 238000013136 deep learning model Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 238000003062 neural network model Methods 0.000 description 1
- 238000003909 pattern recognition Methods 0.000 description 1
- 238000009877 rendering Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 239000004576 sand Substances 0.000 description 1
- 238000010845 search algorithm Methods 0.000 description 1
- 230000006403 short-term memory Effects 0.000 description 1
- 238000012549 training Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
- G06F16/3343—Query execution using phonetics
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/332—Query formulation
- G06F16/3329—Natural language query formulation or dialogue systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
- G06F16/3344—Query execution using natural language analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/205—Parsing
- G06F40/211—Syntactic parsing, e.g. based on context-free grammar [CFG] or unification grammars
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- General Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Health & Medical Sciences (AREA)
- Mathematical Physics (AREA)
- Acoustics & Sound (AREA)
- Human Computer Interaction (AREA)
- Machine Translation (AREA)
Abstract
本申请涉及一种意图识别方法、装置、电子设备及存储介质,属于自然语言处理技术领域。该方法包括:获取待识别的文本信息和所述文本信息的实体信息;基于预设的多个句式类别,对所述文本信息进行句式匹配,得到目标句式类别;将所述目标句式类别和所述实体信息进行意图映射,得到所述文本信息对应的意图信息;从而实现了将对文本内容的识别转变为对句式的识别,这样,降低了识别的难度,进而提高了意图识别的效率。
Description
技术领域
本申请实施例涉及自然语言处理技术领域,特别涉及一种意图识别方法、装置、电子设备及存储介质。
背景技术
目前,终端中大多设置有语音助手,以辅助用户控制终端执行一些任务,例如播放音乐、打开通话记录等。在使用语音助手控制终端的过程中,用户输入语音信号,终端需要识别该语音信号的意图信息,然后基于该意图信息,执行对应的任务。
发明内容
本申请实施例提供了一种意图识别方法、装置、电子设备及存储介质,可以提高意图识别的效率。所述技术方案如下:
一方面,提供了一种意图识别方法,所述方法包括:
获取待识别的文本信息和所述文本信息的实体信息;
基于预设的多个句式类别,对所述文本信息进行句式匹配,得到目标句式类别;
将所述目标句式类别和所述实体信息进行意图映射,得到所述文本信息对应的意图信息。
另一方面,提供了一种意图识别装置,所述装置包括:
信息获取模块,用于获取待识别的文本信息和所述文本信息的实体信息;
句式匹配模块,用于基于预设的多个句式类别,对所述文本信息进行句式匹配,得到目标句式类别;
意图映射模块,用于将所述目标句式类别和所述实体信息进行意图映射,得到所述文本信息对应的意图信息。
另一方面,提供了一种终端,所述终端包括处理器和存储器;所述存储器存储有至少一条程序代码,所述至少一条程序代码用于被所述处理器执行以实现如上述方面所述的意图识别方法。
另一方面,提供了一种计算机可读存储介质,所述计算机可读存储介质存储有至少一条程序代码,所述至少一条程序代码用于被处理器执行以实现如上述方面所述的意图识别方法。
另一方面,提供了一种计算机程序产品,当所述计算机程序产品中的程序代码由电子设备的处理器执行时,使得所述电子设备能够执行如上述方面所述的意图识别方法。
在本申请实施例中,对于包含不同意图的文本信息,其句式可能相似,则通过基于预设的多个句式类别,对待识别的文本信息进行句式匹配,能够得到相应的句式类别,从而实现了将对文本内容的识别转变为对句式的识别,再通过对该文本信息的句式类别和实体信息进行意图映射,能够得到该文本信息的意图信息,这样,降低了识别的难度,进而提高了意图识别的效率。
附图说明
图1示出了本申请一个示例性实施例所提供的实施环境的示意图;
图2示出了本申请一个示例性实施例所提供的终端的结构框图;
图3示出了本申请一个示例性实施例所提供的服务器的结构框图;
图4示出了本申请一个示例性实施例示出的意图识别方法的流程图;
图5示出了本申请一个示例性实施例示出的意图识别方法的示意图;
图6示出了本申请一个示例性实施例示出的意图识别方法的示意图;
图7示出了本申请一个示例性实施例示出的意图识别方法的示意图;
图8示出了本申请一个示例性实施例示出的意图识别方法的示意图;
图9示出了本申请一个示例性实施例示出的意图信息的生成方法的流程图;
图10示出了本申请一个示例性实施例示出的意图识别方法的示意图;
图11示出了本申请一个示例性实施例所提供的意图识别装置的结构框图。
具体实施方式
为使本申请的目的、技术方案和优点更加清楚,下面将结合附图对本申请实施方式作进一步地详细描述。
在本文中提及的“多个”是指两个或两个以上。“和/或”,描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。字符“/”一般表示前后关联对象是一种“或”的关系。
本申请实施例提供的意图识别方法,应用于电子设备。在一种可能实现方式中,电子设备可以为终端,例如,手机、平板电脑、家居设备或者可穿戴设备等。在另一种可能实现方式中,电子设备可以为服务器,该服务器为一台服务器,或者由若干服务器组成的服务器集群,或者是一个云计算服务中心。在另一种可能实现方式中,电子设备包括终端和服务器。
请参考图1,其示出了本申请一个示例性实施例所提供的实施环境的示意图。该实施环境包括终端100和服务器200。终端100分别与服务器200通过无线或者有线网络连接。
终端100上安装有由服务器200提供服务的目标应用,终端100能够通过该目标应用实现例如数据传输、数据交互等功能。可选地,该目标应用为终端100操作系统中的应用程序,或者为第三方提供的应用程序。该目标应用具有意图识别功能,当然,该目标应用还能够具有其他功能,例如,语音控制功能、语音识别功能等。相应的,该目标应用可以为浏览器、语音助手、导航应用、社交应用或者智能家居应用等应用中的任一个应用。
服务器200为该目标应用的后台服务器或者为提供云计算以及云存储等服务的云服务器。
在一种可能的实现方式中,终端100获取待识别的文本信息,向服务器200发送该待识别的文本信息,服务器200接收该待识别的文本信息,对该待识别的文本信息进行意图识别,得到该文本信息对应的意图信息,向终端100发送该意图信息,终端100接收该意图信息,基于该意图信息执行对应的任务。
本申请实施例提供的意图识别方法,能够应用在语音控制场景中,以电子设备为终端为例进行说明。
在一些实施例中,目标应用为语音助手,则用户可以通过语音信号控制终端执行一些任务。例如,若用户想要控制终端打开天气应用,则用户可以通过终端在语音助手中输入语音信号,其中,该语音信号包含的语义信息可以为“帮我打开一下天气”。终端基于被输入的语音信号,通过本申请实施例提供的意图识别方法,得到相应的意图信息,该意图信息可以为:打开天气应用,从而终端打开天气应用,例如,展示天气应用的主界面。
在另一些实施例中,目标应用为浏览器,则用户可以通过语音信号控制终端对内容进行搜索。例如,若用户想要通过语音信号来搜索沙尘暴,则可以通过终端在浏览器中输入语音信号,其中,该语音信号包含的语义信息可以为“帮我搜索一下沙尘暴是什么”。终端基于被输入的语音信号,通过本申请实施例提供的意图识别方法,得到相应的意图信息,该意图信息可以为:搜索沙尘暴的相关信息,从而终端将搜索操作得到结果展示在浏览器的显示界面中。
在另一些实施例中,目标应用为导航应用,则用户可以通过语音信号控制终端进行导航。例如,若用户在使用终端进行导航的过程中,想要听一个笑话,则用户可以通过终端在导航应用中输入语音信号,其中,该语音信号包含的语义信息可以为“给我讲一个笑话”。终端基于被输入的语音信号,通过本申请实施例提供的意图识别方法,得到相应的意图信息,该意图信息可以为:“语音播放一个笑话”,从而终端通过语音播放一个笑话。
在另一些实施例中,目标应用为智能家居应用,则用户可以通过语音信号控制终端对家居设备进行控制。例如,若用户想要通过终端控制空调关闭,则用户可以通过终端在导航应用中输入语音信号,其中,该语音信号包含的语义信息可以为“把空调关了”。终端基于被输入的语音信号,通过本申请实施例提供的意图识别方法,得到相应的意图信息,该意图信息可以为:“关闭空调”,从而终端通过与空调之间的通信连接,将空调关闭。
需要说明的一点是,以上应用场景仅是示例性说明,并不对意图识别场景造成限制,本申请除了应用在以上场景外,还能够应用在其他任一意图识别的场景中。
请参考图2,其示出了本申请一个示例性实施例提供的终端100的结构框图。终端100可以是手机、平板电脑、家居设备或者可穿戴设备等具有意图识别功能的终端。本申请中的终端100可以包括一个或多个如下部件:处理器110、存储器120、显示屏130。
处理器110可以包括一个或者多个处理核心。处理器110利用各种接口和线路连接整个终端100内的各个部分,通过运行或执行存储在存储器120内的指令、程序、代码集或指令集,以及调用存储在存储器120内的数据,执行终端100的各种功能和处理数据。可选地,处理器110可以采用数字信号处理(Digital Signal Processing,DSP)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)、可编程逻辑阵列(Programmable LogicArray,PLA)中的至少一种硬件形式来实现。处理器110可集成中央处理器(CentralProcessing Unit,CPU)、图像处理器(Graphics Processing Unit,GPU)、神经网络处理器(Neural-network Processing Unit,NPU)和调制解调器等中的一种或几种的组合。其中,CPU主要处理操作系统、用户界面和应用程序等;GPU用于负责显示屏130所需要显示的内容的渲染和绘制;NPU用于实现人工智能(Artificial Intelligence,AI)功能;调制解调器用于处理无线通信。可以理解的是,上述调制解调器也可以不集成到处理器110中,单独通过一块芯片进行实现。
存储器120可以包括随机存储器(Random Access Memory,RAM),也可以包括只读存储器(Read-Only Memory)。可选地,该存储器120包括非瞬时性计算机可读介质(non-transitory computer-readable storage medium)。存储器120可用于存储指令、程序、代码、代码集或指令集。存储器120可包括存储程序区和存储数据区,其中,存储程序区可存储用于实现操作系统的指令、用于至少一个功能的指令(比如触控功能、声音播放功能、图像播放功能等)、用于实现下述各个方法实施例的指令等;存储数据区可存储根据终端100的使用所创建的数据(比如音频数据、电话本)等。
显示屏130是用于显示用户界面的显示组件。可选的,该显示屏130为具有触控功能的显示屏,通过触控功能,用户可以使用手指、触摸笔等任何适合的物体在显示屏130上进行触控操作。
显示屏130通常设置在终端100的前面板。显示屏130可被设计成为全面屏、曲面屏、异型屏、双面屏或折叠屏。显示屏130还可被设计成为全面屏与曲面屏的结合,异型屏与曲面屏的结合等,本实施例对此不加以限定。
除此之外,本领域技术人员可以理解,上述附图所示出的终端100的结构并不构成对终端100的限定,终端100可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。比如,终端100中还包括麦克风、扬声器、射频电路、输入单元、传感器、音频电路、无线保真(Wireless Fidelity,Wi-Fi)模块、电源、蓝牙模块等部件,在此不再赘述。
请参考图3,其示出了本申请一个示例性实施例所提供的服务器200的结构框图。该服务器200可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上处理器(Central Processing Units,CPU)210和一个或一个以上的存储器220,其中,存储器220用于存储可执行指令,处理器210被配置为执行上述可执行指令,以实现下述各个方法实施例提供的意图识别方法。当然,该服务器还可以具有有线或无线网络接口、键盘以及输入输出接口等部件,以便进行输入输出,该服务器还可以包括其他用于实现设备功能的部件,在此不再赘述。
请参考图4,其示出了本申请一个示例性实施例示出的意图识别方法的流程图。在本申请实施例中,以通过终端100与服务器200之间的数据交互来实现对待识别的文本信息的意图识别为例进行说明。该方法包括:
步骤401:终端获取被输入的语音信号。
其中,该语音信号为使用终端的用户通过终端输入的语音信号。终端中安装有目标应用,该目标应用用于对终端进行语音控制。在一些实施例中,若使用终端的用户想要对终端进行语音控制,则用户可以通过终端在该目标应用中输入语音信号;相应的,终端采集被输入的语音信号。
例如,用户想要通过语音控制终端打开终端的蓝牙,则用户可以输入语音信号,该语音信号所包含的语义信息可以为“打开蓝牙”;再如,用户想要通过语音控制终端调大终端的音量,则用户输入的语音信号所包含的语音信息可以为“声音调到最大”。
在本申请实施例中,在获取到被输入的语音信号之后,终端可以基于该语音信号得到待识别的文本信息,相应的,终端执行步骤402的操作。
步骤402:终端将该语音信号进行文本转换,得到待识别的文本信息。
其中,该待识别的文本信息为待进行意图识别的文本信息。例如,该待识别的文本信息可以为“帮我打开一下电视”。
在本申请实施例中,通过将被输入的语音信号转换成待识别的文本信息,这样能够直接对该文本信息进行意图识别,进而为意图识别操作提供了数据支持。
在一些实施例中,终端可以直接将该语音信号进行文本转换,得到待识别的文本信息,向服务器发送该待识别的文本信息;也即是执行步骤402-步骤403的操作。
在该实施例中,由于直接在终端侧对语音信号进行转换,无需对语音信号进行传输,进而转换效率较高。
在另一些实施例中,终端也可以向服务器发送该语音信号,由服务器对该语音信号进行文本转换,以得到该待识别的文本信息。相应的,步骤402-步骤403的操作可以替换为:终端向服务器发送该被输入的语音信号;步骤404的操作可以为替换为:服务器获取该被输入的语音信号,将该语音信号进行文本转换,得到该待识别的文本信息。
在该实施例中,终端可以直接向服务器发送该语音信号;或者,终端还可以响应于该语音信号的目标参数满足条件,向服务器发送该语音信号。
在一种可能的实现方式中,该目标参数可以为长度参数,则该条件为预设长度,相应的,终端确定该目标参数满足条件的实现方式为:若该语音信号的长度参数大于该预设长度,则终端确定该目标参数满足条件。
在该实现方式中,在语音信号的长度较短时,可能并不包含有意义的语义信息,则终端可以直接进行文本转换;例如,用户在输入语音信号的时候,仅说了“帮我”两字,则表示该语音信号不包含有意义的语义信息,无需进行意图识别。
在另一种可能的实现方式中,该目标参数可以为音量参数,则该条件为预设音量,相应的,终端确定该目标参数满足条件的实现方式为:若该语音信号的长度参数大于该预设音量,则终端确定该目标参数满足条件。
在该实现方式中,在语音信号的音量较小时,终端或者服务器可能并不能对该语音信号进行正常的文本转换,则无需向服务器发送该语音信号,终端可以在显示界面设置提示信息,以提示用户调高音量,重新输入语音信号。
在另一种可能的实现方式中,该目标参数可以为噪音参数,则该条件为预设清晰度,相应的,终端确定该目标参数满足条件的实现方式为:若该语音信号的噪音参数不大于该预设清晰度,则终端确定该目标参数满足条件。
在该实现方式中,在语音信号中的噪音较多时,终端或者服务器可能并不能对该语音信号进行正常的文本转换,则无需向服务器发送该语音信号,终端可以在显示界面设置提示信息,以提示用户重新输入语音信号。
其中,目标参数、预设长度、预设音量、预设清晰度均可以根据需要进行设置和更改,本申请对此不做具体限定。
在该实施例中,由服务器将该语音信号转换为待识别的文本信息,从而减少了终端的转换操作,节省了终端的处理资源。
需要说明的一点是,由于使用终端的用户在通过语音控制终端时,一般输入的语音信号所包含的语义信息较少,也即是本申请实施例中的待识别的文本信息为短文本信息,也即是该文本信息所包含的文字的数量较少。例如,该文本信息的文字数量可以为10、20、30等。
在本申请实施例中,以由终端对该语音信号进行文本转换,得到待识别的文本信息为例进行说明,相应的,终端执行步骤403的操作。
步骤403:终端向服务器发送该待识别的文本信息。
在一些实施例中,终端直接向服务器发送该待识别的文本信息,以节省了信息发送所需的时间,提高发送效率。
在另一些实施例中,终端也可以将该待识别的文本信息进行加密,得到加密后的文本信息,向服务器发送该加密后的文本信息,以提高数据传输的安全性。
步骤404:服务器接收该待识别的文本信息。
其中,若该文本信息未加密,则服务器直接接收该文本信息;若该文本信息为加密后的文本信息,则服务器对该文本信息进行解密,得到解密后的文本信息,将该解密后的文本信息作为待识别的文本信息。
需要说明的一点是,在本申请实施例中,该待识别的文本信息除了可以为对语音信号进行文本转换得到的文本信息之外,还可以为直接输入的文本信息。也即是,该文本信息为使用终端的用户通过终端直接输入的文本信息。
相应的,步骤401-步骤403的操作可以替换为:终端获取被输入的文本信息,将该文本信息作为待识别的文本信息,以及向服务器发送该待识别的文本信息。
例如,使用终端的用户想要通过终端查询明天的天气,则用户可以在终端中输入“明天的天气怎么样”,则该待识别的文本信息为“明天的天气怎么样”。
在本申请实施例中,在得到该文本信息之后,服务器执行步骤405的操作,获取该文本信息中的实体信息。
步骤405:服务器获取该文本信息的实体信息。
其中,该实体信息包括该文本信息中的至少一个实体。实体为文本的基本单位,也即是该实体信息能够表示该文本信息所包含的语义信息。
例如,该文本信息为“电饭煲设置成煮饭模式”,其中,“电饭煲”、“煮饭模式”均为实体;再如,该文本信息为“给我打开一下日历”,其中,“日历”为实体。
在一些实施例中,服务器预先设置有多个实体信息。服务器可以基于该多个实体信息来获取该文本信息的实体信息,相应的,该步骤的实现方式包括以下步骤(1)-(3):
(1)对于预设的多个实体信息中的任一实体信息,服务器基于该任一实体信息对应的垂直领域知识库,对该文本信息进行领域识别。
其中,该垂直领域知识库中存在多个实体信息。在该实施例中,服务器预先设置有多个垂直领域知识库。每个垂直领域知识库中的多个实体信息组成该预设的多个实体信息。
在一种可能的实现方式中,该垂直领域知识库包括第一词库,该第一词库包括属于同一垂直领域的至少一个实体信息。相应的,步骤(1)的实现方式可以为:若该文本信息中包含该第一词库中的任一实体信息,服务器确定该文本信息属于该垂直领域。
在该实现方式中,服务器确定该文本信息包含该第一词库中的任一实体信息的实现方式可以为:服务器通过预设的匹配算法,将该文本信息与该第一词库中的每个实体信息进行匹配,若该第一词库中存在与该文本信息匹配的实体信息,则确定该文本信息包含该第一词库中的实体信息;否则,则确定该文本信息不包含该第一词库中的任一实体信息。
其中,服务器预先设置有匹配算法,在一种可能的实现方式中,该匹配算法可以为多模匹配算法;例如该匹配算法可以为Aho-Corasick自动机(一种字符串搜索算法)。
在该实现方式中,对于预先设置了包含属于同一垂直领域的至少一个实体信息的第一词库,因此,可以通过该第一词库中的实体信息对该文本信息进行判断,从而能够确定该文本信息是否属于该垂直领域,领域识别的准确性较高。
在另一种可能的实现方式中,该垂直领域知识库还包括第二词库,该第二词库包括不属于同一垂直领域的至少一个实体信息;相应的,步骤(1)的实现方式可以为:若该文本信息中包含该第二词库中的任一实体信息,则服务器确定该文本信息不属于该垂直领域。
在该实现方式中,对于任一垂直领域,该第二词库中的实体信息也即是该垂直领域的域外的实体信息。相应的,对于任一垂直领域,服务器可以基于历史文本信息,生成该垂直领域。
其中,该历史文本信息为服务器历史识别过的文本信息,该文本信息为除该垂直领域以外的其他垂直领域对应的文本信息。相应的,服务器可以将识别过的文本信息存储下来,以为后续生成第二词库提供数据支持。
在该实现方式中,该历史文本信息的数量较多,相应的,服务器从多个历史文本信息的实体信息中,确定使用频率高于第一预设频率的至少一个实体信息,将该至少一个实体信息组成该第二词库。
其中,该第一预设频率可以根据需要进行设置和更改,本申请对此不作具体限定。
在该实现方式中,通过基于包含至少一个高频域外的实体信息的第二词库,来对该文本信息进行领域识别,只要该文本信息包含该第二词库中的任一实体信息,则表明该文本信息不属于该垂直领域,从而能够快速对该文本信息所属的垂直领域做一个判断,领域识别的效率较高。
需要说明的一点是,服务器可以通过以上任一种实现方式或者结合上述两种实现方式来对该文本信息进行领域识别,本申请对此不作具体限定。
在本申请实施例中,对于任一垂直领域,通过基于该垂直领域对应的实体信息或者不属于该垂直领域的实体信息,来对该文本信息进行领域识别,一方面能够快速对该文本信息所属的领域进行判断,领域识别的效率较高;另一方面,对于不属于该垂直领域的文本信息,则无需执行后续的操作,从而节省了服务器的处理资源。
在本申请实施例中,服务器中设置有多个垂直领域,例如,该垂直领域可以为:音乐领域、生活领域或者智能家居领域等。
(2)若该文本信息属于该任一实体信息所属的垂直领域,则服务器确定该任一实体信息为该文本信息的实体信息。
例如,该实体信息为“空调”,该实体信息所属的垂直领域为“智能家居领域”,该文本信息为“打开空调”,则该文本信息的实体信息为“空调”。
(3)若该文本信息不属于该实体信息所属的垂直领域,服务器继续基于下一个实体信息对应的垂直领域知识库,对该文本信息进行领域识别,直到确定出该文本信息的实体信息为止。
例如,参见图5,服务器中存在多个垂直领域,该多个垂直领域分别为垂直领域1、垂直领域2、垂直领域3……垂直领域n,服务器将该待识别的文本信息分发给每个垂直领域,对于每个垂直领域,若该文本信息与该垂直领域匹配,则基于该垂直领域继续对该文本信息进行处理,也即是“召回”;若该文本信息与该垂直领域不匹配,则停止该文本信息的处理,也即是“拒绝”。
在本申请实施例中,服务器可以通过意图识别模型对该待识别的文本信息进行意图识别。相应的,服务器将该待识别的文本信息输入到该意图识别模型中,输出得到该文本信息的意图信息。
其中,该意图识别模型至少包括先验层,该先验层也即是服务器预先设置的多个垂直领域。
在本申请实施例中,通过垂直领域对应的每个实体信息,对文本信息进行匹配,也即是将该垂直领域作为对文本信息进行识别的先验层,对该文本信息进行一个初步的筛选,以节省计算资源。
在一些实施例中,对于任一垂直领域,若待识别的文本信息属于该垂直领域,则服务器可以先基于该垂直领域的匹配函数,对该文本信息进行进一步的匹配,再确定该文本信息的目标句式类别,也即是执行步骤406-步骤407的操作。
在另一些实施例中,对于任一垂直领域,若待识别的文本信息属于该垂直领域,则服务器直接执行步骤407的操作,此时,步骤407的操作可以替换为:服务器基于预设的多个句式类别,对该文本信息进行句式匹配,得到目标句式类别。
在本申请实施例中,以服务器执行步骤406-步骤407的操作为例进行说明。
步骤406:服务器确定该文本信息与目标匹配函数的匹配信息,该目标匹配函数为该实体信息所属的垂直领域对应的匹配函数。
其中,对于每个垂直领域,服务器预先设置有相应的至少一个匹配函数。这样,服务器能够在确定该文本信息所属的垂直领域之后,直接基于该垂直领域中的至少一个匹配函数,对该文本信息进行处理。在一种可能的实现方式中,该匹配函数可以为正则表达式。
在一些实施例中,若该匹配信息表示该文本信息与该目标匹配函数匹配,则服务器基于该目标匹配函数,从该文本信息中提取该文本信息对应的意图信息。
其中,若该文本信息与该目标匹配函数匹配,则表示该文本信息为该垂直领域对应的历史文本信息中的高频文本信息,则服务器将该目标匹配函数中与该文本信息匹配的意图信息提取出来,将该意图信息作为该文本信息的意图信息。
其中,该文本信息的意图信息至少包括操作信息和垂直领域。该操作信息用于表示终端待执行的操作。
例如,该文本信息为“帮我把空调关了”,其实体信息为“空调”,则垂直领域可以为“空调”所属的垂直领域,例如智能家居垂直领域,该操作信息为“关闭”,也即是该意图信息为“关闭空调”。
在另一些实施例中,若该匹配信息表示该文本信息与该目标匹配函数不匹配,则服务器继续执行步骤407的操作。
在本申请实施例中,由于每个垂直领域中的文本信息具有头部效应,也即是该待识别的文本信息为历史识别过的文本信息的概率较高,因此,服务器生成该垂直领域对应的匹配函数的实现方式可以为:服务器从历史文本信息中,确定使用频率高于第二预设频率的至少一个文本信息,基于该至少一个文本信息,生成该垂直领域对应的匹配函数。
其中,该第二预设频率可以根据需要进行设置和更改,本申请对此不作具体限定。
需要说明的一点是,由于每个垂直领域中包含至少一个匹配函数,则服务器可以将该文本信息与该至少一个匹配函数分别匹配,得到每个匹配函数对应的匹配信息。
在本申请实施例中,意图识别模型还包括正则层,相应的,服务器将垂直领域中的至少一个匹配函数作为正则层,对该文本信息进行处理。例如,参见图6,对于任一垂直领域,若该待识别的文本信息包含第一词库中的任一实体信息,即为“命中”,则基于正则层对该待识别的文本信息进行处理;否则,即为“未命中”,则停止对该文本信息的处理;若该待识别的文本信息包含第二词库中的任一实体信息,即为“命中”,则停止对该文本信息的处理。
参见图7,若该文本信息与该垂直领域中的任一匹配函数匹配,即为“命中”,则确定该意图信息;否则,即为“未命中”,则对该文本进行句式匹配。
在本申请实施例中,对于属于该垂直领域的文本信息,先确定该文本信息是否与该垂直领域中的匹配函数匹配,若匹配,则可以快速对该文本信息进行意图识别,得到该文本信息的意图信息,从而无需再对该文本信息进行句式匹配,进而节省了意图识别的时间,提高了意图识别的效率。
步骤407:若该匹配信息表示该文本信息与该目标匹配函数不匹配,则服务器基于预设的多个句式类别,对该文本信息进行句式匹配,得到目标句式类别。
其中,若该文本信息与该目标匹配函数不匹配,则表示该文本信息并非历史文本信息中的高频文本信息,则服务器需要对该文本信息进行句式匹配,以获取该文本信息的目标句式类别。
其中,该句式类别可以为该文本信息中的谓语的对应的语义信息。例如,该句式类别可以为“打开句式”、“关闭句式”、“充值句式”等。
在本申请实施例中,使用终端的用户在输入语音信号时,通常会输入一句话,则这句话的内容即为该文本信息。由于每个用户说话方式可能不同,则表示同一语义信息的谓语可能不同;例如,文本信息“播放音乐A”中的“播放”和文本信息“放一首歌”中的“放”均表示“播放”的含义,也即这两个文本信息的句式类别均为:播放句式。
在一些实施例中,由于服务器需要识别的文本信息的数量可能比较多,则服务器可以通过句式匹配模型对该文本信息进行句式匹配,以提高识别速度。其中,该句式匹配模型的输入信息为待识别的文本信息,该句式匹配模型输出信息为该文本信息的句式类别,也即是该目标句式类别。
该句式匹配模型可以根据需要进行设置和更改,本申请对此不作具体限定。在一种可能的实现方式中,该句式匹配模型可以为深度学习网络模型;例如,该句式匹配模型可以为FastText(一种快速文本分类器)或者文本卷积神经网络(Text ConvolutionalNeural Networks,TextCNN)模型。
在该实施例中,由于句式匹配模型只需关注该文本信息的原始语义,则服务器在训练该句式匹配模型的过程中,可以对每个垂直领域的多个句式类别进行标注,得到每个句式类别的标签。相应的,服务器通过句式匹配模型对该文本信息进行句式匹配的实现方式可以为:服务器通过该句式匹配模型对每个待识别的文本信息进行标签标注,得到该文本信息的句式类别。
例如,对于下述多个文本信息,对其进行标签(label)的结果为:
文本信息1:给我打开一下日历[实体:日历],label:打开句式;
文本信息2:你帮我把通话记录打开[实体:通话记录],label:打开句式;
文本信息3:关掉空调吧[实体:空调],label:关闭句式;
文本信息4:退出相册[实体:相册],label:关闭句式。
在本申请实施例中,意图识别模型还包括模型层。服务器先通过先验层和正则层对该文本信息进行处理,对于任一垂直领域,先将不属于该垂直领域的文本信息拒绝,对于属于该垂直领域的高频文本信息,则通过正则层进行处理;若该文本信息属于历史文本信息中的中低频文本信息,则通过模型层来进行处理,也即是由具有强大泛化能力的句式匹配模型来处理。
在本申请实施例中,通过将对大量的待识别的文本信息的意图划分转化为对少量的句式类别的划分,从而可以显著减少意图识别过程中的标签的数量,使得对应不同意图信息的文本信息之间的语义边界更加清晰。
在本申请实施例中,服务器预先设置有多个句式类别。在一种可能的实现方式中,对于任一垂直领域,即使该垂直领域对应的意图信息较多,且随着终端能够执行的任务数量增加,意图信息也增加,但属于同一垂直领域的文本信息的句式可能相同,且语法规则变化不大,则对于每个垂直领域,服务器可以对该垂直领域的历史文本信息进行句式类别的识别,得到多个句式类别,存储该多个句式类别。
步骤408:服务器确定该实体信息所属的垂直领域。
其中,由于待识别的文本信息中的实体信息可以表示该待识别的文本信息所属的垂直领域,则服务器可以执行步骤408的操作,确定该实体信息所属的垂直领域。在一种可能的实现方式中,对于每个垂直领域,服务器在步骤405中已确定该文本信息是否属于垂直领域,则在该步骤408中,服务器直接将当前的垂直领域确定为该实体信息所属的垂直领域。
在本申请实施例中,由于意图信息至少包括垂直领域和操作信息,相应的,服务器执行步骤408的操作,确定该操作信息。
步骤409:服务器将该目标句式类别映射为该文本信息对应的操作信息。
其中,该操作信息用于表示终端待执行的操作;该终端为待识别的文本信息对应的终端。
在一些实施例中,服务器预先设置了句式类别与操作信息之间的映射关系,相应的,在得到该目标句式类别之后,服务器从句式类别与操作信息之间的映射关系中,确定该目标句式类别对应的操作信息,将该操作信息作为该文本信息对应的操作信息。
例如,服务器中预先设置的句式类别与操作信息之间的映射关系可以为:句式类别“打开句式”对应操作信息“打开”;句式类别“关闭句式”对应操作信息“关闭”。则若该目标句式类别为“打开句式”,则服务器确定该操作信息为“打开”;若该目标句式类别为“关闭句式”,则服务器确定该操作信息为“关闭”。
步骤410:服务器基于该垂直领域和该操作信息,确定意图信息。
其中,该意图信息用于表示终端待执行的任务。在一些实施例中,待识别的文本信息的实体信息中所包含的实体的数量为一个;该实体能够表示该文本信息所属的垂直领域,则该意图信息包括该垂直领域和该操作信息;相应的,该步骤的实现方式可以为:服务器生成包含该垂直领域和该操作信息的意图信息。
例如,该垂直领域为“音乐”,该操作信息为“播放”,则该意图信息为“播放音乐”。
在另一些实施例中,待识别的文本信息的实体信息中所包含的实体的数量为多个。在该实施例中,该实体信息中还包括能够表示该垂直领域中的任一页面的实体,则该意图信息除包括该垂直领域和该操作信息外,还可以包括其他信息;该其他信息可以为页面信息。相应的,该步骤的实现方式可以为:服务器基于该实体信息,获取该垂直领域的页面信息,生成包含该垂直领域、该页面信息和该操作信息的意图信息。
在该实现方式中,若该垂直领域对应任一应用程序,则该实体对应该应用程序中的任一页面,则服务器可以根据该实体对应的页面确定该页面信息。
其中,由于该实体信息包括多个实体,则服务器生成的意图信息的数量为多个。对于多个意图信息,服务器确定每个意图信息的优先级。在一种可能的实现方式中,服务器确定意图信息的优先级的规则可以为:包括越多实体信息的意图信息的优先级越高。则在该实现方式中,服务器将优先级最高的意图信息作为该文本信息的意图信息。
例如,以终端中安装有用于记录运动信息的运动应用,用户想要查看该运动信息为例进行说明,该运动应用为应用A,该运动信息可以为步数排名,则该待识别的文本信息可以为“打开应用A的步数排名”,则服务器确定该文本信息的实体信息为“应用A”、“步数排名”,则“步数排名”能够表示页面信息为“步数排名页面”,则确定出的意图信息可以为意图1“打开应用A”和意图2“打开应用A的步数排名页面”,其中意图2的优先级高于意图1的优先级,则服务器将意图2作为该文本信息的意图信息。
在本申请实施例中,通过将该垂直领域和该操作信息生成意图信息,或者,通过将该垂直领域、页面信息和该操作信息生成意图信息,从而实现了对待识别的文本信息的意图识别,为后续执行该意图信息对应的任务提供了数据支持。
在本申请实施例中,意图识别模型还包括映射层。该映射层的输入为该文本信息的实体信息、目标句式类别和操作信息,输出为该文本信息的意图信息。也即,服务器通过映射层来实现步骤408-步骤410的操作。
例如,参见图8,对于待识别的文本信息,先通过先验层进行实体信息的获取和领域识别,再通过正则层匹配,若匹配,则确定意图信息;若不匹配,则通过模型层进行句式匹配,最后将得到的信息输入映射层,得到该文本信息的意图信息。在本申请实施例中,在得到该文本信息的意图信息之后,终端可以根据该意图信息执行相应的任务,则在执行完步骤410之后,服务器继续执行步骤411。
步骤411:服务器向终端发送该意图信息。
在一些实施例中,服务器直接向终端发送该意图信息,以节省了信息发送所需的时间,提高发送效率。
在另一些实施例中,服务器也可以将该意图信息进行加密,得到加密后的意图信息,向终端发送该加密后的意图信息,以提高数据传输的安全性。
步骤412:终端接收该意图信息。
其中,若该意图信息未加密,则终端直接接收该意图信息;若该意图信息为加密后的意图信息,则终端对该意图信息进行解密,得到解密后的意图信息,将该解密后的意图信息作为待执行的意图信息。
需要说明的一点是,终端在得到被识别的文本信息之后,可以通过上述步骤403-步骤412的操作,借助于服务器获取该意图信息;或者,终端也可以自己来基于该被识别的文本信息获取该意图信息。其中,终端获取该意图信息的实现方式与服务器获取该意图信息的实现方式相似,在此不再赘述。
步骤413:终端生成该意图信息对应的控制指令,执行该控制指令对应的任务。
例如,以终端对智能家居设备进行控制为例说明,该智能家居设备为空调,该意图信息为“关闭空调”,则终端生成用于关闭空调的控制指令,终端通过与智能家居设备之间的通信连接,控制空调关闭。
在本申请实施例中,对于包含不同意图的文本信息,其句式可能相似,则通过基于预设的多个句式类别,对待识别的文本信息进行句式匹配,能够得到相应的句式类别,从而实现了将对文本内容的识别转变为对句式的识别,再通过对该文本信息的句式类别和实体信息进行意图映射,能够得到该文本信息的意图信息,这样,降低了识别的难度,进而提高了意图识别的效率。
在本申请实施例中,服务器生成待识别的文本信息的意图信息的实现方式包括以下几种情况。
第一种情况,服务器可以直接生成包含操作信息和垂直领域的意图信息,也即是图4示出的实施例中的步骤406的操作。
第二种情况,该意图信息还可以包括槽位信息或者参考信息中的至少一项,相应的,请参考图9,其示出了本申请一个示例性实施例示出的意图信息的生成方法的流程图。在本申请实施例中,以意图信息还包括槽位信息或者参考信息中的至少一项进行说明。该方法包括:
步骤901:服务器获取待识别的文本信息的垂直领域和操作信息。
其中,该步骤的实现方式与步骤401-步骤409的实现方式相似,在此不再赘述。
需要说明的一点是,服务器生成该意图信息的实现方式包括以下几种情况:
第一种情况,服务器执行步骤902和步骤904的操作,获取该文本信息的槽位信息,进而生成包含该槽位信息、该操作信息和该垂直领域的意图信息。
第二种情况,服务器执行步骤903-步骤904的操作,获取该文本信息的参考信息,进而生成包含该参考信息、该操作信息和该垂直领域的意图信息。
第三种情况,服务器执行步骤902-步骤904的操作,获取该文本信息的参考信息和槽位信息,进而生成包含该槽位信息、该参考信息、该操作信息和该垂直领域的意图信息。
需要说明的另一点是,服务器可以同时执行步骤901、步骤902、步骤903的操作,也可以依次执行步骤901-步骤903的操作,本申请对此不作具体限定。
在本申请实施例中,以第三种情况为例进行说明。
步骤902:服务器获取该文本信息的槽位信息。
其中,该槽位信息用于表示该文本信息的操作信息的辅助信息。该槽位信息所包含的信息类型可以根据需要进行设置和更改,本申请对此不作具体限定;例如,该槽位信息可以包括时间、地点、用户备注、内容、金额等中的一种或多种信息。
在一些实施例中,服务器通过对该文本信息进行标注槽位标签的方式,实现槽位信息的获取。相应的,服务器获取该文本信息的槽位信息的实现方式可以为:服务器通过序列标注的方式对该文本信息进行槽位标签的标注,得到该文本信息的槽位信息。
其中,服务器可以通过槽位提取模型进行序列标注。
其中,该槽位提取模型为服务器预先训练好的模型。该槽位提取模型可以根据需要进行设置和更改,本申请对此不作具体限定;例如,该深度学习模型可以为结合了长短期记忆(Long Short-Term Memory,LSTM)神经网络模型和条件随机场(Conditional RandomField,CRF)模型的BI-LSTM+CRF模型。
在该步骤中,由于服务器需要对该文本信息进行逐字识别,因此,执行槽位提取操作所需的时间较长。并且,由于并非每个待识别的文本信息均具有槽位信息,则服务器在执行步骤901之前,可以先基于该文本信息中的目标关键词对该文本信息进行判断,相应的,在获取该文本信息的槽位信息之前,本申请提供的意图识别方法还包括以下步骤:
服务器获取该文本信息中的目标关键词,该目标关键词包含目标类型的操作信息;若该目标关键词在关键词库中,则服务器执行步骤902的操作,该关键词库中包括不同类型的操作信息对应的多个关键词;若该目标关键词不在关键词库中,则服务器执行步骤906的操作。
其中,由于操作信息的类型较多,而对于一些目标类型的操作信息,需要获取槽位信息才能得到完整的意图信息,相应的,服务器将符合该目标类型的操作信息作为目标关键词。
例如,该目标类型可以根据需要进行设置和更改,例如,该目标类型为充值类型、消息发送类型、档位控制类型等类型;该目标关键词可以为“充值”、“发送”、“设置”等。
其中,对于每个垂直领域,服务器预先设置有关键词库。该至少一个关键词可以为该垂直领域中的高频关键词;相应的,服务器设置该关键词库的实现方式可以为:服务器该垂直领域对应的历史文本信息中获取使用频率高于第三预设频率的至少一个关键词,将该至少一个关键词组成该关键词库。
其中,该第三预设频率可以根据需要进行设置和更改,第三预设频率分别与第一预设频率或者该第二预设频率相同或者不同,本申请对此不作具体限定。
在本申请实施例中,通过在进行槽位提取之前,设置一个判断条件,使得无需进行槽位提取的文本信息能够快速进入下一个信息的获取,进而能够提高槽位提取操作的精度。
步骤903:服务器获取该文本信息的特征信息,确定特征信息匹配的参考信息。
其中,该特征信息可以包括场景信息、用户个人信息、终端当前的状态信息等。该特征信息所包含的内容可以根据需要进行设置和更改。
在一些实施例中,服务器借助于终端获取该特征信息;相应的,服务器获取该文本信息的特征信息的实现方式可以为:终端在得到用户的语音信号之后,获取该特征信息,将该特征信息与该语音信号一起发送至服务器;或者终端在得到用户的语音信号之后,将该语音信号转换成待识别的文本信息以及获取该特征信息,将该文本信息与该特征信息一起发送至服务器;相应的,服务器接收该特征信息和文本信息。
在该步骤中,服务器可以通过特征工程确定该特征信息匹配的参考信息。其中,服务器可以事先存储特征信息与参考信息之间的匹配关系,相应的,在获取到该特征信息之后,从该匹配关系中确定匹配的参考信息。
例如,以文本信息为“播放音乐”,特征信息为终端当前显示的界面类型为例进行说明;其中,终端中存在多个界面类型:终端的主界面、音乐应用的主界面,分别对应的参考信息为:1、2,若该特征信息为终端的主界面,则服务器确定该参考信息为1。
步骤904:服务器生成包含该槽位信息、该参考信息、该操作信息和该垂直领域的意图信息。
参见图10,对于待识别的文本信息,服务器分别通过模型层中的句式识别模型、槽位提取模型和特征工程模块对该文本信息进行处理,得到该文本信息的槽位信息、参考信息和操作信息。
例如,若当前终端展示的界面为音乐应用A的主界面,对于文本信息“播放音乐起风了”,实体信息为“音乐”,句式类别为“播放句式”,操作信息为“播放”,槽位信息为“起风了”,特征信息为“音乐应用A的主界面”,若该特征信息对应的参考信息为“2”,则生成的意图信息为:在音乐应用A中播放音乐起风了。
再如,若当前终端展示的界面为社交应用B的主界面,对于文本信息“发消息好的给张三”,实体信息为消息,句式类别为“发送句式”,操作信息为“发送”,槽位信息为“好的”和“张三”,特征信息为“社交应用B的主界面”,若该特征信息对应的参考信息为“3”,则生成的意图信息为:在社交应用B中给张三发送消息,消息内容为“好的”。
在本申请实施例中,对于包含不同意图的文本信息,其句式可能相似,则通过基于预设的多个句式类别,对待识别的文本信息进行句式匹配,能够得到相应的句式类别,从而实现了将对文本内容的识别转变为对句式的识别,再通过对该文本信息的句式类别和实体信息进行意图映射,能够得到该文本信息的意图信息,这样,降低了识别的难度,进而提高了意图识别的效率。
请参考图11,其示出了本申请一个示例性实施例所提供的意图识别装置1100的结构框图。该意图识别装置1100可以通过软件、硬件或者两者的结合实现成为处理器110(处理器210)的全部或一部分。该装置1100包括:
信息获取模块1101,用于获取待识别的文本信息和该文本信息的实体信息;
句式匹配模块1102,用于基于预设的多个句式类别,对该文本信息进行句式匹配,得到目标句式类别;
意图映射模块1103,用于将该目标句式类别和该实体信息进行意图映射,得到该文本信息对应的意图信息。
在一种可能的实现方式中,该意图映射模块1103,包括:
第一确定单元,用于确定该实体信息所属的垂直领域;
映射单元,用于将该目标句式类别映射为该文本信息对应的操作信息;
第二确定单元,用于基于该垂直领域和该操作信息,确定该意图信息。
在一种可能的实现方式中,该第二确定单元,用于获取该文本信息的槽位信息,生成包含该槽位信息、该操作信息和该垂直领域的意图信息;或者,
该第二确定单元,用于获取该文本信息的特征信息,确定特征信息匹配的参考信息,生成包含该参考信息、该操作信息和该垂直领域的意图信息。
在一种可能的实现方式中,该装置还包括:
关键词获取模块,用于获取该文本信息中的目标关键词,该目标关键词包含目标类型的操作信息;
该第二确定单元,还用于若该目标关键词在关键词库中,则获取该文本信息的槽位信息,该关键词库中包括不同类型的操作信息对应的多个关键词。
在一种可能的实现方式中,该第二确定单元,用于生成包含该垂直领域和该操作信息的意图信息;或者,
该第二确定单元,用于基于该实体信息,获取该垂直领域的页面信息,生成包含该垂直领域、该页面信息和该操作信息的意图信息。
在一种可能的实现方式中,该信息获取模块1101,用于对于预设的多个实体信息中的任一实体信息,基于该任一实体信息对应的垂直领域知识库,对该文本信息进行领域识别;若该文本信息属于该任一实体信息所属的垂直领域,则确定该任一实体信息为该文本信息的实体信息;若该文本信息不属于该任一实体信息所属的垂直领域,继续基于下一个实体信息对应的垂直领域知识库,对该文本信息进行领域识别,直到确定出该文本信息的实体信息为止。
在一种可能的实现方式中,该垂直领域知识库包括第一词库,该第一词库包括属于该垂直领域的至少一个实体信息;
该信息获取模块1101,用于若该文本信息中包含该第一词库中的任一实体信息,则确定该文本信息属于该垂直领域。
在一种可能的实现方式中,该垂直领域知识库包括第二词库,该第二词库包括不属于该垂直领域的至少一个实体信息;
该信息获取模块1101,用于若该文本信息中包含该第二词库中的任一实体信息,则确定该文本信息不属于该垂直领域。
在一种可能的实现方式中,该装置还包括:
信息确定模块,用于确定该文本信息与目标匹配函数的匹配信息,该目标匹配函数为该实体信息所属的垂直领域对应的匹配函数;
该句式匹配模块1102,还用于若该匹配信息表示该文本信息与该目标匹配函数不匹配,则基于预设的多个句式类别,对该文本信息进行句式匹配,得到目标句式类别。
在一种可能的实现方式中,该装置还包括:
信息提取模块,用于若该匹配信息表示该文本信息与该目标匹配函数匹配,则基于该目标匹配函数,从该文本信息中提取该文本信息对应的意图信息。
在一种可能的实现方式中,该信息获取模块1101,用于获取被输入的语音信号,将该语音信号进行文本转换,得到该文本信息。
在一种可能的实现方式中,该装置还包括:
任务执行模块,用于生成该意图信息对应的控制指令;执行该控制指令对应的任务。
在本申请实施例中,对于包含不同意图的文本信息,其句式可能相似,则通过基于预设的多个句式类别,对待识别的文本信息进行句式匹配,能够得到相应的句式类别,从而实现了将对文本内容的识别转变为对句式的识别,再通过对该文本信息的句式类别和实体信息进行意图映射,能够得到该文本信息的意图信息,这样,降低了识别的难度,进而提高了意图识别的效率。
本申请实施例还提供了一种计算机可读存储介质,该计算机可读存储介质存储有至少一条程序代码,该至少一条程序代码用于被电子设备的处理器执行以实现如上各个实施例示出的意图识别方法。
本申请实施例还提供了一种计算机程序产品,当该计算机程序产品中的程序代码由电子设备的处理器执行时,使得电子设备能够执行如上各个实施例示出的意图识别方法。
本领域技术人员应该可以意识到,在上述一个或多个示例中,本申请实施例所描述的功能可以用硬件、软件、固件或它们的任意组合来实现。当使用软件实现时,可以将这些功能存储在计算机可读介质中或者作为计算机可读介质上的一个或多个程序代码或代码进行传输。计算机可读介质包括计算机存储介质和通信介质,其中通信介质包括便于从一个地方向另一个地方传送计算机程序的任何介质。存储介质可以是通用或专用计算机能够存取的任何可用介质。
以上所述仅为本申请的可选实施例,并不用以限制本申请,凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。
Claims (15)
1.一种意图识别方法,其特征在于,所述方法包括:
获取待识别的文本信息和所述文本信息的实体信息;
基于预设的多个句式类别,对所述文本信息进行句式匹配,得到目标句式类别;
将所述目标句式类别和所述实体信息进行意图映射,得到所述文本信息对应的意图信息。
2.根据权利要求1所述的方法,其特征在于,所述将所述目标句式类别和所述实体信息进行意图映射,得到所述文本信息对应的意图信息,包括:
确定所述实体信息所属的垂直领域;
将所述目标句式类别映射为所述文本信息对应的操作信息;
基于所述垂直领域和所述操作信息,确定所述意图信息。
3.根据权利要求2所述的方法,其特征在于,所述基于所述垂直领域和所述操作信息,确定所述意图信息,包括以下至少一种实现方式:
获取所述文本信息的槽位信息,生成包含所述槽位信息、所述操作信息和所述垂直领域的意图信息;或者,
获取所述文本信息的特征信息,确定特征信息匹配的参考信息,生成包含所述参考信息、所述操作信息和所述垂直领域的意图信息。
4.根据权利要求3所述的方法,其特征在于,所述获取所述文本信息的槽位信息之前,所述方法还包括:
获取所述文本信息中的目标关键词,所述目标关键词包含目标类型的操作信息;
若所述目标关键词在关键词库中,则执行所述获取所述文本信息的槽位信息的步骤,所述关键词库中包括不同类型的操作信息对应的多个关键词。
5.根据权利要求2所述的方法,其特征在于,所述基于所述垂直领域和所述操作信息,确定所述意图信息,包括:
生成包含所述垂直领域和所述操作信息的意图信息;或者,
基于所述实体信息,获取所述垂直领域的页面信息,生成包含所述垂直领域、所述页面信息和所述操作信息的意图信息。
6.根据权利要求1所述的方法,其特征在于,所述文本信息的实体信息的获取过程,包括:
对于预设的多个实体信息中的任一实体信息,基于所述任一实体信息对应的垂直领域知识库,对所述文本信息进行领域识别;
若所述文本信息属于所述任一实体信息所属的垂直领域,则确定所述任一实体信息为所述文本信息的实体信息;
若所述文本信息不属于所述任一实体信息所属的垂直领域,继续基于下一个实体信息对应的垂直领域知识库,对所述文本信息进行领域识别,直到确定出所述文本信息的实体信息为止。
7.根据权利要求6所述的方法,其特征在于,所述垂直领域知识库包括第一词库,所述第一词库包括属于所述垂直领域的至少一个实体信息;
所述基于所述实体信息对应的垂直领域知识库,对所述文本信息进行领域识别,包括:
若所述文本信息中包含所述第一词库中的任一实体信息,则确定所述文本信息属于所述垂直领域。
8.根据权利要求6所述的方法,其特征在于,所述垂直领域知识库还包括第二词库,所述第二词库包括不属于所述垂直领域的至少一个实体信息;
所述基于所述实体信息对应的垂直领域知识库,对所述文本信息进行领域识别,包括:
若所述文本信息中包含所述第二词库中的任一实体信息,则确定所述文本信息不属于所述垂直领域。
9.根据权利要求1所述的方法,其特征在于,所述基于预设的多个句式类别,对所述文本信息进行句式匹配,得到目标句式类别之前,所述方法还包括:
确定所述文本信息与目标匹配函数的匹配信息,所述目标匹配函数为所述实体信息所属的垂直领域对应的匹配函数;
若所述匹配信息表示所述文本信息与所述目标匹配函数不匹配,则执行所述基于预设的多个句式类别,对所述文本信息进行句式匹配,得到目标句式类别的步骤。
10.根据权利要求9所述的方法,其特征在于,所述方法还包括:
若所述匹配信息表示所述文本信息与所述目标匹配函数匹配,则基于所述目标匹配函数,从所述文本信息中提取所述文本信息对应的意图信息。
11.根据权利要求1所述的方法,其特征在于,所述获取待识别的文本信息,的过程包括:
获取被输入的语音信号,将所述语音信号进行文本转换,得到所述文本信息。
12.根据权利要求1所述的方法,其特征在于,所述将所述目标句式类别和所述实体信息进行意图映射,得到所述文本信息对应的意图信息之后,所述方法还包括:
生成所述意图信息对应的控制指令;
执行所述控制指令对应的任务。
13.一种意图识别装置,其特征在于,所述装置包括:
信息获取模块,用于获取待识别的文本信息和所述文本信息的实体信息;
句式匹配模块,用于基于预设的多个句式类别,对所述文本信息进行句式匹配,得到目标句式类别;
意图映射模块,用于将所述目标句式类别和所述实体信息进行意图映射,得到所述文本信息对应的意图信息。
14.一种电子设备,其特征在于,所述电子设备包括处理器和存储器;所述存储器存储有至少一条程序代码,所述至少一条程序代码用于被所述处理器执行以实现如权利要求1至12任一所述的意图识别方法。
15.一种计算机可读存储介质,其特征在于,所述存储介质存储有至少一条程序代码,所述至少一条程序代码用于被处理器执行以实现如权利要求1至12任一所述的意图识别方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110335152.7A CN113076397A (zh) | 2021-03-29 | 2021-03-29 | 意图识别方法、装置、电子设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110335152.7A CN113076397A (zh) | 2021-03-29 | 2021-03-29 | 意图识别方法、装置、电子设备及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113076397A true CN113076397A (zh) | 2021-07-06 |
Family
ID=76611138
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110335152.7A Pending CN113076397A (zh) | 2021-03-29 | 2021-03-29 | 意图识别方法、装置、电子设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113076397A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113536788A (zh) * | 2021-07-28 | 2021-10-22 | 平安科技(深圳)有限公司 | 信息处理方法、装置、存储介质及设备 |
CN117454885A (zh) * | 2023-10-30 | 2024-01-26 | 赛力斯汽车有限公司 | 一种语音文本的意图识别方法、装置及存储介质 |
Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103945044A (zh) * | 2013-01-22 | 2014-07-23 | 中兴通讯股份有限公司 | 一种信息处理方法和移动终端 |
CN105895090A (zh) * | 2016-03-30 | 2016-08-24 | 乐视控股(北京)有限公司 | 语音信号处理方法及装置 |
CN110232921A (zh) * | 2019-06-21 | 2019-09-13 | 深圳市酷开网络科技有限公司 | 基于生活服务的语音操作方法、装置、智能电视及系统 |
CN110457566A (zh) * | 2019-08-15 | 2019-11-15 | 腾讯科技(武汉)有限公司 | 信息筛选方法、装置、电子设备及存储介质 |
CN110543633A (zh) * | 2019-08-29 | 2019-12-06 | 腾讯科技(深圳)有限公司 | 语句意图识别方法、装置 |
CN111178081A (zh) * | 2018-11-09 | 2020-05-19 | 中移(杭州)信息技术有限公司 | 语义识别的方法、服务器、电子设备及计算机存储介质 |
CN111968640A (zh) * | 2020-08-17 | 2020-11-20 | 北京小米松果电子有限公司 | 语音控制方法、装置、电子设备及存储介质 |
CN112100391A (zh) * | 2019-05-31 | 2020-12-18 | 阿里巴巴集团控股有限公司 | 用户意图识别方法、装置、服务端、客户端及终端设备 |
US20210065682A1 (en) * | 2019-09-03 | 2021-03-04 | Beijing Dajia Internet Information Technology Co., Ltd. | Human-computer interaction method, and electronic device and storage medium thereof |
CN112527955A (zh) * | 2020-12-04 | 2021-03-19 | 广州橙行智动汽车科技有限公司 | 一种数据处理的方法和装置 |
CN112562658A (zh) * | 2020-12-04 | 2021-03-26 | 广州橙行智动汽车科技有限公司 | 一种填槽方法和装置 |
-
2021
- 2021-03-29 CN CN202110335152.7A patent/CN113076397A/zh active Pending
Patent Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103945044A (zh) * | 2013-01-22 | 2014-07-23 | 中兴通讯股份有限公司 | 一种信息处理方法和移动终端 |
CN105895090A (zh) * | 2016-03-30 | 2016-08-24 | 乐视控股(北京)有限公司 | 语音信号处理方法及装置 |
CN111178081A (zh) * | 2018-11-09 | 2020-05-19 | 中移(杭州)信息技术有限公司 | 语义识别的方法、服务器、电子设备及计算机存储介质 |
CN112100391A (zh) * | 2019-05-31 | 2020-12-18 | 阿里巴巴集团控股有限公司 | 用户意图识别方法、装置、服务端、客户端及终端设备 |
CN110232921A (zh) * | 2019-06-21 | 2019-09-13 | 深圳市酷开网络科技有限公司 | 基于生活服务的语音操作方法、装置、智能电视及系统 |
CN110457566A (zh) * | 2019-08-15 | 2019-11-15 | 腾讯科技(武汉)有限公司 | 信息筛选方法、装置、电子设备及存储介质 |
CN110543633A (zh) * | 2019-08-29 | 2019-12-06 | 腾讯科技(深圳)有限公司 | 语句意图识别方法、装置 |
US20210065682A1 (en) * | 2019-09-03 | 2021-03-04 | Beijing Dajia Internet Information Technology Co., Ltd. | Human-computer interaction method, and electronic device and storage medium thereof |
CN111968640A (zh) * | 2020-08-17 | 2020-11-20 | 北京小米松果电子有限公司 | 语音控制方法、装置、电子设备及存储介质 |
CN112527955A (zh) * | 2020-12-04 | 2021-03-19 | 广州橙行智动汽车科技有限公司 | 一种数据处理的方法和装置 |
CN112562658A (zh) * | 2020-12-04 | 2021-03-26 | 广州橙行智动汽车科技有限公司 | 一种填槽方法和装置 |
Non-Patent Citations (3)
Title |
---|
冀付军等: "人工智能概论", 30 September 2020, 首都经济贸易出版社, pages: 189 - 190 * |
朱晨光著: "机器阅读理解", 31 March 2020, 机械工业出版社, pages: 181 - 182 * |
贾熹滨;李让;胡长建;陈军成;: "智能对话系统研究综述", 北京工业大学学报, no. 09 * |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113536788A (zh) * | 2021-07-28 | 2021-10-22 | 平安科技(深圳)有限公司 | 信息处理方法、装置、存储介质及设备 |
CN113536788B (zh) * | 2021-07-28 | 2023-12-05 | 平安科技(上海)有限公司 | 信息处理方法、装置、存储介质及设备 |
CN117454885A (zh) * | 2023-10-30 | 2024-01-26 | 赛力斯汽车有限公司 | 一种语音文本的意图识别方法、装置及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10733983B2 (en) | Parameter collection and automatic dialog generation in dialog systems | |
CN111261144B (zh) | 一种语音识别的方法、装置、终端以及存储介质 | |
US9865264B2 (en) | Selective speech recognition for chat and digital personal assistant systems | |
US11455989B2 (en) | Electronic apparatus for processing user utterance and controlling method thereof | |
US20190221208A1 (en) | Method, user interface, and device for audio-based emoji input | |
US20190318737A1 (en) | Dynamic gazetteers for personalized entity recognition | |
CN110459222A (zh) | 语音控制方法、语音控制装置及终端设备 | |
CN111737444A (zh) | 对话生成方法、装置及电子设备 | |
CN112735418B (zh) | 一种语音交互的处理方法、装置、终端及存储介质 | |
EP3790002B1 (en) | System and method for modifying speech recognition result | |
CN107155121B (zh) | 语音控制文本的显示方法及装置 | |
CN111312233A (zh) | 一种语音数据的识别方法、装置及系统 | |
CN109754808B (zh) | 语音转换文字的方法、装置、计算机设备及存储介质 | |
CN113076397A (zh) | 意图识别方法、装置、电子设备及存储介质 | |
CN112669842A (zh) | 人机对话控制方法、装置、计算机设备及存储介质 | |
CN112579031A (zh) | 一种语音交互的方法、系统和电子设备 | |
CN110085217A (zh) | 语音导航方法、装置及终端设备 | |
CN108900965A (zh) | 位置提示方法、装置、存储介质及电子设备 | |
CN110888969A (zh) | 一种对话响应方法及装置 | |
CN109887490A (zh) | 用于识别语音的方法和装置 | |
CN110246494A (zh) | 基于语音识别的服务请求方法、装置及计算机设备 | |
CN114242047A (zh) | 一种语音处理方法、装置、电子设备及存储介质 | |
CN113488034A (zh) | 一种语音信息的处理方法、装置、设备及介质 | |
US20220375467A1 (en) | Electronic device for providing update information through an artificial intelligence agent service | |
US20220270604A1 (en) | Electronic device and operation method thereof |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |