CN114706945A - 意图识别方法、装置、电子设备及存储介质 - Google Patents

意图识别方法、装置、电子设备及存储介质 Download PDF

Info

Publication number
CN114706945A
CN114706945A CN202210303606.7A CN202210303606A CN114706945A CN 114706945 A CN114706945 A CN 114706945A CN 202210303606 A CN202210303606 A CN 202210303606A CN 114706945 A CN114706945 A CN 114706945A
Authority
CN
China
Prior art keywords
text
intention
preset
user
matched
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210303606.7A
Other languages
English (en)
Inventor
李长林
王洪斌
蒋宁
权佳成
曹磊
罗奇帅
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mashang Xiaofei Finance Co Ltd
Original Assignee
Mashang Xiaofei Finance Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mashang Xiaofei Finance Co Ltd filed Critical Mashang Xiaofei Finance Co Ltd
Priority to CN202210303606.7A priority Critical patent/CN114706945A/zh
Publication of CN114706945A publication Critical patent/CN114706945A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • G06F40/216Parsing using statistical methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3329Natural language query formulation or dialogue systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3344Query execution using natural language analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • G06F40/211Syntactic parsing, e.g. based on context-free grammar [CFG] or unification grammars
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Computational Linguistics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Mathematical Physics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Evolutionary Computation (AREA)
  • Biophysics (AREA)
  • Software Systems (AREA)
  • Biomedical Technology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Probability & Statistics with Applications (AREA)
  • Machine Translation (AREA)

Abstract

本申请公开了意图识别方法、装置、电子设备及存储介质,包括:获取当前待识别的第一文本,获取第二文本,第二文本为当前待识别第一文本之前预设时间内的对话文本;基于第一文本及第二文本,根据预设意图匹配关系匹配第一文本对应的第一用户意图,预设意图匹配关系包括文本与用户意图的对应关系;若未匹配到第一用户意图,通过意图识别模型,根据第一文本及所述第二文本确定第一文本的目标语义信息;根据目标语义信息确定第一文本对应的第二用户意图。本申请先用预设意图匹配关系识别意图可提高识别速度,预设意图匹配关系识别失败时,再用意图识别模型识别意图,可对预设意图匹配关系无法识别的意图的进行补充识别,提升意图识别的准确率。

Description

意图识别方法、装置、电子设备及存储介质
技术领域
本申请涉及人工智能技术领域,尤其涉及一种意图识别方法、装置、电子设备及存储介质。
背景技术
对话系统的意图识别,通常是从用户对话的句子中抽取它所表达的意图。例如,访问航空公司的官网时,用户可能有查机票、退机票、订座位等不同意图。由此可知,意图识别是多分类问题,输入为文字,输出为某个特定的意图。简单来说,就是当用户输入一句话或者一段文本时,意图识别可以准确识别出它是哪个领域的问题,然后再对识别到的意图进一步处理,这在搜索引擎以及智能问答中都起很重要的作用。但是,用户输入的句子可能出现歧义,导致现有的意图识别方式无法准确识别用户的意图,意图识别的准确率不高。
发明内容
鉴于上述问题,本申请提出了一种意图识别方法、装置、电子设备及存储介质,能解决上述问题。
第一方面,本申请实施例提供了一种意图识别方法,应用于对话系统,所述方法包括:获取当前待识别的第一文本,以及获取第二文本,所述第二文本为所述当前待识别第一文本之前预设时间内的对话文本;基于所述第一文本及所述第二文本,根据预设意图匹配关系匹配所述第一文本对应的第一用户意图,所述预设意图匹配关系包括文本与用户意图的对应关系;若所述第一文本未匹配到所述第一用户意图,则通过意图识别模型,根据所述第一文本及所述第二文本确定所述第一文本的目标语义信息;根据所述目标语义信息确定所述第一文本对应的第二用户意图。
第二方面,本申请实施例提供了一种意图识别装置,应用于对话系统,所述装置包括:文本获取模块,用于获取当前待识别的第一文本,以及获取第二文本,所述第二文本为所述当前待识别第一文本之前预设时间内的对话文本;意图匹配模块,用于基于所述第一文本及所述第二文本,根据预设意图匹配关系匹配所述第一文本对应的第一用户意图,所述预设意图匹配关系包括文本与用户意图的对应关系;模型处理模块,用于若所述第一文本未匹配到所述第一用户意图,则通过意图识别模型,根据所述第一文本及所述第二文本确定所述第一文本的目标语义信息;意图确定模块,用于根据所述目标语义信息确定所述第一文本对应的第二用户意图。
第三方面,本申请实施例提供了一种电子设备,包括:一个或多个处理器;存储器;一个或多个应用程序,其中,所述一个或多个应用程序被存储在所述存储器中并被配置为由所述一个或多个处理器执行,所述一个或多个应用程序配置用于执行上述方法。
第四方面,本申请实施例提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有程序代码,所述程序代码可被处理器调用执行上述方法。
第五方面,本申请实施例提供了一种包含指令的计算机程序产品,其特征在于,所述计算机程序产品中存储有指令,当其在计算机上运行时,使得计算机实现上述方法。
在本申请实施例中,通过对当前待识别的第一文本和第一文本之前预设时间内的对话文本使用预设意图匹配关系来识别意图,在预设意图匹配关系未识别到意图时,再通过意图识别模型确定用户输入的第一文本的目标语义信息来识别意图。本申请先通过预设意图匹配关系识别意图,不需要直接通过意图识别模型来识别意图,在预设意图匹配关系可以匹配到对应的意图的情况下,提高了意图识别的速度,节省了计算资源的使用,在预设意图匹配关系识别失败时,再采用意图识别模型进行意图识别,可以对预设意图匹配关系无法识别的意图进行补充识别,且是在预设意图匹配关系无法识别的情况下才会利用意图识别模型,通过预设意图匹配关系的使用过滤掉大部分的意图识别操作,不需要频繁地开启意图识别模型来对文本进行意图识别,减少了计算资源的使用,且也进一步提升了对话系统意图识别的准确率。
本申请的这些方面或其他方面在以下实施例的描述中会更加简明易懂。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1示出了本申请一实施例提供的意图识别方法的一种应用环境示意图;
图2示出了本申请一实施例提供的意图识别方法的流程示意图;
图3示出了本申请一实施例提供的对话系统的对话页面示意图;
图4示出了本申请又一实施例提供的意图识别方法的流程示意图;
图5示出了本申请另一实施例提供的意图识别方法的流程示意图;
图6示出了本申请另一实施例提供的对话系统的对话页面示意图;
图7示出了本申请一实施例提供的预设意图匹配关系的示意图;
图8示出了本申请一实施例提供的预设意图匹配关系的构建方法的流程示意图;
图9示出了本申请再一实施例提供的意图识别方法的流程示意图;
图10示出了本申请一实施例提供的意图识别模型的处理过程示意图;
图11示出了本申请一实施例提供的意图识别方法的整体流程框图;
图12示出了本申请实施例提供的意图识别装置的模块框图;
图13示出了本申请实施例提供的电子设备的结构框图;
图14示出了本申请实施例提供的计算机可读存储介质的结构框图;
图15示出了本申请实施例提供的一种计算机程序产品的结构框图。
具体实施方式
为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述。
目前智能问答系统已经应用在各个领域。在对话系统工作的过程中,提问者每句话都带有一定的意图,应答方即对话系统根据对方的意图进行回答。因此在问答系统中,通常首先将对用户对话的句子进行意图识别。
对话系统的意图识别,通常是从用户对话的句子中抽取它所表达的意图。现有意图识别的主流方法是依赖于文本分类模型,但通过文本分类模型进行意图识别时,需要一定程度的计算量,模型耗费在分类上的时间较长,因此,现有的意图识别模型存在响应时间较长的问题,特别是对于一些时间敏感的应用场景,现有的意图识别模型难以满足应用需求。
除此之外,用户输入的句子所表达的含义极有可能存在歧义,在对存在歧义的句子进行意图识别则容易出现识别错误的情况,如原本用户想表达的是意图1,而对话系统意图识别出来的结果是意图2。为了更好地通过意图识别了解用户的实际需求,如何更加准确地识别得到用户的意图成为了对话系统中亟需解决的问题。
为了解决上述问题,常用的对话系统意图识别的方法是基于单句进行分类。该方法需要将用户的对话按照一问一答拆分成独立的句子,然后用分类模型对独立的句子进行分类。基于单句的分类没有考虑上文信息对理解当前句子含义的影响。首先,对于一个口语化的对话而言,不能假设用户每一句话都包含当前用户期望的所有信息,当前句子的正确含义经常需要根据上文的语境才能正确理解。其次,人们使用口语表达的每一句对话通常是比较短的,而且缺乏足够多的背景,上文的对话在这里就充当了歧义消解的作用,如果没有考虑上文,句子的含义有可能对应很多种意图,这样意图的后级处理模块将会产生很大的不确定性,另外在于用户对话过程中,如果对于用户的任意一个问题都需要利用启动意图识别模型进行意图识别,这样将大大延长回答时间,用户的耐心受到极大考验。
因此,发明人提出,除了获取当前待识别的第一文本以外,还可以第一文本之前预设时间内的对话文本,对第一文本和第一文本之前预设时间内的对话文本使用预设意图匹配关系来识别意图,并且,在预设意图匹配关系未识别到意图时,再通过意图识别模型确定用户输入的文本信息的目标语义信息来识别意图。由此可以提升对话系统意图识别的速率和准确率。
为了更好理解本申请实施例提供的一种意图识别方法、装置、电子设备及存储介质,下面先对适用于本申请实施例的应用环境进行描述。
请参阅图1,图1示出了本申请一实施例提供的意图识别方法的一种应用环境示意图。示例性地,本申请实施例提供的意图识别方法、装置、电子设备及存储介质可以应用对话系统中。示例性地,可以由图1中的终端设备110和服务器120组成对话系统100。其中,网络用以在终端设备110和服务器120之间提供通信链路的介质。网络可以包括各种连接类型,例如有线通信链路、无线通信链路等等,本申请实施例对此不作限制。
应该理解,图1中的终端设备110、服务器120和网络仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、服务器和网络。
在一些实施例中,终端设备110可以通过网络向服务器120发送对话文本,在服务器120接收到这些对话文本后,可以通过本申请实施例所述的意图识别方法对对话文本进行意图识别。示例性地,终端设备110还可以接收语音数据或包含文本的图片数据等,再将这些语音数据或图片数据识别为文本后,再在服务器120中对这些文本进行意图识别。
示例性地,服务器120可以是物理服务器,也可以是由多个服务器组成的服务器集群等,终端设备110可以是手机、平板电脑、台式电脑、笔记本电脑、穿戴式设备或者智能音箱等等设备。可以理解的是,本申请的实施例还可以允许多台终端设备110同时接入服务器120。
在一些实施例中,服务器120可以在意图识别前对对话文本进行去口语化处理,得到文本中去除口语化内容后剩余的对话文本。可选地,服务器120还可以对剩余的对话文本进行纠错处理得到纠错处理后的对话文本。
上述应用环境仅为方便理解所作的示例,可以理解的是,本申请实施例不仅局限于上述应用环境。
下面将通过具体实施例对本申请实施例提供的意图识别方法、装置、电子设备及存储介质进行详细说明。
请参阅图2,其示出了本申请一实施例提供的意图识别方法的流程示意图。下面将针对图2所示的流程进行详细的阐述,该意图识别方法可以应用于对话系统,该意图识别方法具体可以包括如下步骤:
步骤S210:获取当前待识别的第一文本,以及获取第二文本,所述第二文本为所述当前待识别第一文本之前预设时间内的对话文本。
在本申请实施例,当前待识别的第一文本可以是用户当前在对话系统中输入的信息。在对话系统中,用户可以同时与一个或多个说话人通过文字、语音或图片等方式进行对话,本申请对参与对话的说话人数量及对话的方式均不作限制。可以理解的是,若用户当前输入的信息不是文本,如用户输入语音或图片,在进行意图识别前,需要将用户当前输入的信息识别为文本,再将识别到的文本作为当前待识别的第一文本。
可选地,以用户输入文本为例,在用户每次输入文本时,可以记录用户输入文本的时间点。因此,在对用户当前输入的文本进行意图识别时,可以将用户当前输入的文本作为本申请实施例中的第一文本,将用户当前输入的文本的时间点作为目标时刻。此外,本申请还将获取用户当前输入的文本(即第一文本)之前预设时间内的对话文本,作为第二文本。也就是说,在对目标时刻的第一文本进行意图识别时,第二文本可以为目标时刻之前的预设时间内对话文本。示例性地,若当前的目标时刻为t,预设时间设置为Δt,则可以将时刻(t-Δt)至时刻t之间的对话文本作为第二文本。其中,预设时间可以预先设置。
在本申请的实施例中,可以从当前待识别的第一文本之前的对话文本中,对每个说话人获取预设数量的上文对话文本,将每个说话人的上文对话文本作为第二文本,此时预设时间可以为每个说话人获取到的预设数量的上文对话文本中最早的时间点到输入当前待识别的第一文本的时间点(即目标时刻)之间的时间区间。其中,预设数量可以通过预先设置得到。可选地,预设数量可以根据对话系统的对话数据、意图识别的效果、意图识别的响应速度等因素合理动态配置而确定。
可选地,由于对话系统中可能同时存在两人或两人以上进行对话,因此,在获取到当前待识别第一文本之前预设时间内的对话文本之后,可以首先对这些对话文本进行说话人识别,将每个说话人的对话文本区分开。示例性地,以用户和客服两个对话人为例,可以得到用户的n1条对话文本和客服的n2条对话文本,然后从用户的n1条对话文本中取m条对话文本,作为用户的上文对话文本;从客服的n2条对话文本中取m条对话文本,作为客服的上文对话文本,接着将用户的上文对话文本以及客服的上文对话文本作为第二文本。可以理解的是,m的取值需要小于或等于n1,同时m小于或等于n2。可选地,预设数量的上文对话文本可以是以随机或按输入时间倒序的方式从当前待识别第一文本之前的对话文本中获取得到。可选地,预设数量的典型取值可以为3-5句。
采用随机的方式获取时,可以保证获取到的上文对话文本既不是取第一文本前的所有句子(对话句子较多时,影响意图识别的速度,且会包含无用信息,影响意图识别的准确率),也不是取第一文本前的连续多少句(这样可能会导致只能取到对话一方的句子,或者对话一方的句子数远大于另一方的句子数,对当前文本的语义理解不充分,且也不能避免一些无用文本)。
如图3所示,在对话系统的对话页面中,用户正在与客服小A进行对话,此时,若需要对用户输入的文本“我是给我自己开户”进行意图识别,那么首先会将“我是给我自己开户”作为当前待识别的第一文本,接着可以获取“我是给我自己开户”之前的对话文本(图3中一共有5条对话文本),然后将所有对话文本按照说话人区分开,得到客服小A的3条对话文本以及用户的2条对话文本。此时,若预设数量设置为1,则可以获取“我是给我自己开户”之前的对话文本,从这些对话文本中获取客服小A的1条对话文本作为客服小A的上文对话文本,获取用户的1条对话文本作为用户的上文对话文本。例如,可以将“您是为个人开户,还是为公司开户呢?”作为客服小A的上文对话文本,将“小A你好,我想开个户,请问要怎么操作呢?”作为用户的上文对话文本。其中,客服小A的上文对话文本以及用户的上文对话文本中最早输入的时间点为12:20,当前的目标时刻为12:22,则可以将预设时间设置为2分钟,由此可以第二文本可以为上述客服小A的上文对话文本以及用户的上文对话文本。
由于各个说话人的对话文本中可能存在对第一文本的语义理解(即意图识别)无关的语句(如闲聊语句、问候语句),可选地,在一些实施方式中,在获取第二文本前可以对当前待识别第一文本之前预设时间内的对话文本进行文本预处理,再将文本预处理之后的对话文本作为第二文本。
可选地,对对话文本中的每个句子进行文本预处理的操作可以包括:对每个句子进行分词、去停用词后查看是否存在有效信息,或者对每个句子进行实体抽取是否能得到有效信息;若存在有效信息,则保留该语句。通过文本预处理可以去除对第一文本的意图识别无关的对话文本,得到更加精确的第二文本。
步骤S220:基于所述第一文本及所述第二文本,根据预设意图匹配关系匹配所述第一文本对应的第一用户意图,所述预设意图匹配关系包括文本与用户意图的对应关系。
在本申请的实施例中,预设意图匹配关系为预先确定的,包括文本与用户意图之间的对应关系。可以理解的是,通过预设意图匹配关系可以快速地识别到第一文本的用户意图。但是,预设意图匹配关系相当于通过穷举法列出文本与用户意图的对应关系,由于搜集到的文本和用户意图具有一定的局限性,预设意图匹配关系通常无法涵盖所有的用户意图,因此,使用预设意图匹配关系可能无法识别得到用户的意图。因此,在本申请的实施例中,可以首先根据第一文本和第二文本,根据预设意图匹配关系匹配第一文本对应的第一用户意图,这样可以加快识别速度。
在一些实施方式中,可以使用关键字匹配的方式根据预设意图匹配关系匹配第一用户意图。示例性地,预设意图匹配关系可以包括关键词和用户意图的各个意图类别间的对应关系。其中,预设意图匹配关系可以为一维的应答知识表,即一个关键词对应一个意图类别;也可以是二维的应答知识表,即两个关键词对应一个意图类别,以此类推,预设意图匹配关系也可以是三维的应答知识表、四维的应答知识表等等,本申请对此不作限制。
以预设意图匹配关系为一维的应答知识表为例,在进行关键字匹配时,可以从第一文本及第二文本中获取出现频次最高的词语作为关键字,然后通过查表的方式确定预设意图匹配关系中是否存在与该关键字对应的意图类别。若存在,则说明可以匹配到第一用户意图,可以将该关键字对应的意图类别作为第一用户意图;若不存在,则说明第一文本未匹配到第一用户意图。
类似地,以预设意图匹配关系为二维的应答知识表为例,在进行关键字匹配时,可以从第一文本及第二文本中获取出现频次达到预设次数的词语作为关键字。可以理解的是,此时关键字可能存在多个,则可以将这些关键字两两组成关键字词组,然后通过查表的方式对每组关键字词组确定预设意图匹配关系中是否存在与该关键字词组对应的意图类别。若存在,则可以将该关键字词组对应的意图类别作为第一用户意图;若对每组关键字词组均未查找到对应的意图类别,则说明第一文本未匹配到第一用户意图。
在另一些实施方式中,可以通过实体抽取的方式从对第一文本及第二文本抽取得到待匹配实体词,再通过查表的方式从预设意图匹配关系中查找与待匹配实体词对应的第一用户意图。具体过程可参考步骤S410至步骤S420,或者步骤S510至步骤S530,本申请实施例在此不再赘述。
可以理解的是,若可以从预设意图匹配关系中匹配到第一用户意图,则可以将该第一用户意图作为第一文本的意图识别结果。进一步地,在匹配到第一用户意图后,无需再使用意图识别模型对第一文本和第二文本进行处理,由此可以明显地提高识别效率。
步骤S230:若所述第一文本未匹配到所述第一用户意图,则通过意图识别模型,根据所述第一文本及所述第二文本确定所述第一文本的目标语义信息。
在本申请的实施例中,若第一文本未匹配到第一用户意图,则可以使用意图识别模型对第一文本和第二文本进行处理,以识别得到第一文本的意图识别结果。
在一些实施例的意图识别模型中,可以根据第一文本和第二文本得到第一文本的目标语义信息。可选地,可以首先将第一文本和第二文本进行融合后,得到第一文本的上文语义信息,接着根据第一文本的上文语义信息计算第一文本的目标语义信息。
例如,可以分别将第一文本和第二文本处理为句子向量,得到与第一文本相对应的目标向量,以及与第二文本相对应的上文向量。接着,通过对目标向量和上文向量进行融合可以得到融合向量,然后对融合向量进行特征提取即可得到与第一文本相关的上文语义信息(即上述第一文本的上文语义信息)。
可选地,该上文语义信息也可以通过直接对第二文本进行特征提取而得到。
接着,通过对上文语义信息与第一文本进行处理可以得到第一文本的目标语义信息。
可以理解的是,由于目标语义信息是由第一文本和第二文本处理而得到的,因此目标语义信息中不仅包含了用户在第一文本这单个句子中表达的语义信息,还包含了第二文本中用户与参与对话的其他人的交谈的过程中的上文语境,因此,通过该目标语义信息来进行意图识别,则可以考虑到上文语境对用户输入的单个句子的影响,达到消除歧义的目的。
步骤S240:根据所述目标语义信息确定所述第一文本对应的第二用户意图。
在一些实施方式中,意图识别模型可以识别多种不同类型的意图类别。可选地,在意图识别模型中,可以根据第一文本的目标语义信息确定第一文本属于各个意图类别的类别概率,然后将类别概率满足预设概率阈值的意图类别作为第二用户意图。在一些典型的实施例中,可以将类别概率最高的意图类别作为该第二用户意图。
可选地,可以对意图识别模型可识别的各个意图类别分别构建一个标准陈述语句,接着对每个标准陈述语句提取各自的标准语义信息,然后计算目标语义信息与每个标准语义信息之间的语义相似度,最后根据语义相似度来确定目标文本信息属于各个意图类别的类别概率。
示例性地,若意图识别模型可识别的意图类别有y个,分别为意图1、意图2、……意图y,可以对这y个意图类别对应构建得y个标准陈述语句,然后对y个标准陈述语句进行特征提取,得到包含标准语义信息的特征向量U=[U1,U2,……Uy],其中U1与意图1相对应,U2与意图2相对应,以此类推,Uy与意图y相对应。此外,通过对第一文本和第二文本进行特征提取可以得到包含目标语义信息的目标向量B,然后通过相似度计算可得到目标向量B与U1的语义相似度,目标向量B与U2的语义相似度,……,以及目标向量B与Uy的语义相似度,最后根据这些语义相似度得到目标文本信息属于意图1的类别概率,目标文本信息属于意图2的类别概率,……,以及目标文本信息属于意图y的类别概率。
由于目标语义信息可以同时包含用户输入的单个句子所表达的含义以及上文语境,因此在意图识别模型中对第一文本进行意图识别时,通过上文语境可以消除用户当前输入句子的歧义,使得意图识别的准确率更高。
综上所述,本实施例提供的意图识别方法,首先对当前待识别的第一文本和第一文本之前预设时间内的对话文本使用预设意图匹配关系来识别意图,并且,在预设意图匹配关系未识别到意图时,再通过意图识别模型确定用户输入的文本信息的目标语义信息来识别意图。本申请首先使用预设意图匹配关系识别意图可以提高意图识别的速度,此外,本申请还可以在预设意图匹配关系识别失败时,采用意图识别模型进行意图识别,可以对预设意图匹配关系无法识别的意图的进行补充识别,提升对话系统意图识别的准确率。
在一些实施方式中,可选地,本实施例在上述实施例的基础上,在根据预设意图匹配关系匹配第一文本对应的第一用户意图时,可以首先对第一文本和第二文本进行实体抽取得到实体词后,再根据实体词从预设意图匹配关系中匹配第一用户意图。具体地,请参阅图4,其示出了本申请又一实施例提供的意图识别方法的流程示意图。所述基于所述第一文本及所述第二文本,根据预设意图匹配关系匹配所述第一文本对应的第一用户意图,具体可以包括如下步骤:
步骤S410:对所述第一文本及所述第二文本进行实体抽取,得到待匹配实体词。
在本申请的一些实施方式中,可以通过实体抽取的方式从对第一文本及第二文本抽取得到待匹配实体词。
其中,实体是指客观存在并可相互区别的事物,而实体词则是实体所指事物的名称。在一些实施方式中,可以通过命名实体识别(Named Entity Recognition,NER)对第一文本和第二文本进行实体抽取。可选地,在抽取得到第一文本及第二文本中的实体词后,可以统计每个实体词在第一文本及第二文本中出现的次数,将出现次数满足预设次数条件的实体词作为待匹配实体词。此时,若预设意图匹配关系为一维的应答知识表,即一个实体词对应一个意图类别,则可以将出现次数最高的实体词作为待匹配实体词。
步骤S420:根据所述预设意图匹配关系匹配所述待匹配实体词对应的意图类别,所述预设意图匹配关系包括实体词与用户意图的对应关系。
步骤S430:在所述待匹配实体词未匹配到对应的意图类别的情况下,所述第一文本未匹配到所述第一用户意图。
在本申请的实施例中,在预设意图匹配关系的构建过程中可以确定得到目标实体词,目标实体词可以与预设意图匹配关系中的意图类别一一对应,也就是说,预设意图匹配关系可以包括实体词与用户意图的对应关系。
可以通过查表的方式对预设意图匹配关系进行匹配。即是说,可以将待匹配实体词作为查询项,查询预设意图匹配关系中是否存在与该待匹配实体词相对应的意图类别。可选地,可以确定预设意图匹配关系中是否存在与待匹配实体词一致的目标实体词及该目标实体词对应的意图类别。若存在,表示预设意图匹配关系中可以匹配到第一用户意图,则可以将与待匹配实体词一致的目标实体词对应的意图类别作为第一用户意图;若不存在,即未匹配到待匹配实体词对应的意图类别的情况下,则第一文本未匹配到第一用户意图。
由此,在本实施例中,通过实体抽取的方式从第一文本和第二文本中获取待匹配实体词,再根据预设意图匹配关系匹配待匹配实体词对应的意图类别,可以将匹配到的意图类别作为第一用户意图,则可以实现通过实体词匹配第一文本的意图类别,实体抽取和关系匹配过程方便而快捷,可以达到提高意图识别的速度的目的。
在另一些实施方式中,对第一文本及第二文本进行实体抽取可以得到多个实体词,可以将这些实体词组成实体词组后,再使用实体词组从预设意图匹配关系中匹配第一用户意图。具体地,请参阅图5,其示出了本申请另一实施例提供的意图识别方法的流程示意图。所述基于所述第一文本及所述第二文本,根据预设意图匹配关系匹配所述第一文本对应的第一用户意图,具体可以包括如下步骤:
步骤S510:对所述第一文本及所述第二文本进行实体抽取,得到多个待匹配实体词。
对第一文本及第二文本进行实体抽取的具体过程可以参考前述实施例中的对应过程,本申请实施例在此不再赘述。可以理解的是,对第一文本及第二文本进行实体抽取时,可以得到多个实体词。
可选地,在抽取得到多个实体词后,可以将提取得到的所有实体词均作为待匹配实体词;也可以统计每个实体词在第一文本及第二文本中出现的次数,将出现次数满足预设次数条件的实体词作为待匹配实体词;还可以分别从第一文本及第二文本的每个句子中提取的实体词内选择一个实体词作为待匹配实体词,也就是说,对第一文本对应得到一个待匹配实体词,分别对每个说话人的上文对话文本得到一个待匹配实体词。
以客服对话系统为例,客服对话系统中的实体词可以包括该系统可处理的业务类型和操作项。由于对同一个操作项可能执行不同的操作,如实体词“密码”对应的操作可能有“修改密码”和“忘记密码”,因此,在本申请的实施方式中,可以将实体词与操作名称相结合,将实体词与操作名称结合后的词组作为本申请中的待匹配实体词。
因此,在进行实体抽取时,不仅需要抽取第一文本及第二文本中的业务类型,还需要抽取操作项。在一些实施方式中,在对业务类型及操作项进行结合得到待匹配实体词时,一些业务类型及操作项之间可能存在关联关系,而另一些业务类型及操作项之间则不存在关联关系。因此,可以通过计算提取得到的每个业务类型与每个操作名称关联关系的大小,将关联关系满足预设关联条件的业务类型及操作项结合成一组词组作为待匹配实体词。
进一步地,若预设意图匹配关系为二维的应答知识表,即两个实体词组成的一个实体词组对应一个意图类别,则可以将每两个所述待匹配实体词进行组合得到待匹配实体词组,再根据预设意图匹配关系对待匹配实体词组进行意图匹配。
步骤S520:将所述每两个所述待匹配实体词进行组合,得到多组待匹配实体词组。
步骤S530:根据所述预设意图匹配关系匹配每个所述待匹配实体词组对应的意图类别,所述预设意图匹配关系包括实体词组与用户意图的对应关系。
步骤S540:在每组所述待匹配实体词组均未匹配到对应的意图类别的情况下,所述第一文本未匹配到所述第一用户意图。
在本申请的实施例中,可以将前述步骤中得到的多组待匹配实体词进行两两组合,即将每两个待匹配实体词组合为一组待匹配实体词组,可以得到多组待匹配实体词组,其中,以3组待匹配实体词(如“词A”,“词B”,“词C”)为例,则可以组合得到3组待匹配实体词组([“词A”,“词B”]、[“词A”,“词C”]以及[“词B”,“词C”)。
在本申请的实施例中,在预设意图匹配关系的构建过程中可以确定得到目标实体词,进一步地,可以将目标实体词按照实体词之间的关联关系组合成目标实体词组,目标实体词组可以与预设意图匹配关系中的意图类别一一对应,也就是说,预设意图匹配关系可以包括实体词组与各个意图类别间的对应关系。
与步骤S420类似,在本实施例中,也可以通过查表的方式对预设意图匹配关系进行匹配。即是说,分别可以将每一组待匹配实体词组作为查询项,查找预设意图匹配关系中是否存在与该待匹配实体词组相对应的意图类别。
示例性地,若将待匹配实体词组有N个,以每一组待匹配实体词组作为查询项在预设意图匹配关系中进行匹配,则每个待匹配实体词组可以查询到1个或0个意图类别,若其中M个待匹配实体词组查询到了对应的意图类别,M小于或等于N,表示能够匹配到第一用户意图,并且可以将这M个意图类别全部作为第一用户意图。若在预设意图匹配关系中对N个待匹配实体词组均未查找到对应的意图类别,表示第一文本未匹配到第一用户意图。
可选地,可以确定预设意图匹配关系中是否存在与待匹配实体词组一致的目标实体词组。若对任一待匹配实体词组查询到存在对应的意图类别,说明预设意图匹配关系中可以匹配到第一用户意图,且可以将与待匹配实体词组一致的目标实体词组对应的意图类别作为第一用户意图;若不存在,即在每组待匹配实体词组均未查找到对应的意图类别的情况下,则第一文本未匹配到第一用户意图。
可选地,当匹配得到多个第一用户意图时,可以将这多个第一用户意图提供给用户以供用户选择,在获取得到用户选择的第一用户意图后,再将用户选择的第一用户意图作为第一文本的意图识别结果。例如,在如图6所示的对话页面中,可以显示多个第一用户意图,用户可以通过点击每个第一用户意图对应的位置选择第一用户意图。
在一些典型的实施例中,对话系统中的实体词可能是由多种类型的数据组成,则由实体词组和意图类别组成的预设意图匹配关系也可能比较复杂,预设意图匹配关系可能与由多个不同维度的词组组成,如图7所示,可能包括二维词组与意图类别的对应关系(如“账户开户”及“国内投资”组成一个二维词组,该二维词组对应“意图1”),也可能包括三维词组与意图类别之间的对应关系(如“账户开户”、“个人”及“定期”组成一个三维词组,该三维词组对应“意图4”)等等,因此,在实际应用过程中,不仅可以将两个待匹配实体词组合成待匹配实体词组,还可以将三个待匹配实体词组合成待匹配实体词组,以此类推,本申请实施例对待匹配实体词组所包括的待匹配实体词的数量不做限制。
应当说明,本申请通过对第一文本及第二文本进行实体抽取,不仅可以得到第一文本中的实体词,还可以第二文本中的实体词,因此,在使用预设意图匹配关系进行匹配时同样可以结合上文语境来消除歧义。此外,相较于使用单个待匹配实体词进行意图匹配,将每两个所述待匹配实体词进行组合得到多组待匹配实体词组,再使用待匹配实体词组进行意图匹配可以减少单个实体词所表达的信息较少导致匹配错误的情况,达到提高意图识别准确的目的。
可选地,本实施例在上述实施例的基础上,在预设意图匹配关系中确定与待匹配实体词或待匹配实体词组对应的意图类别,即根据预设意图匹配关系匹配第一文本对应的第一用户意图之前,还可以基于预先确定的构建规则来确定该预设意图匹配关系。请参阅图8,其示出了本申请一实施例提供的预设意图匹配关系的构建方法的流程示意图,具体可以包括如下步骤:
步骤S810:基于预先确定的构建规则确定目标实体词以及所述目标实体词对应的意图类别。
在一些实施方式中,可以根据对话系统的不同业务场景制定预设意图匹配关系的构建规则。接着,再根据构建规则确定预设意图匹配关系的目标实体词以及目标实体词对应的意图类别。以银行场景下的客服对话系统为例,可以将银行业务的业务类型以及对应的操作项作为目标实体词。
在一些实施例中,可以从对话系统的历史对话文本中确定目标实体词。可选地,首先将从对话系统中提取出历史对话文本,然后对历史对话文本进行实体抽取,在抽取得到实体词后,可以统计各个实体词在历史对话文本中的出现频次,将其中出现频次满足预设条件的实体词作为目标实体词。可选地,可以将出现频次大于预设频次的实体词作为目标实体词,其中预设次数可以根据业务场景的不同而预先设置。可选地,还可以将各个实体词按照出现频次进行排序,将预设排名大于预设名词的实体词作为目标实体词。
这样,可以使预设意图匹配关系的目标实体词包含用户经常询问的一些业务类型或者操作项。因此,通过预设意图匹配关系来识别用户的意图可以提升对话系统的应答效率,进而提升客户满意度。其中,银行场景下的目标实体词例如可以包括个人的存取款、密码的修改、开户或销户等常用业务类型或者操作项。
在另一些实施方式中,可以从意图识别模型识别错误的历史对话文本中提取得到目标实体词。可选地,可以首先确定意图识别模型识别错误的错误识别结果,接着确定该错误识别结果对应的历史对话文本,对该识别错误的历史对话文本进行实体抽取,即可得到目标实体词。
在本实施例中,通过从意图识别模型识别错误的历史对话文本中提取得到目标实体词,则预设意图匹配关系的目标实体词包含意图识别模型的易错项,可以使用预设意图匹配关系对模型容易应答出错的对话文本进行意图识别。此外,将易错项加入到预设意图匹配关系中,由预设意图匹配关系去匹配用户意图,可以与意图识别模型形成互补,互相识别易识别错误的对话文本,可以从整体上提高对话系统意图识别的准确率。
除此之外,还可以按照预设频率更新预设意图匹配关系的目标实体词。可在业务场景增加新的业务类型或操作项时,将这些新的业务类型或操作项作为新增项添加到目标实体词中。仍然以银行场景为例,新增项可以包括银行场景新增的查询账单、限额等操作或信用卡、电子银行等业务类型。相比更新意图识别模型,在预设意图匹配关系中增加业务场景中新的业务类型或操作项,可以快速支撑业务需求,因为在新增实体词及对应的意图类别时,意图识别模型去识别这些新增的意图类别,需要经过准备数据、标注数据、模型训练、调优及替换等过程。
步骤S820:基于所述目标实体词与所述目标实体词对应的意图类别确定所述预设意图匹配关系。
在一些实施方式中,在确定了目标实体词后,可以对目标实体词进行去重处理,例如可以去除意图类别相同的目标实体词,由此使得每个目标实体词与意图类别为一一对应关系,然后在预设意图匹配关系中填入目标实体词与各目标实体词对应的意图类别,由此构建得到完整的预设意图匹配关系。
可以理解的是,若预设意图匹配关系是由两个或两个以上的目标实体词对应一个意图类别,则在确定目标实体词之后,还需将目标实体词组合成目标实体词组,接着确定每个目标实体词组对应的意图类别,才能完成预设意图匹配关系的构建。
由此可见,通过预先确定的构建规则来构建预设意图匹配关系,使预设意图匹配关系可以解决意图识别模型不易识别的一些对话文本,达到提升对话系统的应答速度和识别准确率的目的。
请参阅图9,其示出了本申请再一实施例提供的意图识别方法的流程示意图。可选地,通过意图识别模型,可以首先根据第一文本及第二文本确定第一文本的上文语义信息,再进一步确定第一文本的目标语义信息。具体可以包括如下步骤:
步骤S910:所述意图识别模型用于计算所述第一文本和所述第二文本对应的相关性权重,并基于所述相关性权重确定所述第一文本的上文语义信息。
在本申请的实施例中,意图识别模型可以用于将第一文本和第二文本转换为句子向量,分别得到与第一文本相对应的目标向量,以及与第二文本相对应的上文向量。接着,对目标向量和每一个上文向量进行相关性计算,进而得到第一文本和每一个第二文本对应的相关性权重。相关性权重可以用于表示每一个第二文本与第一文本的相关程度,相关性权重越大,表示相关程度越高。
如图10所示,在对话系统中,除了可以获取到用户的第一文本(即图10中的当前句子)外,在对n条对话文本进行预处理后,对每个说话人获取到预设数量的上文对话文本。其中,若包括用户在内的说话人数量为2,预设数量为m,则上文对话文本的句子数量(即第二文本的句子数量)为2m,包括句子1、句子2、……、句子2m。接着,可以通过词嵌入(Embedding)的方式将第一文本和每个上文对话文本转换为句子向量,得到目标向量、上文向量1、上文向量2、……、上文向量2m。在一些实施方式中,可以通过注意力机制对目标向量与2m句上文向量计算每个上文向量对应的Attention参数。其中,ɑ1、ɑ2、…、ɑ2m为上文对话文本对应的Attention参数。
可选地,Embedding的方法包括但不仅限于CNN(Convolutional NeuralNetworks,卷积神经网络)、LSTM(Long short-term memory,长短期记忆网络)、TF-IDF(Term Frequency–Inverse Document Frequency,词频-逆文本频率技术)等
步骤S920:基于所述相关性权重确定所述目标文本信息的上文语义信息。
在本申请的实施例中,可以每个第二文本与相关性权重进行加权平均计算后,得到第一文本的上文语义信息。可选地,如图10所示,可以将每一个第二文本对应的上文向量与对应的Attention参数进行加权求和,得到包含上文语义信息的上文语义向量。
步骤S930:根据所述第一文本和所述上文语义信息得到所述第一文本的目标语义信息。
进一步地,可以将目标向量和上文语义向量经过一个多层神经网络,得到第一文本的目标语义向量。其中,多层神经网络可以使用bert等网络。
紧接着,在得到第一文本的目标语义信息后,根据该目标语义信息确定第二用户意图。
本申请实施例可以通过注意力机制计算第一文本和每一个第二文本对应的相关性权重,其中,相关性权重越大相当于上文句子与当前句子的相关性越高,可以为识别出当前句子的意图作出更大的贡献,因此通过意图识别模型可以更好地从上文对话文本中分析出对用户意图起到作用的上文语境信息,达到消除用户输入句子的歧义,使得意图识别的准确率更高的目的。
步骤S940:根据所述目标文本信息的目标语义信息确定所述目标文本信息属于各个意图类别的类别概率。
步骤S950:将类别概率满足预设概率阈值的意图类别确定为所述第二用户意图。
在本申请的实施例中,该意图识别模型可以用于识别多种的意图类别。在一些实施例中,可以根据前述实施例中得到的目标语义信息确定第一文本属于各个意图类别的类别概率。可选地,可以将类别概率最高的意图类别作为该第二用户意图。确定类别概率的过程可以参考前述实施例中的对应内容,本申请实施例在此不再赘述。
请参阅图11,图11示出了本申请一实施例提供的意图识别方法的整体流程框图。在一些实施例中,可以将意图识别方法的处理过程分为:S1110到S1180。
步骤S1110:获取当前句子和上文句子。
其中,当前句子可以是用户当前输入的句子,上文句子可以是当前句子之前预设时间内的对话信息,可以包括用户在对话系统中与其他说话人交谈生成的对话信息。
在一些实施例中,若用户的对话信息为语音信息,将首先对用户的对话信息进行说话人识别,识别出每个说话人对应的上文句子。
步骤S1120:文本预处理。
在一些实施例中,可以分别对当前句子及上文句子进行文本预处理。进一步地,可以将预处理后的当前句子作为前述实施例中的第一文本,对预处理后的用户的对话信息取倒序得到每个说话人的预设数量的上文对话文本,将每个说话人的预设数量的上文对话文本作为第二文本。
可选地,对当前句子及上文句子中的每个句子进行预处理的过程可以包括:对每个句子进行分词、去停用词后查看是否存在有效信息,或者对每个句子进行实体抽取是否能得到有效信息;若存在有效信息,则保留该语句。通过文本预处理可以去除对目标文本信息的意图识别无关的对话文本,得到更加精确的上文对话文本。
步骤S1130:实体抽取。
在本申请的实施例中,可以对去前述处理过程中得到的第一文本和第二文本进行实体抽取,得到待匹配实体词。对第一文本和第二文本进行实体抽取得到待匹配实体词的过程可以参考前述实施例中的步骤S410或步骤S510,本申请实施例对此不做限制。
步骤S1140:匹配应答知识表。
在抽取得到待匹配实体词后,可以根据待匹配实体词匹配应答知识表,其中应答知识表可以是前述实施例中的预设意图匹配关系。若抽取得到的待匹配实体词为单个实体词,则基于待匹配实体词匹配应答知识表的过程可以参考前述实施例中的步骤S420至步骤S430;若抽取得到的待匹配实体词为多个实体词,则基于多个待匹配实体词匹配应答知识表的过程可以参考前述实施例中的步骤S520至步骤S540。
步骤S1150:匹配是否成功。
基于前述实施例中的匹配结果,若第一文本匹配到第一用户意图,表示匹配成功;若第一文本未匹配到第一用户意图,表示匹配不成功。
步骤S1160:若匹配成功,输出当前句意图。
在本实施例中,若匹配成功,将第一用户意图输出为当前句意图。
步骤S1170:若匹配不成功,进行模型识别。
在本实施例中,若成功不匹配,将使用意图识别模型对第一文本和第二文本进行处理,以识别得到第二用户意图。可以理解的是,使用意图识别模型得到第二用户意图的过程可参考前述实施例中的对应过程,在此不再赘述。
步骤S1180:输出当前句意图。
在本申请的实施例中,可以将意图识别模型识别得到的第二用户意图输出为当前句意图。
在本实施例中,除了获取可以获取用户输入的当前句子外,还可以获取当前句子之前预设时间内的上文句子,经过对当前句子和上文句子进行预设处理后,可以得到用户输入的第一文本和第二文本。接着,对第一文本和第二文本使用应答知识表判断是否可以成功匹配到当前句意图。若匹配成功,则将应答知识表匹配到的第一用户意图作为当前句意图;若匹配不成功,则使用意图识别模型对第一文本和第二文本进行处理,并且将模型识别到的第二用户意图作为当前句意图。由此可以提升对话系统意图识别的速度和准确率。
请参阅图12,示出了本申请实施例提供的意图识别装置的模块框图。具体地,该意图识别装置可以应用于对话系统,该装置可以包括:文本获取模块1210、意图匹配模块1220、模型处理模块1230以及意图确定模块1240。
其中,文本获取模块1210,用于获取当前待识别的第一文本,以及获取第二文本,所述第二文本为所述当前待识别第一文本之前预设时间内的对话文本;意图匹配模块1220,用于基于所述第一文本及所述第二文本,根据预设意图匹配关系匹配所述第一文本对应的第一用户意图,所述预设意图匹配关系包括文本与用户意图的对应关系;模型处理模块1230,用于若所述第一文本未匹配到所述第一用户意图,则通过意图识别模型,根据所述第一文本及所述第二文本确定所述第一文本的目标语义信息;意图确定模块1240,用于根据所述目标语义信息确定所述第一文本对应的第二用户意图。
在一些实施方式中,上述意图匹配模块1220可以包括:第一实体抽取模块,用于对所述第一文本及所述第二文本进行实体抽取,得到待匹配实体词;第一匹配模块,用于根据所述预设意图匹配关系匹配所述待匹配实体词对应的意图类别,所述预设意图匹配关系包括实体词与用户意图的对应关系;第二匹配模型,用于在所述待匹配实体词未匹配到对应的意图类别的情况下,所述第一文本未匹配到所述第一用户意图。
在另一些实施方式中,上述意图匹配模块1220还可以包括:第二实体抽取模块,用于对所述第一文本及所述第二文本进行实体抽取,得到多个待匹配实体词;组合模块,用于将所述每两个所述待匹配实体词进行组合得到多组待匹配实体词组;第三匹配模块,用于根据所述预设意图匹配关系匹配每个所述待匹配实体词组对应的意图类别,所述预设意图匹配关系包括实体词与用户意图的对应关系;第四匹配模块,用于在每组所述待匹配实体词组均未匹配到对应的意图类别的情况下,所述第一文本未匹配到所述第一用户意图。
进一步地,在前述实施例的基础上,该意图识别装置还可以包括:第一构建模块,用于基于预先确定的构建规则确定目标实体词以及所述目标实体词对应的意图类别;第二构建模块,用于基于所述目标实体词与所述目标实体词对应的意图类别确定所述预设意图匹配关系。
可选地,上述第一构建模块可以包括:历史获取模块,用于获取所述对话系统中的历史对话文本;频次统计模块,用于统计所述历史对话文本中各个实体词的出现频次,将出现频次满足预设条件的实体词作为所述目标实体词。
可选地,上述第一构建模块可以包括:错误获取模块,用于获取所述意图识别模型识别错误的历史对话文本;第三实体抽取模块,用于对所述识别错误的历史对话文本进行实体抽取,得到所述目标实体词。
在一些实施例中,所述意图识别模型用于计算所述第一文本和所述第二文本对应的相关性权重,并基于所述相关性权重确定所述第一文本的上文语义信息,上述模型处理模块1230可以包括:语义计算模块,用于根据所述第一文本和所述上文语义信息得到所述第一文本的目标语义信息。
进一步地,在前述实施例的基础上,上述意图确定模块1240可以包括:概率确定模块,用于根据所述目标文本信息的目标语义信息确定所述目标文本信息属于各个意图类别的类别概率;意图确定子模块,用于将类别概率满足预设概率阈值的意图类别确定为所述第二用户意图。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述装置中模块/单元/子单元/组件的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本申请所提供的几个实施例中,所显示或讨论的模块相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或模块的间接耦合或通信连接,可以是电性,机械或其它的形式。
另外,在本申请各个实施例中的各功能模块可以集成在一个处理模块中,也可以是各个模块单独物理存在,也可以两个或两个以上模块集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。
请参阅图13,其示出了本申请实施例提供的电子设备的结构框图。本实施例中的所述电子设备1300可以包括一个或多个如下部件:处理器1310、存储器1320以及一个或多个应用程序,其中一个或多个应用程序可以被存储在存储器1320中并被配置为由一个或多个处理器1310执行,一个或多个应用程序配置用于执行如前述方法实施例所描述的方法。
其中,电子设备可以为移动、便携式并执行无线通信的各种类型的计算机系统设备中的任何一种。具体的,电子设备可以为移动电话或智能电话(例如,基于iPhone TM,基于Android TM的电话)、便携式游戏设备(例如Nintendo DS TM,PlayStation PortableTM,Gameboy Advance TM,iPhone TM)、膝上型电脑、PDA、便携式互联网设备、音乐播放器以及数据存储设备,其他手持设备以及诸如智能手表、智能手环、耳机、吊坠等,电子设备还可以为其他的可穿戴设备(例如,诸如电子眼镜、电子衣服、电子手镯、电子项链、电子纹身、电子设备或头戴式设备(HMD))。
电子设备还可以是多个电子设备中的任何一个,多个电子设备包括但不限于蜂窝电话、智能电话、智能手表、智能手环、其他无线通信设备、个人数字助理、音频播放器、其他媒体播放器、音乐记录器、录像机、照相机、其他媒体记录器、收音机、医疗设备、车辆运输仪器、计算器、可编程遥控器、寻呼机、膝上型计算机、台式计算机、打印机、上网本电脑、个人数字助理(PDA)、便携式多媒体播放器(PMP)、运动图像专家组(MPEG-1或MPEG-2)音频层3(MP3)播放器,便携式医疗设备以及数码相机及其组合。
在一些情况下,电子设备可以执行多种功能(例如,播放音乐,显示视频,存储图片以及接收和发送电话呼叫)。如果需要,电子设备可以是诸如蜂窝电话、媒体播放器、其他手持设备、腕表设备、吊坠设备、听筒设备或其他紧凑型便携式设备。
可选地,电子设备也可以是服务器,例如可以是独立的物理服务器,也可以是多个物理服务器构成的服务器集群或者分布式系统,还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、CDN(ContentDelivery Network,内容分发网络)、以及大数据和人工智能平台等基础云计算服务的云服务器,还可以是提供人脸识别、自动驾驶、工业互联网服务、数据通信(如4G、5G等)等专门或平台服务器。
处理器1310可以包括一个或者多个处理核。处理器1310利用各种接口和线路连接整个电子设备内的各个部分,通过运行或执行存储在存储器1320内的指令、应用程序、代码集或指令集,以及调用存储在存储器1320内的数据,执行电子设备的各种功能和处理数据。可选地,处理器1310可以采用数字信号处理(Digital Signal Processing,DSP)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)、可编程逻辑阵列(ProgrammableLogic Array,PLA)中的至少一种硬件形式来实现。处理器1310可集成中央处理器(CentralProcessing Unit,CPU)、图像处理器(Graphics Processing Unit,GPU)和调制解调器等中的一种或几种的组合。其中,CPU主要处理操作系统、用户界面和应用程序等;GPU用于负责显示内容的渲染和绘制;调制解调器用于处理无线通信。可以理解的是,上述调制解调器也可以不集成到处理器1310中,单独通过一块通信芯片进行实现。
存储器1320可以包括随机存储器(Random Access Memory,RAM),也可以包括只读存储器(Read-Only Memory)。存储器1320可用于存储指令、应用程序、代码、代码集或指令集。存储器1320可包括存储程序区和存储数据区,其中,存储程序区可存储用于实现操作系统的指令、用于实现至少一个功能的指令(比如触控功能、声音播放功能、图像播放功能等)、用于实现下述各个方法实施例的指令等。存储数据区还可以电子设备在使用中所创建的数据(比如电话本、音视频数据、聊天记录数据)等。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的电子设备的处理器1310、存储器1320的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
请参考图14,其示出了本申请实施例提供的计算机可读存储介质的结构框图。该计算机可读存储介质1400中存储有程序代码,所述程序代码可被处理器调用执行上述方法实施例中所描述的方法。
计算机可读存储介质1400可以是诸如闪存、EEPROM(电可擦除可编程只读存储器)、EPROM、硬盘或者ROM之类的电子存储器。可选地,计算机可读存储介质1400包括非易失性计算机可读存储介质(non-transitory computer-readable storage medium)。计算机可读存储介质1400具有执行上述方法中的任何方法步骤的程序代码1410的存储空间。这些程序代码可以从一个或者多个计算机程序产品中读出或者写入到这一个或者多个计算机程序产品中。程序代码1410可以例如以适当形式进行压缩。其中,计算机可读存储介质1400可以是如只读存储器(Read-Only Memory,简称ROM)、随机存取存储器(Random AccessMemory,简称RAM)、SSD、带电可擦可编程只读存储器(Electrically ErasableProgrammable read only memory,简称EEPROM)或快闪存储器(Flash Memory,简称Flash)等。
在一些实施例中,请参考图15,其示出了本申请实施例提供的一种计算机程序产品的结构框图,该计算机程序产品1500包括计算机程序/指令1510,该计算机程序/指令1510存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机程序/指令1510,处理器执行该计算机程序/指令1510,使得该计算机设备执行上述各方法实施例中的步骤。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例的方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、SSD、Flash)中,包括若干指令用以使得一台终端(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本申请各个实施例的方法。
最后应说明的是:以上实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不驱使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围。

Claims (11)

1.一种意图识别方法,其特征在于,应用于对话系统,所述方法包括:
获取当前待识别的第一文本,以及获取第二文本,所述第二文本为所述当前待识别第一文本之前预设时间内的对话文本;
基于所述第一文本及所述第二文本,根据预设意图匹配关系匹配所述第一文本对应的第一用户意图,所述预设意图匹配关系包括文本与用户意图的对应关系;
若所述第一文本未匹配到所述第一用户意图,则通过意图识别模型,根据所述第一文本及所述第二文本确定所述第一文本的目标语义信息;
根据所述目标语义信息确定所述第一文本对应的第二用户意图。
2.根据权利要求1所述的方法,其特征在于,所述基于所述第一文本及所述第二文本,根据预设意图匹配关系匹配所述第一文本对应的第一用户意图,包括:
对所述第一文本及所述第二文本进行实体抽取,得到待匹配实体词;
根据所述预设意图匹配关系匹配所述待匹配实体词对应的意图类别,所述预设意图匹配关系包括实体词与用户意图的对应关系;
在所述待匹配实体词未匹配到对应的意图类别的情况下,所述第一文本未匹配到所述第一用户意图。
3.根据权利要求1所述的方法,其特征在于,所述基于所述第一文本及所述第二文本,根据预设意图匹配关系匹配所述第一文本对应的第一用户意图,包括:
对所述第一文本及所述第二文本进行实体抽取,得到多个待匹配实体词;
将每两个所述待匹配实体词进行组合,得到多组待匹配实体词组;
根据所述预设意图匹配关系匹配每组所述待匹配实体词组对应的意图类别,所述预设意图匹配关系包括实体词组与用户意图的对应关系;
在每组所述待匹配实体词组均未匹配到对应的意图类别的情况下,所述第一文本未匹配到所述第一用户意图。
4.根据权利要求2所述的方法,其特征在于,所述根据预设意图匹配关系匹配所述第一文本对应的第一用户意图之前,还包括:
基于预先确定的构建规则确定目标实体词以及所述目标实体词对应的意图类别;
基于所述目标实体词与所述目标实体词对应的意图类别得到所述预设意图匹配关系。
5.根据权利要求4所述的方法,其特征在于,所述基于预先确定的构建规则确定目标实体词,包括:
获取所述对话系统中的历史对话文本;
统计所述历史对话文本中各个实体词的出现频次,将出现频次满足预设条件的实体词确定为所述目标实体词。
6.根据权利要求4所述的方法,其特征在于,所述基于预先确定的构建规则确定目标实体词,包括:
获取所述意图识别模型识别错误的历史对话文本;
对所述识别错误的历史对话文本进行实体抽取,得到所述目标实体词。
7.根据权利要求1所述的方法,其特征在于,所述通过意图识别模型,根据所述第一文本及所述第二文本确定所述第一文本的目标语义信息,包括:
所述意图识别模型用于计算所述第一文本和所述第二文本对应的相关性权重,并基于所述相关性权重确定所述第一文本的上文语义信息,根据所述第一文本和所述上文语义信息得到所述第一文本的目标语义信息。
8.一种意图识别装置,其特征在于,应用于对话系统,所述装置包括:
文本获取模块,用于获取当前待识别的第一文本,以及获取第二文本,所述第二文本为所述当前待识别第一文本之前预设时间内的对话文本;
意图匹配模块,用于基于所述第一文本及所述第二文本,根据预设意图匹配关系匹配所述第一文本对应的第一用户意图,所述预设意图匹配关系包括文本与用户意图的对应关系;
模型处理模块,用于若所述第一文本未匹配到所述第一用户意图,则通过意图识别模型,根据所述第一文本及所述第二文本确定所述第一文本的目标语义信息;
意图确定模块,用于根据所述目标语义信息确定所述第一文本对应的第二用户意图。
9.一种电子设备,其特征在于,包括处理器、存储器,所述存储器存储有计算机程序,所述处理器通过调用所述计算机程序,用于执行如权利要求1至7任一项所述的意图识别方法。
10.一种计算机可读存储介质,其特征在于,所述存储介质中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或指令集由处理器加载并执行以实现如权利要求1至7任一项所述的方法。
11.一种包含指令的计算机程序产品,其特征在于,所述计算机程序产品中存储有指令,当其在计算机上运行时,使得计算机实现如权利要求1至7任一项所述的方法。
CN202210303606.7A 2022-03-24 2022-03-24 意图识别方法、装置、电子设备及存储介质 Pending CN114706945A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210303606.7A CN114706945A (zh) 2022-03-24 2022-03-24 意图识别方法、装置、电子设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210303606.7A CN114706945A (zh) 2022-03-24 2022-03-24 意图识别方法、装置、电子设备及存储介质

Publications (1)

Publication Number Publication Date
CN114706945A true CN114706945A (zh) 2022-07-05

Family

ID=82170257

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210303606.7A Pending CN114706945A (zh) 2022-03-24 2022-03-24 意图识别方法、装置、电子设备及存储介质

Country Status (1)

Country Link
CN (1) CN114706945A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115168593A (zh) * 2022-09-05 2022-10-11 深圳爱莫科技有限公司 一种可自我学习的智能对话管理系统、方法及处理设备
CN117196035A (zh) * 2023-08-31 2023-12-08 摩尔线程智能科技(北京)有限责任公司 回复内容的处理方法、装置、电子设备及存储介质
WO2024093403A1 (zh) * 2022-11-03 2024-05-10 支付宝(杭州)信息技术有限公司 一种意图识别方法、装置、设备及可读存储介质

Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3469592A2 (en) * 2016-06-13 2019-04-17 Microsoft Technology Licensing LLC Intent recognition and emotional text-to-speech learning system
CN109657232A (zh) * 2018-11-16 2019-04-19 北京九狐时代智能科技有限公司 一种意图识别方法
CN110096570A (zh) * 2019-04-09 2019-08-06 苏宁易购集团股份有限公司 一种应用于智能客服机器人的意图识别方法及装置
CN110413882A (zh) * 2019-07-15 2019-11-05 阿里巴巴集团控股有限公司 信息推送方法、装置及设备
WO2020009297A1 (ko) * 2018-07-05 2020-01-09 미디어젠 주식회사 도메인 추출기반의 언어 이해 성능 향상장치및 성능 향상방법
CN112836521A (zh) * 2020-12-23 2021-05-25 平安普惠企业管理有限公司 问答匹配方法、装置、计算机设备及存储介质
CN113239702A (zh) * 2021-05-12 2021-08-10 北京三快在线科技有限公司 意图识别方法、装置、电子设备
CN113342179A (zh) * 2021-05-26 2021-09-03 北京百度网讯科技有限公司 输入文本的处理方法、装置、电子设备和存储介质
CN113672696A (zh) * 2021-07-08 2021-11-19 浙江一山智慧医疗研究有限公司 意图识别方法、装置、计算机设备和计算机可读存储介质
CN113722457A (zh) * 2021-08-11 2021-11-30 北京零秒科技有限公司 意图识别方法以及装置、存储介质、电子装置
CN113901837A (zh) * 2021-10-19 2022-01-07 斑马网络技术有限公司 一种意图理解方法、装置、设备及存储介质

Patent Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3469592A2 (en) * 2016-06-13 2019-04-17 Microsoft Technology Licensing LLC Intent recognition and emotional text-to-speech learning system
WO2020009297A1 (ko) * 2018-07-05 2020-01-09 미디어젠 주식회사 도메인 추출기반의 언어 이해 성능 향상장치및 성능 향상방법
CN109657232A (zh) * 2018-11-16 2019-04-19 北京九狐时代智能科技有限公司 一种意图识别方法
CN110096570A (zh) * 2019-04-09 2019-08-06 苏宁易购集团股份有限公司 一种应用于智能客服机器人的意图识别方法及装置
CN110413882A (zh) * 2019-07-15 2019-11-05 阿里巴巴集团控股有限公司 信息推送方法、装置及设备
CN112836521A (zh) * 2020-12-23 2021-05-25 平安普惠企业管理有限公司 问答匹配方法、装置、计算机设备及存储介质
CN113239702A (zh) * 2021-05-12 2021-08-10 北京三快在线科技有限公司 意图识别方法、装置、电子设备
CN113342179A (zh) * 2021-05-26 2021-09-03 北京百度网讯科技有限公司 输入文本的处理方法、装置、电子设备和存储介质
CN113672696A (zh) * 2021-07-08 2021-11-19 浙江一山智慧医疗研究有限公司 意图识别方法、装置、计算机设备和计算机可读存储介质
CN113722457A (zh) * 2021-08-11 2021-11-30 北京零秒科技有限公司 意图识别方法以及装置、存储介质、电子装置
CN113901837A (zh) * 2021-10-19 2022-01-07 斑马网络技术有限公司 一种意图理解方法、装置、设备及存储介质

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115168593A (zh) * 2022-09-05 2022-10-11 深圳爱莫科技有限公司 一种可自我学习的智能对话管理系统、方法及处理设备
WO2024093403A1 (zh) * 2022-11-03 2024-05-10 支付宝(杭州)信息技术有限公司 一种意图识别方法、装置、设备及可读存储介质
CN117196035A (zh) * 2023-08-31 2023-12-08 摩尔线程智能科技(北京)有限责任公司 回复内容的处理方法、装置、电子设备及存储介质

Similar Documents

Publication Publication Date Title
CN114357973B (zh) 意图识别方法、装置、电子设备及存储介质
CN114706945A (zh) 意图识别方法、装置、电子设备及存储介质
CN112733042B (zh) 推荐信息的生成方法、相关装置及计算机程序产品
CN111241237A (zh) 一种基于运维业务的智能问答数据处理方法及装置
EP4310695A1 (en) Data processing method and apparatus, computer device, and storage medium
CN110765294B (zh) 图像搜索方法、装置、终端设备及存储介质
CN111611358A (zh) 信息交互方法、装置、电子设备及存储介质
CN114003682A (zh) 一种文本分类方法、装置、设备及存储介质
CN111444321B (zh) 问答方法、装置、电子设备和存储介质
CN113111264B (zh) 界面内容显示方法、装置、电子设备及存储介质
CN114138960A (zh) 用户意图识别方法、装置、设备及介质
CN111858966B (zh) 知识图谱的更新方法、装置、终端设备及可读存储介质
CN116522905B (zh) 文本纠错方法、装置、设备、可读存储介质及程序产品
CN113111658A (zh) 校验信息的方法、装置、设备和存储介质
CN116204624A (zh) 应答方法、装置、电子设备及存储介质
CN113010664B (zh) 一种数据处理方法、装置及计算机设备
CN114492306A (zh) 语料标注方法、装置、电子设备及存储介质
CN112487236A (zh) 确定关联歌单的方法、装置、设备及存储介质
CN113807920A (zh) 基于人工智能的产品推荐方法、装置、设备及存储介质
CN111552850A (zh) 类型确定方法及装置、电子设备和计算机可读存储介质
CN113535940A (zh) 事件摘要生成方法、装置及电子设备
CN113505293B (zh) 信息推送方法、装置、电子设备及存储介质
CN114139031B (zh) 数据分类方法、装置、电子设备及存储介质
CN114579740B (zh) 文本分类方法、装置、电子设备及存储介质
CN114490996B (zh) 意图识别方法、装置、计算机设备和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination