CN112380853B - 业务场景交互方法、装置、终端设备及存储介质 - Google Patents
业务场景交互方法、装置、终端设备及存储介质 Download PDFInfo
- Publication number
- CN112380853B CN112380853B CN202011280225.9A CN202011280225A CN112380853B CN 112380853 B CN112380853 B CN 112380853B CN 202011280225 A CN202011280225 A CN 202011280225A CN 112380853 B CN112380853 B CN 112380853B
- Authority
- CN
- China
- Prior art keywords
- word segmentation
- word
- text
- information
- model
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000003993 interaction Effects 0.000 title claims abstract description 47
- 238000000034 method Methods 0.000 title claims abstract description 42
- 230000011218 segmentation Effects 0.000 claims abstract description 182
- 238000000605 extraction Methods 0.000 claims abstract description 65
- 238000012545 processing Methods 0.000 claims abstract description 41
- 238000013145 classification model Methods 0.000 claims abstract description 40
- 239000013598 vector Substances 0.000 claims description 27
- 238000004590 computer program Methods 0.000 claims description 15
- 238000004140 cleaning Methods 0.000 claims description 5
- 230000008569 process Effects 0.000 claims description 5
- 238000013473 artificial intelligence Methods 0.000 abstract description 2
- 238000010586 diagram Methods 0.000 description 11
- 239000000284 extract Substances 0.000 description 6
- 230000006870 function Effects 0.000 description 4
- 230000009286 beneficial effect Effects 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 238000003491 array Methods 0.000 description 1
- 238000012790 confirmation Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 230000005611 electricity Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 239000012634 fragment Substances 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000012549 training Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/284—Lexical analysis, e.g. tokenisation or collocates
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/3332—Query translation
- G06F16/3335—Syntactic pre-processing, e.g. stopword elimination, stemming
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
- G06F40/295—Named entity recognition
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- General Health & Medical Sciences (AREA)
- Machine Translation (AREA)
Abstract
本申请适用于人工智能技术领域,提供了一种业务场景交互方法、装置、终端设备及存储介质,方法包括:基于用户的确定指令,确定当前与业务场景对应的分词模型、词嵌入模型、分类模型和实体抽取模型;利用分词模型对用户输入的文本信息进行分词,得到分词表示;依次利用词嵌入模型和分类模型对分词表示进行处理,得到意图识别结果;利用实体抽取模型对分词表示进行实体词抽取,得到目标实体词;根据预先配置的多个业务信息、目标实体词以及意图识别结果,确定回复信息并采用回复信息与用户进行交互。采用上述方法组成业务场景下对应的匹配模板与用户进行交互,可解决为每个业务配置一个固定的业务模板,使业务模板后期难以维护的问题。
Description
技术领域
本申请属于人工智能技术领域,尤其涉及一种业务场景交互方法、装置、终端设备及存储介质。
背景技术
随着自然语言处理技术的不断发展,任务型对话在各个场景中得到了很大的应用,如:智慧客服、智能导购,实体机器人等应用场景。然而,任务型对话要想提供服务必须要利用多轮自然语言理解技术。现有技术中,多轮对话方式的扩展性低,随着业务范围扩大,所需要编写的语言处理模板自然越来越多,模板之间人工编写的规则更容易造成冲突。因此,将使得今后的模板变得难以维护,并且当业务量到达一定程度时,基于模板的多轮对话系统将产生无法支撑业务进一步与用户进行交互的问题。
发明内容
本申请实施例提供了一种业务场景交互方法、装置、终端设备及存储介质,可以解决当业务量到达一定程度时,基于模板的多轮对话系统产生无法支撑业务进一步与用户进行交互的问题。
第一方面,本申请实施例提供了一种业务场景交互方法,包括:
基于用户的确定指令,确定当前的业务场景以及与所述业务场景对应的匹配模板,所述匹配模板包括分词模型的模板、词嵌入模型的模板、分类模型的模板和实体抽取模型的模板;
利用所述分词模型对用户输入的文本信息进行分词,得到所述文本信息的分词表示;
依次利用所述词嵌入模型和所述分类模型对所述分词表示进行处理,得到意图识别结果;以及,
利用所述实体抽取模型对所述分词表示进行实体词抽取,得到目标实体词;
根据所述业务场景中预先配置的多个业务信息、所述目标实体词以及所述意图识别结果,从所述多个业务信息中确定回复信息并采用所述回复信息与所述用户进行交互。
在一实施例中,所述基于用户的确定指令,确定当前的业务场景以及与所述业务场景对应的匹配模板中,包括:
根据用户的确定指令,从多个初始实体抽取模型中确定目标实体抽取模型,并使用所述目标实体抽取模型替换所述匹配模板中已有的实体抽取模型,所述目标实体抽取模型至少包括一个。
在一实施例中,所述利用所述分词模型对用户输入的文本信息进行分词,得到所述文本信息的分词表示,包括:
利用所述分词模型对所述文本信息进行分词处理,得到多个文本分词;
确定所述多个文本分词分别在所述文本信息中的分词位置信息,并将所述分词位置信息分别作为所述多个文本分词的分词表示。
在一实施例中,所述利用所述分词模型对所述文本信息进行分词处理,得到多个文本分词,包括:
对所述文本信息进行数据清洗,得到清洗后的目标文本信息;
基于预设的分词库中包含的文本分词,采用正向最大匹配算法对所述目标文本信息进行分词匹配,得到所述多个文本分词。
在一实施例中,所述文本分词至少包括一个字符;
所述确定所述多个文本分词分别在所述文本信息中的分词位置信息,并将所述分词位置信息分别作为所述多个文本分词的分词表示,包括:
确定所述多个文本分词中,多个字符分别在所述文本信息中的字符位置信息;
若目标文本分词中只有一个字符,则将所述字符的字符位置信息作为所述目标文本分词的分词表示;
若所述目标文本分词中具有两个及以上的字符,则将所述目标文本分词中的第一个字符的字符位置信息,以及最后一个字符的字符位置信息,作为所述目标文本分词的分词表示,所述目标文本分词为所述多个文本分词中的任意一个文本分词。
在一实施例中,所述依次利用所述词嵌入模型和所述分类模型对所述分词表示进行处理,得到意图识别结果,包括:
利用所述词嵌入模型对所述分词表示进行特征处理,得到所述分词表示分别对应的词向量;
输入所述词向量至所述分类模型进行意图识别预测,得到所述分类模型预测用户意图分别属于多个意图类别的分类概率;
从多个分类概率中确定目标分类概率,并将所述目标分类概率对应的所述意图类别作为所述意图识别结果。
在一实施例中,所述根据所述业务场景中预先配置的多个业务信息、所述目标实体词以及所述意图识别结果,从所述多个业务信息中确定回复信息并采用所述回复信息与所述用户进行交互,包括:
若判定所述目标实体词符合当前业务信息的输入规则,则存储所述目标实体词,并将所述当前业务信息标记为已完成的业务信息;
从所述多个业务信息中查询标记为未完成的业务信息,并根据所述未完成的业务信息确定所述回复信息并采用所述回复信息与所述用户进行交互。
第二方面,本申请实施例提供了一种业务场景交互装置,包括:
确定模块,用于基于用户的确定指令,确定当前的业务场景以及与所述业务场景对应的匹配模板,所述匹配模板包括分词模型的模板、词嵌入模型的模板、分类模型的模板和实体抽取模型的模板;
分词模块,用于利用所述分词模型对用户输入的文本信息进行分词,得到所述文本信息的分词表示;
处理模块,用于依次利用所述词嵌入模型和所述分类模型对所述分词表示进行处理,得到意图识别结果;以及,
实体抽取模块,用于利用所述实体抽取模型对所述分词表示进行实体词抽取,得到目标实体词;
交互模块,用于根据所述业务场景中预先配置的多个业务信息、所述目标实体词以及所述意图识别结果,从所述多个业务信息中确定回复信息并采用所述回复信息与所述用户进行交互。
第三方面,本申请实施例提供了一种终端设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如上述第一方面任一项所述的方法。
第四方面,本申请实施例提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现如上述第一方面任一项所述的方法。
第五方面,本申请实施例提供了一种计算机程序产品,当计算机程序产品在终端设备上运行时,使得终端设备执行上述第一方面中任一项所述的方法。
在本实施例中,通过使用预先设置的分词模型、词嵌入模型、分类模型和实体抽取模型,组成每个业务场景下对应的匹配模板。之后,使用匹配模板对用户输入的文本信息进行识别,并从文本信息中确定目标实体词,结合识别到的意图识别结果以及该业务场景下的多个业务信息,有助于提高终端设备准确确定下一轮与用户进行交互的回复信息,实现人机对话的多轮交互。另外,使用各个独立模板的业务模型,使其可根据不同的业务需求选择独立模板进行匹配,进而可快速生成符合业务需求的业务模板,且不用为每个业务配置一个固定模板,解决了业务模板后期难以维护的问题。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本申请一实施例提供的一种业务场景交互方法的实现流程图;
图2是本申请一实施例提供的业务场景交互方法中的应用场景示意图;
图3是本申请一实施例提供的一种业务场景交互方法的S102的一种实现方式示意图;
图4是本申请一实施例提供的一种业务场景交互方法的S1021的一种实现方式示意图;
图5是本申请一实施例提供的一种业务场景交互方法的S1022的一种实现方式示意图;
图6是本申请一实施例提供的一种业务场景交互方法的S103的一种实现方式示意图;
图7是本申请一实施例提供的一种业务场景交互方法的S105的一种实现方式示意图;
图8是本申请实施例提供的一种业务场景交互装置的结构框图;
图9是本申请实施例提供的一种终端设备的结构框图。
具体实施方式
以下描述中,为了说明而不是为了限定,提出了诸如特定系统结构、技术之类的具体细节,以便透彻理解本申请实施例。然而,本领域的技术人员应当清楚,在没有这些具体细节的其它实施例中也可以实现本申请。在其它情况中,省略对众所周知的系统、装置、电路以及方法的详细说明,以免不必要的细节妨碍本申请的描述。
应当理解,当在本申请说明书和所附权利要求书中使用时,术语“包括”指示所描述特征、整体、步骤、操作、元素和/或组件的存在,但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。
另外,在本申请说明书和所附权利要求书的描述中,术语“第一”、“第二”、“第三”等仅用于区分描述,而不能理解为指示或暗示相对重要性。
本申请实施例提供的业务场景交互方法可以应用于平板电脑、笔记本电脑、超级移动个人计算机(ultra-mobile personal computer,UMPC)等终端设备上,本申请实施例对终端设备的具体类型不作任何限制。
图1示出了本发明实施例提供的业务场景交互方法的实现流程图,详述如下:
S101、基于用户的确定指令,确定当前的业务场景以及与所述业务场景对应的匹配模板,所述匹配模板包括分词模型的模板、词嵌入模型的模板、分类模型的模板和实体抽取模型的模板。
在应用中,终端设备中可包含有多个业务场景,每个业务场景用于提供一种业务服务,该终端设备可作为一种服务型的智慧型客服。在具体实施场景中,终端设备内部存储有多个业务场景可供用户进行选择确定,并根据接收到的用户的确定指令,从多个业务场景中确定当前所需运行的业务场景。需要说明的是,对于一个业务场景,其通常包含了技术人员预先配置的多个可能存在的问题,以及每个问题相对应的答案,以实现人机交互。其中,业务场景包括但不限于人身保险业务场景、健康保险业务场景等。
在应用中,上述匹配模板包括分词模型的模板、词嵌入模型的模板、分类模型的模板和实体抽取模型的模板等多种业务模型的模板,且每个业务模型的模板均为独立模板。因此,可以理解的是,上述匹配模板可以为用户根据实际情况进行组合设置,也可以为终端设备根据当前业务场景选择需要配置的匹配模板。需要补充的是,对于终端设备而言,若需要与用户进行对话沟通,则终端设备需要对用户输入的信息(文本信息)进行分词和词嵌入处理,以使得终端设备可以将文本信息转换为可被理解的向量信息。因此,可认为终端设备在对每个业务场景配置对应的匹配模板时,该匹配模板均需要包括分词模型的模板以及词嵌入模型的模板。
在应用中,上述分类模型为预先根据业务场景进行训练的模型,用于根据输入的文本信息(与业务相关的文本信息)识别用户的意图。训练样本可以为基于每个特定的业务场景中可能存在的多个对话文本,也可以为技术人员专门进行编写的对话文本,对此不作限定。
S102、利用所述分词模型对用户输入的文本信息进行分词,得到所述文本信息的分词表示。
在应用中,上述用户输入的文本信息可以为中文、英文或者数字,也可以为任意多种结合的文本信息。对于非中文的文本信息,可以将该信息翻译为中文的文本信息进行处理。其中,上述分词模型用于对文本信息进行分词处理。示例性的,对文本信息进行分词可以为预先建立分词库,且分词库中包含了中文语言所能使用的所有词语。对于输入的文本信息,可先按照正向最大匹配算法或者逆向最大匹配算法,取出文本信息中的一句或一段字符串,与分词库中的词语进行比较。如果一致,则该段字符串可作为代表一种含义的词语,即为一个分词。如果分词库中没有与之相匹配的词语,则可减少字符串长度(例如,排除字符串中的末尾字符),将剩余文本信息再次与分词库中的词语进行匹配,直到所有的字符串匹配完成,即可得到多个文本分词。
在应用中,上述分词表示可以理解为终端设备对上述多个文本分词进行区分的标识信息。例如,分词表示可以为数字、字母等信息。示例性的,可以使用数字表示每个分词中含有的字符个数、字符在文本信息中的位置信息及内容,对此不作限定。
S103、依次利用所述词嵌入模型和所述分类模型对所述分词表示进行处理,得到意图识别结果。
在应用中,上述词嵌入模型用于对得到分词表示进行特征处理,以使得终端设备可以理解该文本信息。具体的,可预先在终端设备内部设置包含所有分词的词向量库,且每个分词均有对应的位置编号。例如,1,2,...,或者,使用二进制数值(0,1)表示对应的位置编号。具体如图2示意,其“text feature”标识为文本向量,{1,0...,1...0,0,1..}则表示文本信息中具体的词向量。
在应用中,在得到文本信息的词向量后,可将词向量输入至分类模型中,对文本信息进行分类识别,得到意图识别结果。其中,S101中已对分类模型进行解释说明,对此不再详细描述。示例性的,对于文本信息为“我的电话号码是18723456789”的意图识别结果具体可如图2所示。其中,“intent”用于标识意图识别结果,“info”表示为具体的意图识别结果(告知意图),“confidence”:0.9631345表示为预测意图识别结果为“info”的准确率为96.31%。
需要补充的是,上述用户输入的文本信息可以为用户针对该业务场景进行提问的提问信息,也可以为在与终端设备进行对话的过程中,回复终端设备提出问题的告知信息。因此,可以理解的是,可认为对于提问信息,用户的意图为询问;对于回复终端设备提出问题的告知信息,用户的意图为告知。在实际情况中,终端设备可根据从文本信息中识别到的用户意图,可以准确的进行下一步的交互对话。
S104、利用所述实体抽取模型对所述分词表示进行实体词抽取,得到目标实体词。
在应用中,上述实体抽取模型用于抽取文本信息中符合业务场景的实体词汇。即实体抽取模型从该输入的文本信息中抽取到的实体词汇即为终端设备所需要的目标实体词。需要说明的是,一个业务场景通常涵盖有多个问题以及回复的对话场景,且对于每个问题的回复,其所需要抽取的实体词可能各不相同。因此,为了使终端设备能够准确从文本信息中抽取到符合该业务场景中每个问题及回复的实体词汇,可设定每个业务场景对应的匹配模板中,包含至少一个实体抽取模型。对于当前运行的业务场景,可将用户输入的文本信息依次输入多个实体抽取模型中,每次进行目标实体词抽取时,最终抽取到的实体词汇即为符合当前对话问题或回复的目标实体词。需要说明的是,实体抽取模型也具有将分词表示进行向量特征处理的能力,并根据处理后的向量特征进行实体词抽取。或者,实体抽取模型也可基于词嵌入模型对分词表示进行处理后得到的词向量,进行目标实体词抽取,对此不做限定。
S105、根据所述业务场景中预先配置的多个业务信息、所述目标实体词以及所述意图识别结果,从所述多个业务信息中确定回复信息并采用所述回复信息与所述用户进行交互。
在应用中,上述业务场景包括多个业务信息,每个业务信息均有对应交互规则,用于与用户进行交互。示例性的,终端设备在确定用户的意图为为告知意图后,可从输入的文本信息中确定实体词汇(电话号码)即为告知的目标实体词。之后,终端设备可在获取到目标实体词后,与用户进行下一步交互。例如,在确定用户意图为告知意图后,可确定下一回复的业务信息可以为:“请再次确认目标实体词是否有误”。若接收到用户输入的文本信息(确认无误,或者,存在错误),则将文本信息再次进行上述S101-S105方法步骤中的意图识别过程。
在应用中,对于一个业务场景,其可预先设定该业务场景所需完成的多个业务信息。例如,对于询问用户信息(性别、年龄、身份证号码、联系方式)的业务场景。终端设备依照上述方式得到用户的联系方式(目标实体词)后,可对该目标实体词进行存储,并标记该业务信息已完成。之后,终端设备可查询多个业务信息中其余未完成的业务信息,并根据未完成的业务信息确定回复信息。例如,若未完成获取身份证号码的业务信息,则可以回复“请输入身份证号码”,或“您的身份证号码是多少”等回复信息。
在本实施例中,通过使用预先设置的分词模型、词嵌入模型、分类模型和实体抽取模型,组成每个业务场景下对应的匹配模板。之后,使用匹配模板对用户输入的文本信息进行识别,并从文本信息中确定目标实体词,结合识别到的意图识别结果以及该业务场景下的多个业务信息,有助于提高终端设备准确确定下一轮与用户进行交互的回复信息,实现人机对话的多轮交互。另外,使用各个独立模板的业务模型,使其可根据不同的业务需求选择独立模板进行匹配,进而可快速生成符合业务需求的业务模板,且不用为每个业务配置一个固定模板,解决了业务模板后期难以维护的问题。
在一实施例中,步骤S101基于用户的确定指令,确定当前的业务场景以及与所述业务场景对应的匹配模板中,还包括如下子步骤,详述如下:
根据用户的确定指令,从多个初始实体抽取模型中确定目标实体抽取模型,并使用所述目标实体抽取模型替换所述匹配模板中已有的实体抽取模型,所述目标实体抽取模型至少包括一个。
在应用中,上述实体抽取模型可包括抽取地名、时间、人名等实体抽取模型,对此不做限定。需要说明的是,每个实体抽取模型均可以为单独的模板,以便用户可以根据实际的业务信息进行选择和更换。用户在确定当前业务场景后,可以在终端设备内部预先设置的多个实体抽取模型中选择可能用到的一个或多个实体抽取模型作为目标实体抽取模型,更好匹配模板中已有的实体抽取模型。
请参照图2,可以理解的是,对于当前的匹配模板,若同时包含抽取电话号码的实体抽取模型以及抽取时间信息的实体抽取模型,则在将当前文本信息:“我的电话号码是18723456789”输入至匹配模板时,可先将文本信息输入至抽取时间信息的实体抽取模型,以及输入至抽取电话号码的实体抽取模型。此时,基于上述处理,实体抽取模型只可抽取到符合电话号码规则的实体词汇,即“18723456789”为目标实体词。具体如图2所示,“value”表示被抽取电话号码的实体抽取模型抽取到的实体词汇,“entity”用于标识实体抽取类型(电话号码)。
参照图3,在一实施例中,S102利用所述分词模型对用户输入的文本信息进行分词,得到所述文本信息的分词表示,具体包括如下子步骤S1021-S1022,详述如下:
S1021、利用所述分词模型对所述文本信息进行分词处理,得到多个文本分词。
S1022、确定所述多个文本分词分别在所述文本信息中的分词位置信息,并将所述分词位置信息分别作为所述多个文本分词的分词表示。
在应用中,上述对文本信息进行分词处理得到多个文本分词以在S102中进行描述,对此不再进行说明。可以理解的是,在确定每个文本分词后,可确定每个文本分词中每个字符在文本信息中的位置信息。例如,对文本信息中的每个字符从左到右依次进行排序,确定每个字符的位置信息。依次确定每个文本分词中是否具有两个及以上的字符,若确定当前文本分词具有两个及以上的字符,则确定当前文本分词中的第一个字符的位置信息,以及最后一个字符的位置信息,并将其作为当前文本分词的分词表示。
在其他情况中,也可以将当前文本分词中的第一个字符的位置信息之前的位置信息作为分词表示。具体的,请参照图2,对于输入的文本信息“我的电话号码是18723456789”,其文本分词分别为“我的”,“电话号码”,“是”,“18723456789”。可认为文本分词“我的”中“我”为初始位置信息为“1”,其初始位置信息之前的位置信息为“0”,“的”为结束位置信息“2”。因此,该文本分词的分词表示可以为{“我的”,“0”,“2”}。对应的,文本分词“电话号码”中,“电”为第一个字符的初始位置信息“3”,该初始位置信息之前的位置信息为“2”,“码”的为最后一个字符的结束位置信息“6”,因此,其分词表示可以为{“电话号码”,“2”,“6”}。以此,可确定文本分词“18723456789”的分词表示为{“18723456789”,“7”,“18”}。
在应用中,上述文本分词“是”只有一个字符,因此,可将该字符在文本信息中的位置信息“7”作为其分词表示。或者,也可以与上述情况相似,将该字符的位置信息之前的位置信息作为分词表示之一,并以该字符的位置信息作为该文本分词的另一分词表示之一。具体的,请参照图2,其中,“是”的分词表示可以为{“是”,“6”,“7”}。
参照图4,在一实施例中,S1021利用所述分词模型对所述文本信息进行分词处理,得到多个文本分词,具体包括如下子步骤S10211-S10212,详述如下:
S10211、对所述文本信息进行数据清洗,得到清洗后的目标文本信息。
在应用中,上述对文本信息进数据清洗包括但不限于将文本信息中的标点符号进行清除,若输入的为英文文本,则还包括将单词进行分隔,将每个单词作为一个字符进行处理等。
S10212、基于预设的分词库中包含的文本分词,采用正向最大匹配算法对所述目标文本信息进行分词匹配,得到所述多个文本分词。
在应用中,上述分词库可以为业务人员预先配置包含多个文本分词的词库。其中,正向最大匹配算法可以理解为,将输入的文本信息的全部内容作为一个文本分词,与预设分词库中包含的文本分词进行匹配。若匹配成功,则将该文本信息作为一个文本分词。若匹配失败,则去除文本信息中最后一个字符,并将剩余的文本信息作为新的文本分词进行匹配。若再次匹配失败,则重复上述步骤,直至匹配成功。之后,将文本信息中为匹配成功的剩余文本信息作为一个文本分词,重复上述分词匹配的步骤,直至文本信息中所有的字符均生成文本分词。
参照图5,在一实施例中,所述文本分词至少包括一个字符;S1022确定所述多个文本分词分别在所述文本信息中的分词位置信息,并将所述分词位置信息分别作为所述多个文本分词的分词表示,具体包括如下子步骤S10221-S10223,详述如下:
S10221、确定所述多个文本分词中,多个字符分别在所述文本信息中的字符位置信息。
在应用中,上述确定每个字符在文本信息中的字符位置信息已在上述S1022中进行描述,对此不再进行解释说明。
S10222、若目标文本分词中只有一个字符,则将所述字符的字符位置信息作为所述目标文本分词的分词表示。
S10223、若所述目标文本分词中具有两个及以上的字符,则将所述目标文本分词中的第一个字符的字符位置信息,以及最后一个字符的字符位置信息,作为所述目标文本分词的分词表示,所述目标文本分词为所述多个文本分词中的任意一个文本分词。
在应用中,对于只有一个字符的目标文本分词进行分词表示,以及对于包含多个字符的目标文本分词进行分词表示,均在上述S1022中进行解释,且具有具体的示例说明,对此不再进行详细描述。
参照图6,在一实施例中,S103依次利用所述词嵌入模型和所述分类模型对所述分词表示进行处理,得到意图识别结果,具体包括如下子步骤S1031-S1033,详述如下:
S1031、利用所述词嵌入模型对所述分词表示进行特征处理,得到所述分词表示分别对应的词向量。
在应用中,上述特征处理可以为对词向量进行归一化处理或二值化处理,将该文本信息的词向量转为为不含量纲的单位向量,或转换为同一维度的特征向量。因用户每次输入的文本信息均不一致,因此,其相应的词向量特征的维度不一致。为准确识别用户的意图类别,可统一每个文本信息的词向量后,再进行用户意图预测。其中,生成的词向量具体可参照上述S103中的解释说明。
S1032、输入所述词向量至所述分类模型进行意图识别预测,得到所述分类模型预测用户意图分别属于多个意图类别的分类概率。
S1033、从多个分类概率中确定目标分类概率,并将所述目标分类概率对应的所述意图类别作为所述意图识别结果。
在应用中,上述用户意图具有多种类别,因此,上述分类模型可以预测用户意图分别属于多个意图类别的分类概率。此时,上述分类模型可认为是多分类模型,例如,可使用softmax作为分类模型,其可得到用户意图属于每一类意图类别的概率。然而,使用其他分类模型(如sigmoid)只能得到具体属于哪一类用户意图的概率,该分类器更适用于二分类的分类场景。示例性的,可参照图2,其中,“intent rank”表示为意图排名,{“intent”:“info”,“confidence”:0.963}可以理解为分类模型预测用户意图为“告知意图”的概率为96.3%;{“intent”:“greet”,“confidence”:0.011}可以理解为分类模型预测用户意图为“问候”的概率为1.1%。
参照图7,在一实施例中,S105根据所述业务场景中预先配置的多个业务信息、所述目标实体词以及所述意图识别结果,从所述多个业务信息中确定回复信息并采用所述回复信息与所述用户进行交互,具体包括如下子步骤S1051-S1052,详述如下:
S1051、若判定所述目标实体词符合当前业务信息的输入规则,则存储所述目标实体词,并将所述当前业务信息标记为已完成的业务信息。
在应用中,对于不同的业务信息,其对应的输入规则各不相同。可以理解的是,对于询问用户性别与用户联系方式的业务信息,其对应确定的目标实体词则完全不同。例如,对于询问电话号码的业务信息,其目标实体词的输入规则需要为11位数字,且该11位数字生成的电话号码的号码号段,符合移动、通信、电信等电话号码的号段。在判定目标实体词符合当前业务信息的输入规则时,可存储该目标实体词,即表示该业务场景下的当前业务信息已经完成。
S1052、从所述多个业务信息中查询标记为未完成的业务信息,并根据所述未完成的业务信息确定所述回复信息并采用所述回复信息与所述用户进行交互。
在应用中,可以理解的是,对于该业务场景下的当前业务信息已完成后,若该业务场景下还具有其他未完成的业务信息,则终端设备可从未完成的特务信息中确定下一轮对话中的回复信息,与用户进行交互。例如,若未完成获取身份证号码的业务信息,则终端设备可以回复“请输入身份证号码”,或“您的身份证号码是多少”等回复信息,对此不做限定。
在一实施例中,本申请实施例提供一种业务场景交互装置的结构框图。具体的,请参阅图8,图8是本申请实施例提供的一种业务场景交互装置的结构框图。本实施例中业务场景交互装置包括的各模块用于执行图1、图3至图7对应的实施例中的各步骤。具体请参阅图1、图3至图7以及图1、图3至图7所对应的实施例中的相关描述。为了便于说明,仅示出了与本实施例相关的部分。参照图8,业务场景交互装置800包括:确定模块810、分词模块820、处理模块830、实体抽取模块840以及交互模块850,其中:
确定模块810,用于基于用户的确定指令,确定当前的业务场景以及与所述业务场景对应的匹配模板,所述匹配模板包括分词模型、词嵌入模型、分类模型和实体抽取模型。
分词模块820,用于利用所述分词模型对用户输入的文本信息进行分词,得到所述文本信息的分词表示。
处理模块830,用于依次利用所述词嵌入模型和所述分类模型对所述分词表示进行处理,得到意图识别结果。以及,
实体抽取模块840,用于利用所述实体抽取模型对所述分词表示进行实体词抽取,得到目标实体词。
交互模块850,用于根据所述业务场景中预先配置的多个业务信息、所述目标实体词以及所述意图识别结果,从所述多个业务信息中确定回复信息并采用所述回复信息与所述用户进行交互。
在一实施例中,确定模块810还用于:
根据用户的确定指令,从多个初始实体抽取模型中确定目标实体抽取模型,并使用所述目标实体抽取模型替换所述匹配模板中已有的实体抽取模型,所述目标实体抽取模型至少包括一个。
在一实施例中,分词模块820还用于:
利用所述分词模型对所述文本信息进行分词处理,得到多个文本分词;
确定所述多个文本分词分别在所述文本信息中的分词位置信息,并将所述分词位置信息分别作为所述多个文本分词的分词表示。
在一实施例中,分词模块820还用于:
对所述文本信息进行数据清洗,得到清洗后的目标文本信息;
基于预设的分词库中包含的文本分词,采用正向最大匹配算法对所述目标文本信息进行分词匹配,得到所述多个文本分词。
在一实施例中,所述文本分词至少包括一个字符,分词模块820还用于;
确定所述多个文本分词中,多个字符分别在所述文本信息中的字符位置信息;
若目标文本分词中只有一个字符,则将所述字符的字符位置信息作为所述目标文本分词的分词表示;
若所述目标文本分词中具有两个及以上的字符,则将所述目标文本分词中的第一个字符的字符位置信息,以及最后一个字符的字符位置信息,作为所述目标文本分词的分词表示,所述目标文本分词为所述多个文本分词中的任意一个文本分词。
在实施例中,处理模块830还用于:
利用所述词嵌入模型对所述分词表示进行特征处理,得到所述分词表示分别对应的词向量;
输入所述词向量至所述分类模型进行意图识别预测,得到所述分类模型预测用户意图分别属于多个意图类别的分类概率;
从多个分类概率中确定目标分类概率,并将所述目标分类概率对应的所述意图类别作为所述意图识别结果。
在一实施例中,交互模块850还用于:
若判定所述目标实体词符合当前业务信息的输入规则,则存储所述目标实体词,并将所述当前业务信息标记为已完成的业务信息;
从所述多个业务信息中查询标记为未完成的业务信息,并根据所述未完成的业务信息确定所述回复信息并采用所述回复信息与所述用户进行交互。
应当理解的是,图8示出的业务场景交互装置的结构框图中,各单元/模块用于执行图1、图3至图7对应的实施例中的各步骤,而对于图1、图3至图7对应的实施例中的各步骤已在上述实施例中进行详细解释,具体请参阅图1、图3至图7以及图1、图3至图7所对应的实施例中的相关描述,此处不再赘述。
图9是本申请另一实施例提供的一种终端设备的结构框图。如图9所示,该实施例的终端设备90包括:处理器91、存储器92以及存储在存储器92中并可在处理器91运行的计算机程序93,例如业务场景交互方法的程序。处理器91执行计算机程序93时实现上述各个业务场景交互方法各实施例中的步骤,例如图1所示的S101至S105。或者,处理器91执行计算机程序93时实现上述图8对应的实施例中各模块的功能,例如,图8所示的模块810至850的功能,具体请参阅图8对应的实施例中的相关描述。
示例性的,计算机程序93可以被分割成一个或多个单元,一个或者多个单元被存储在存储器92中,并由处理器91执行,以完成本申请。一个或多个单元可以是能够完成特定功能的一系列计算机程序指令段,该指令段用于描述计算机程序93在终端设备90中的执行过程。例如,计算机程序93可以被分割成确定模块、分词模块、处理模块、实体抽取模块以及交互模块,各模块具体功能可参阅图8对应的实施例中的相关描述。
终端设备可包括,但不仅限于,处理器91、存储器92。本领域技术人员可以理解,图9仅仅是终端设备90的示例,并不构成对终端设备90的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件,例如终端设备还可以包括输入输出设备、网络接入设备、总线等。
所称处理器91可以是中央处理单元,还可以是其他通用处理器、数字信号处理器、专用集成电路、现成可编程门阵列或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
存储器92可以是终端设备90的内部存储单元,例如终端设备90的硬盘或内存。存储器92也可以是终端设备90的外部存储设备,例如终端设备90上配备的插接式硬盘,智能存储卡,闪存卡等。进一步地,存储器92还可以既包括终端设备90的内部存储单元也包括外部存储设备。
以上实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围,均应包含在本申请的保护范围之内。
Claims (7)
1.一种业务场景交互方法,其特征在于,包括:
基于用户的确定指令,确定当前的业务场景以及与所述业务场景对应的匹配模板,所述匹配模板包括分词模型的模板、词嵌入模型的模板、分类模型的模板和实体抽取模型的模板;
利用所述分词模型对用户输入的文本信息进行分词,得到所述文本信息的分词表示;
依次利用所述词嵌入模型和所述分类模型对所述分词表示进行处理,得到意图识别结果;以及,
利用所述实体抽取模型对所述分词表示进行实体词抽取,得到目标实体词;
根据所述业务场景中预先配置的多个业务信息、所述目标实体词以及所述意图识别结果,从所述多个业务信息中确定回复信息并采用所述回复信息与所述用户进行交互;
所述利用所述分词模型对用户输入的文本信息进行分词,得到所述文本信息的分词表示,包括:
利用所述分词模型对所述文本信息进行分词处理,得到多个文本分词;确定所述多个文本分词分别在所述文本信息中的分词位置信息,并将所述分词位置信息分别作为所述多个文本分词的分词表示;所述文本分词至少包括一个字符,所述分词表示为数字表示,用于表征每个所述文本分词中含有的字符个数、所述字符在所述文本信息中的位置信息及内容;
所述确定所述多个文本分词分别在所述文本信息中的分词位置信息,并将所述分词位置信息分别作为所述多个文本分词的分词表示,包括:
确定所述多个文本分词中,多个字符分别在所述文本信息中的字符位置信息;若目标文本分词中只有一个字符,则将所述字符的字符位置信息作为所述目标文本分词的分词表示;若所述目标文本分词中具有两个及以上的字符,则将所述目标文本分词中的第一个字符的字符位置信息,以及最后一个字符的字符位置信息,作为所述目标文本分词的分词表示,所述目标文本分词为所述多个文本分词中的任意一个文本分词;
所述依次利用所述词嵌入模型和所述分类模型对所述分词表示进行处理,得到意图识别结果,包括:
利用所述词嵌入模型对所述分词表示进行特征处理,得到所述分词表示分别对应的词向量;输入所述词向量至所述分类模型进行意图识别预测,得到所述分类模型预测用户意图分别属于多个意图类别的分类概率;从多个分类概率中确定目标分类概率,并将所述目标分类概率对应的所述意图类别作为所述意图识别结果。
2.如权利要求1所述的业务场景交互方法,其特征在于,所述基于用户的确定指令,确定当前的业务场景以及与所述业务场景对应的匹配模板中,包括:
根据用户的确定指令,从多个初始实体抽取模型中确定目标实体抽取模型,并使用所述目标实体抽取模型替换所述匹配模板中已有的实体抽取模型,所述目标实体抽取模型至少包括一个。
3.如权利要求1所述的业务场景交互方法,其特征在于,所述利用所述分词模型对所述文本信息进行分词处理,得到多个文本分词,包括:
对所述文本信息进行数据清洗,得到清洗后的目标文本信息;
基于预设的分词库中包含的文本分词,采用正向最大匹配算法对所述目标文本信息进行分词匹配,得到所述多个文本分词。
4.如权利要求1-3任一所述的业务场景交互方法,其特征在于,所述根据所述业务场景中预先配置的多个业务信息、所述目标实体词以及所述意图识别结果,从所述多个业务信息中确定回复信息并采用所述回复信息与所述用户进行交互,包括:
若判定所述目标实体词符合当前业务信息的输入规则,则存储所述目标实体词,并将所述当前业务信息标记为已完成的业务信息;
从所述多个业务信息中查询标记为未完成的业务信息,并根据所述未完成的业务信息确定所述回复信息并采用所述回复信息与所述用户进行交互。
5.一种业务场景交互装置,其特征在于,包括:
确定模块,用于基于用户的确定指令,确定当前的业务场景以及与所述业务场景对应的匹配模板,所述匹配模板包括分词模型的模板、词嵌入模型的模板、分类模型的模板和实体抽取模型的模板;
分词模块,用于利用所述分词模型对用户输入的文本信息进行分词,得到所述文本信息的分词表示;
处理模块,用于依次利用所述词嵌入模型和所述分类模型对所述分词表示进行处理,得到意图识别结果;以及,
实体抽取模块,用于利用所述实体抽取模型对所述分词表示进行实体词抽取,得到目标实体词;
交互模块,用于根据所述业务场景中预先配置的多个业务信息、所述目标实体词以及所述意图识别结果,从所述多个业务信息中确定回复信息并采用所述回复信息与所述用户进行交互;
所述分词模块还用于:
利用所述分词模型对所述文本信息进行分词处理,得到多个文本分词;确定所述多个文本分词分别在所述文本信息中的分词位置信息,并将所述分词位置信息分别作为所述多个文本分词的分词表示;所述文本分词至少包括一个字符,所述分词表示为数字表示,用于表征每个所述文本分词中含有的字符个数、所述字符在所述文本信息中的位置信息及内容;
以及,还用于:
确定所述多个文本分词中,多个字符分别在所述文本信息中的字符位置信息;若目标文本分词中只有一个字符,则将所述字符的字符位置信息作为所述目标文本分词的分词表示;若所述目标文本分词中具有两个及以上的字符,则将所述目标文本分词中的第一个字符的字符位置信息,以及最后一个字符的字符位置信息,作为所述目标文本分词的分词表示,所述目标文本分词为所述多个文本分词中的任意一个文本分词;
所述处理模块还用于:
利用所述词嵌入模型对所述分词表示进行特征处理,得到所述分词表示分别对应的词向量;输入所述词向量至所述分类模型进行意图识别预测,得到所述分类模型预测用户意图分别属于多个意图类别的分类概率;从多个分类概率中确定目标分类概率,并将所述目标分类概率对应的所述意图类别作为所述意图识别结果。
6.一种终端设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至4任一项所述的方法。
7.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至4任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011280225.9A CN112380853B (zh) | 2020-11-16 | 2020-11-16 | 业务场景交互方法、装置、终端设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011280225.9A CN112380853B (zh) | 2020-11-16 | 2020-11-16 | 业务场景交互方法、装置、终端设备及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112380853A CN112380853A (zh) | 2021-02-19 |
CN112380853B true CN112380853B (zh) | 2024-04-26 |
Family
ID=74584781
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011280225.9A Active CN112380853B (zh) | 2020-11-16 | 2020-11-16 | 业务场景交互方法、装置、终端设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112380853B (zh) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113064980A (zh) * | 2021-03-22 | 2021-07-02 | 苏宁金融科技(南京)有限公司 | 一种智能问答方法、装置、计算机设备及存储介质 |
CN113641731B (zh) * | 2021-08-17 | 2023-05-02 | 成都知道创宇信息技术有限公司 | 模糊搜索优化方法、装置、电子设备和可读存储介质 |
CN113722467B (zh) * | 2021-08-31 | 2024-05-17 | 康键信息技术(深圳)有限公司 | 用户搜索意图的处理方法、系统、装置和存储介质 |
CN116258469B (zh) * | 2023-05-16 | 2023-07-21 | 四川数产范式科技有限公司 | 基于通信软件的业务数据处理方法、系统、设备及介质 |
CN116955592B (zh) * | 2023-07-21 | 2024-02-09 | 广州拓尔思大数据有限公司 | 基于可视化推理结果的数据处理方法及系统 |
CN117271773B (zh) * | 2023-09-26 | 2024-03-12 | 人民法院信息技术服务中心 | 用于庭审的对话场景识别方法、装置、设备和存储介质 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111104495A (zh) * | 2019-11-19 | 2020-05-05 | 深圳追一科技有限公司 | 基于意图识别的信息交互方法、装置、设备和存储介质 |
CN111241237A (zh) * | 2019-12-31 | 2020-06-05 | 中国建设银行股份有限公司 | 一种基于运维业务的智能问答数据处理方法及装置 |
CN111444722A (zh) * | 2020-03-06 | 2020-07-24 | 中国平安人寿保险股份有限公司 | 基于投票决策的意图分类方法、装置、设备及存储介质 |
-
2020
- 2020-11-16 CN CN202011280225.9A patent/CN112380853B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111104495A (zh) * | 2019-11-19 | 2020-05-05 | 深圳追一科技有限公司 | 基于意图识别的信息交互方法、装置、设备和存储介质 |
CN111241237A (zh) * | 2019-12-31 | 2020-06-05 | 中国建设银行股份有限公司 | 一种基于运维业务的智能问答数据处理方法及装置 |
CN111444722A (zh) * | 2020-03-06 | 2020-07-24 | 中国平安人寿保险股份有限公司 | 基于投票决策的意图分类方法、装置、设备及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN112380853A (zh) | 2021-02-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112380853B (zh) | 业务场景交互方法、装置、终端设备及存储介质 | |
CN108920467B (zh) | 多义词词义学习方法及装置、搜索结果显示方法 | |
CN114357973B (zh) | 意图识别方法、装置、电子设备及存储介质 | |
CN111191000B (zh) | 一种智能语音机器人的对话管理方法、装置和系统 | |
CN112507704B (zh) | 多意图识别方法、装置、设备及存储介质 | |
CN111783471B (zh) | 自然语言的语义识别方法、装置、设备及存储介质 | |
CN112633003A (zh) | 一种地址识别方法、装置、计算机设备及存储介质 | |
CN111814482B (zh) | 文本关键数据的提取方法、系统和计算机设备 | |
CN110633475A (zh) | 基于计算机场景的自然语言理解方法、装置、系统和存储介质 | |
CN112560506B (zh) | 文本语义解析方法、装置、终端设备及存储介质 | |
CN112101042A (zh) | 文本情绪识别方法、装置、终端设备和存储介质 | |
CN111695337A (zh) | 智能面试中专业术语的提取方法、装置、设备及介质 | |
CN112632248A (zh) | 问答方法、装置、计算机设备和存储介质 | |
CN115146124A (zh) | 问答系统应答方法及其装置、设备、介质、产品 | |
CN116522905B (zh) | 文本纠错方法、装置、设备、可读存储介质及程序产品 | |
CN111368040A (zh) | 对话处理方法、模型训练方法及其相关设备 | |
CN113609865A (zh) | 文本情感的识别方法、装置、电子设备及可读存储介质 | |
CN112487813A (zh) | 命名实体识别方法及系统、电子设备及存储介质 | |
CN110705258A (zh) | 文本实体识别方法及装置 | |
CN116304008A (zh) | 基于关键词的文本分类方法、装置和计算机设备 | |
CN114398482A (zh) | 一种词典构造方法、装置、电子设备及存储介质 | |
CN115130455A (zh) | 文章处理方法、装置、电子设备以及存储介质 | |
CN111199170B (zh) | 配方文件识别方法及装置、电子设备、存储介质 | |
CN113505293A (zh) | 信息推送方法、装置、电子设备及存储介质 | |
CN113688615A (zh) | 一种字段注释生成、字符串理解方法、设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |