CN113642334B - 意图识别方法、装置、电子设备和存储介质 - Google Patents
意图识别方法、装置、电子设备和存储介质 Download PDFInfo
- Publication number
- CN113642334B CN113642334B CN202110920122.2A CN202110920122A CN113642334B CN 113642334 B CN113642334 B CN 113642334B CN 202110920122 A CN202110920122 A CN 202110920122A CN 113642334 B CN113642334 B CN 113642334B
- Authority
- CN
- China
- Prior art keywords
- text
- intention
- text segment
- candidate
- combination
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 65
- 239000012634 fragment Substances 0.000 claims abstract description 64
- 238000007689 inspection Methods 0.000 claims description 48
- 238000004590 computer program Methods 0.000 claims description 11
- 238000004458 analytical method Methods 0.000 abstract description 15
- 230000007547 defect Effects 0.000 abstract description 6
- 230000014509 gene expression Effects 0.000 description 17
- 230000003993 interaction Effects 0.000 description 9
- 230000006854 communication Effects 0.000 description 8
- 238000004891 communication Methods 0.000 description 6
- 238000010586 diagram Methods 0.000 description 6
- 239000003795 chemical substances by application Substances 0.000 description 5
- 230000000694 effects Effects 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 2
- 238000012015 optical character recognition Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000013518 transcription Methods 0.000 description 2
- 230000035897 transcription Effects 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- 241000590419 Polygonia interrogationis Species 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000001960 triggered effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
- G06F40/35—Discourse or dialogue representation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0281—Customer communication at a business location, e.g. providing product or service information, consulting
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Business, Economics & Management (AREA)
- Health & Medical Sciences (AREA)
- Strategic Management (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- Finance (AREA)
- Development Economics (AREA)
- General Physics & Mathematics (AREA)
- Accounting & Taxation (AREA)
- Multimedia (AREA)
- Acoustics & Sound (AREA)
- Human Computer Interaction (AREA)
- General Engineering & Computer Science (AREA)
- Entrepreneurship & Innovation (AREA)
- General Health & Medical Sciences (AREA)
- Game Theory and Decision Science (AREA)
- Artificial Intelligence (AREA)
- Economics (AREA)
- Marketing (AREA)
- General Business, Economics & Management (AREA)
- Machine Translation (AREA)
Abstract
本发明提供一种意图识别方法、装置、电子设备和存储介质,其中方法包括:确定待识别文本;对所述待识别文本进行片段划分,得到多个文本片段;对各个文本片段以及各个文本片段组合分别进行意图识别,得到所述待识别文本的意图识别结果;所述文本片段组合是多个连续文本片段的组合。本发明通过对待识别文本进行片段划分,使得每个文本片段仅表达一个意图,随后对各个文本片段以及各个文本片段组合分别进行意图识别,实现对每个可能完整表达一个意图的文本单位进行单独的意图识别,提高了意图识别的准确性和全面性,且克服了关键词模型存在的关键词难以枚举、泛化能力较差的缺陷,提高了文本语义分析的准确性。
Description
技术领域
本发明涉及自然语言处理技术领域,尤其涉及一种意图识别方法、装置、电子设备和存储介质。
背景技术
随着互联网的发展,为用户的交互提供了很大便捷。对交互过程中产生的文本进行分析,确定用户表达的语义,从而对交互过程中产生的违规表达进行提醒,成为了提高交互准确性的重要手段。例如在客服场景,对坐席与客户沟通过程中产生的文本进行分析,可以在坐席违规的时候及时发现问题并快速阻断提醒。
对于待分析的文本,目前通常采用关键词模型对该文本进行分析,根据各个关键词的匹配结果,确定该文本所表达的语义信息,从而判断该文本中是否包含违规表达。然而,由于关键词无法枚举,因此利用关键词模型进行文本语义分析的泛化能力较差,容易遗漏文本中的语义信息,从而漏检违规表达。
发明内容
本发明提供一种意图识别方法、装置、电子设备和存储介质,用以解决现有技术中语义分析的泛化能力较差,容易遗漏文本中的语义信息的缺陷。
本发明提供一种意图识别方法,包括:
确定待识别文本;
对所述待识别文本进行片段划分,得到多个文本片段;
对各个文本片段以及各个文本片段组合分别进行意图识别,得到所述待识别文本的意图识别结果;所述文本片段组合是多个连续文本片段的组合。
根据本发明提供的一种意图识别方法,所述对各个文本片段以及各个文本片段组合分别进行意图识别,得到所述待识别文本的意图识别结果,包括:
对所述各个文本片段以及所述各个文本片段组合分别进行意图识别,得到所述各个文本片段以及所述各个文本片段组合对应的候选意图,以及所述候选意图的得分;
基于所述各个文本片段以及所述各个文本片段所属文本片段组合对应的候选意图和所述候选意图的得分,确定所述意图识别结果。
根据本发明提供的一种意图识别方法,所述基于所述各个文本片段以及所述各个文本片段所属文本片段组合对应的候选意图和所述候选意图的得分,确定所述意图识别结果,包括:
确定任一文本片段所属文本片段组合对应的候选意图不一致,和/或,任一文本片段所属文本片段组合对应的候选意图与所述任一文本片段对应的候选意图不一致,则确定其中得分最高的候选意图为所述任一文本片段对应的意图;
基于所述各个文本片段对应的意图,确定所述意图识别结果。
根据本发明提供的一种意图识别方法,所述基于所述各个文本片段以及所述各个文本片段所属文本片段组合对应的候选意图和所述候选意图的得分,确定所述意图识别结果,包括:
按得分由高到低的顺序遍历各个候选意图;
确定当前候选意图对应的文本片段或文本片段组合与所述意图识别结果中已有意图对应的文本片段或文本片段组合有重叠,则删除所述当前候选意图;否则,将所述当前候选意图加入到所述意图识别结果中。
根据本发明提供的一种意图识别方法,所述对所述各个文本片段以及所述各个文本片段组合分别进行意图识别,得到所述各个文本片段以及所述各个文本片段组合对应的候选意图,包括:
将任一文本片段或任一文本片段组合与各个样本意图文本进行匹配,得到所述任一文本片段或所述任一文本片段组合与所述各个样本意图文本的相关程度;
基于所述任一文本片段或所述任一文本片段组合与所述各个样本意图文本的相关程度,以及所述各个样本意图文本对应的意图,确定所述任一文本片段或所述任一文本片段组合对应的候选意图。
根据本发明提供的一种意图识别方法,所述对各个文本片段以及各个文本片段组合分别进行意图识别,得到所述待识别文本的意图识别结果,之后包括:
基于所述待识别文本的意图识别结果,对所述待识别文本进行质检,得到所述待识别文本的语义质检结果。
根据本发明提供的一种意图识别方法,所述文本片段组合是两个或三个连续文本片段的组合。
本发明还提供一种意图识别装置,包括:
文本确定单元,用于确定待识别文本;
文本划分单元,用于对所述待识别文本进行片段划分,得到多个文本片段;
意图识别单元,用于对各个文本片段以及各个文本片段组合分别进行意图识别,得到所述待识别文本的意图识别结果;所述文本片段组合是多个连续文本片段的组合。
本发明还提供一种电子设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如上述任一种所述意图识别方法的步骤。
本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如上述任一种所述意图识别方法的步骤。
本发明提供的意图识别方法、装置、电子设备和存储介质,通过对待识别文本进行片段划分,使得每个文本片段仅表达一个意图,随后对各个文本片段以及各个文本片段组合分别进行意图识别,实现对每个可能完整表达一个意图的文本单位进行单独的意图识别,提高了意图识别的准确性和全面性,此外,利用上述意图识别的方式对待识别文本进行语义分析,克服了关键词模型存在的关键词难以枚举、泛化能力较差的缺陷,提高了文本语义分析的准确性。
附图说明
为了更清楚地说明本发明或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明提供的意图识别方法的流程示意图;
图2为本发明提供的意图识别结果确定方法的流程示意图;
图3为本发明提供的意图识别冲突解决方法的流程示意图;
图4为本发明提供的候选意图确定方法的流程示意图;
图5为本发明提供的语义质检方法的流程示意图;
图6为本发明提供的意图确定方法的流程示意图;
图7为本发明提供的意图识别装置的结构示意图;
图8为本发明提供的意图识别系统的结构示意图;
图9为本发明提供的电子设备的结构示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合本发明中的附图,对本发明中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
对交互过程中产生的文本进行分析,确定用户表达的语义,从而对交互过程中产生的违规表达进行提醒,成为了提高交互准确性的重要手段。例如在客服场景,对坐席与客户沟通过程中产生的文本进行分析,可以在坐席违规的时候及时发现问题并快速阻断提醒。
对于待分析的文本,目前通常采用关键词模型对该文本进行分析,根据各个关键词或关键词组合的匹配结果,确定该文本所表达的语义信息,从而判断该文本中是否包含违规表达。然而,关键词建模需要尽可能多的枚举关键词,需要考虑到应用场景下表达的广泛性,建模难度较大,且由于关键词无法枚举,因此利用关键词模型进行文本语义分析的泛化能力较差,容易遗漏文本中的语义信息,从而漏检违规表达。
对此,本发明实施例提供了一种意图识别方法,以提高文本语义分析的准确性。图1为本发明实施例提供的意图识别方法的流程示意图,如图1所示,该方法包括:
步骤110,确定待识别文本。
此处,待识别文本为需要进行意图识别以确定语义的文本。该待识别文本可以为用户直接输入的文本,也可以是通过对用户输入的语音数据进行语音识别后得到的文本,还可以为应用OCR(Optical Character Recognition,光学字符识别)等文字识别技术对用户输入的图像进行文字识别得到的文本,本发明实施例对此不作具体限定。例如,在客服场景下,可以采集坐席与客户交互过程中的实时音频数据,对该实时音频数据进行语音识别,将语音识别得到的实时转写文本作为待识别文本。
步骤120,对待识别文本进行片段划分,得到多个文本片段。
此处,考虑到一段长度较长的文本中可能表达多个意图,若对该文本整体进行意图识别,容易遗漏部分意图。因此,当待识别文本较长,例如长度超过预设长度(如20个字)时,为了将表达的多个意图均准确识别出来,可以对待识别文本进行片段划分,得到多个长度较短的文本片段,使得每一个文本片段仅表达一个意图。其中,片段划分的粒度可以根据实际应用场景进行设定,例如口头表达较多的场景下,可以将片段划分的粒度设置得较大,使得划分出的文本片段的长度较长。例如,可以根据待识别文本中的标点符号进行片段划分,如按照句末标点符号(如句号、问号等)进行划分,或按照句内标点符号(如逗号、顿号等)进行划分。
步骤130,对各个文本片段以及各个文本片段组合分别进行意图识别,得到待识别文本的意图识别结果;文本片段组合是多个连续文本片段的组合。
此处,由于语言表达存在不确定性,单个文本片段可能可以完整表达一个意图,也有可能需要与其他文本片段组合之后共同表达一个意图。若某一文本片段需和其他文本片段组合后才能完整表达一个意图,单独对该文本片段进行意图识别得到的结果准确性可能欠佳。因此,为了提高意图识别的准确性,可以对各个文本片段以及各个文本片段组合分别进行意图识别,得到待识别文本的意图识别结果。其中,意图识别结果中包含该待识别文本中表达的意图。例如,在客服场景下,待识别文本中表达的意图可以包括“用户需求调研”和“产品营销”等。
文本片段组合是多个连续文本片段的组合,且组合的连续文本片段数量可以有多种。例如,各个文本片段组合均由固定数量个连续文本片段组合而成,如均由两个连续文本片段组合而成;也可以由不同数量的连续文本片段组合而成,如既包括由两个连续文本片段组合而成的文本片段组合,还包括由三个连续文本片段组合而成的文本片段组合。
此处,可以根据当前待识别文本的语言表达环境下完整表达一个意图时所需的语句长度,以及片段划分的粒度,设定文本片段组合中包含的连续文本片段的最大数量。例如,在客服场景中,坐席与客户用中文进行沟通时,通常用一句话或连续两句话即可清楚表达自己的意图,因此,当以句为单位划分文本片段时,可以设定文本片段组合中包含的连续文本片段的最大数量为2。
在本发明实施例中,对每个可能完整表达一个意图的文本单位(文本片段以及文本片段组合)均进行了单独的意图识别,可以准确地将待识别文本中可能表达的所有意图均识别出来,提高了意图识别的准确性和全面性。此外,利用意图识别的方式对待识别文本进行语义分析,克服了关键词模型存在的关键词难以枚举、泛化能力较差的缺陷,提高了文本语义分析的准确性,有助于提高下游任务,例如语义质检任务的准确性。
本发明实施例提供的方法,通过对待识别文本进行片段划分,使得每个文本片段仅表达一个意图,随后对各个文本片段以及各个文本片段组合分别进行意图识别,实现对每个可能完整表达一个意图的文本单位进行单独的意图识别,提高了意图识别的准确性和全面性,此外,利用上述意图识别的方式对待识别文本进行语义分析,克服了关键词模型存在的关键词难以枚举、泛化能力较差的缺陷,提高了文本语义分析的准确性。
基于上述实施例,文本片段组合是两个或三个连续文本片段的组合。
此处,考虑到划分后得到的单个文本片段可能不完整,需要与其他文本片段组合起来共同表达一个意图,因此,为了对每个可能完整表达一个意图的文本单位进行单独的意图识别,可以对若干个连续文本片段进行组合。其中,在组合文本片段时,一方面可以考虑组合而成的文本片段组合是否足以完整表达一个意图,另一方面还可以考虑组合而成的文本片段组合的长度不应过长,而导致文本片段组合中包含过多意图,从而造成意图识别效果欠佳。对此,在对实际应用场景的语言表达环境进行分析后,发现大多数语言表达环境下,两到三个文本片段足以完整表达一个意图,且两到三个文本片段组合后的文本长度不会过长,有助于优化意图识别任务的效果。因此,可以设定文本片段组合是两个连续文本片段的组合或是三个连续文本片段的组合。需要说明的是,各个文本片段组合中,可以既包含两个连续文本片段的组合,又包含三个连续文本片段的组合。
基于上述任一实施例,图2为本发明实施例提供的意图识别结果确定方法的流程示意图,如图2所示,步骤130包括:
步骤131,对各个文本片段以及各个文本片段组合分别进行意图识别,得到各个文本片段以及各个文本片段组合对应的候选意图,以及候选意图的得分;
步骤132,基于各个文本片段以及各个文本片段所属文本片段组合对应的候选意图和候选意图的得分,确定意图识别结果。
此处,对任一文本片段或任一文本片段组合分别进行意图识别,可以得到该文本片段或该文本片段组合对应的候选意图,以及候选意图的得分。其中,任一文本片段或任一文本片段组合对应的候选意图为该文本片段或该文本片段组合可能表达的意图,候选意图的得分则为该文本片段或该文本片段组合表达该候选意图的可能性。
其中,对于同一个文本片段,其自身会单独进行意图识别,得到对应的候选意图,并且该文本片段还会与其相邻的其他文本片段共同进行意图识别,并得到另一个候选意图。因此,该文本片段对应的候选意图可能会与该文本片段所属的文本片段组合对应的候选意图不一致。例如文本片段Ai对应的候选意图为A,文本片段组合AiAi+1对应的候选意图为B,且A≠B。考虑到一个文本片段仅能表达一个意图,因此当一个文本片段命中不同的候选意图时,需要进行冲突解决。此时,可以根据各个文本片段以及各个文本片段所属文本片段组合对应的候选意图的得分,对步骤311中获得的所有候选意图进行筛选,解决同一文本片段命中不同候选意图的冲突,从而确定整个待识别文本的意图识别结果。
本发明实施例提供的方法,根据各个文本片段以及各个文本片段所属文本片段组合对应的候选意图和候选意图的得分,确定意图识别结果,可以解决同一文本片段命中不同候选意图的冲突,进一步提高了意图识别的准确性。
基于上述任一实施例,步骤132包括:
确定任一文本片段所属文本片段组合对应的候选意图不一致,和/或,任一文本片段所属文本片段组合对应的候选意图与该文本片段对应的候选意图不一致,则确定其中得分最高的候选意图为该文本片段对应的意图;
基于各个文本片段对应的意图,确定意图识别结果。
此处,对于任一文本片段,若判断得知该文本片段所属文本片段组合对应的候选意图不一致,和/或,该文本片段所属文本片段组合对应的候选意图与该文本片段对应的候选意图不一致,则需要进行冲突解决。此时,可以从该文本片段命中的多个不同候选意图中选取得分最高的候选意图为该文本片段对应的意图。
例如,假设文本片段Ai对应的候选意图为A,文本片段组合Ai-1Ai对应的候选意图为B,文本片段组合AiAi+1对应的候选意图为C。若候选意图A、B和C中至少两个候选意图不一致,则可以根据不一致的候选意图的得分,选取得分最高的候选意图作为文本片段Ai对应的意图。
对各个文本片段对应的意图进行整合,可以得到整个待识别文本的意图识别结果。其中,可以对各个文本片段对应的意图进行去重和合并,得到最终的意图识别结果。
基于上述任一实施例,步骤132包括:
按得分由高到低的顺序遍历各个候选意图;
确定当前候选意图对应的文本片段或文本片段组合与意图识别结果中已有意图对应的文本片段或文本片段组合有重叠,则删除当前候选意图;否则,将当前候选意图加入到意图识别结果中。
此处,如图3所示,可以将各个候选意图按各自的得分由高到低进行排序,然后依次遍历各个候选意图。若当前候选意图对应的文本片段或文本片段组合与意图识别结果中已有意图对应的文本片段或文本片段组合有重叠,表明当前候选意图与意图识别结果中已有的意图存在冲突,且当前候选意图的得分较低。因此,为了解决冲突,可以删除该当前候选意图。若当前候选意图对应的文本片段或文本片段组合与意图识别结果中已有意图对应的文本片段和文本片段组合均不重叠,则可以直接将当前候选意图加入到意图识别结果中。
基于上述任一实施例,图4为本发明实施例提供的候选意图确定方法的流程示意图,如图4所示,步骤131中,对各个文本片段以及各个文本片段组合分别进行意图识别,得到各个文本片段以及各个文本片段组合对应的候选意图,包括:
步骤1311,将任一文本片段或任一文本片段组合与各个样本意图文本进行匹配,得到该文本片段或该文本片段组合与各个样本意图文本的相关程度;
步骤1312,基于该文本片段或该文本片段组合与各个样本意图文本的相关程度,以及各个样本意图文本对应的意图,确定该文本片段或该文本片段组合对应的候选意图。
此处,为了提高意图识别的效率,可以预先构建意图识别知识库。该意图识别知识库中可以包含实际应用场景下可能存在的各种意图,以及各种意图对应的样本意图文本。其中,样本意图文本为表达对应意图的语句。任一意图可以对应多个不同的样本意图文本,且同一意图对应的样本意图文本越全面,意图识别的准确性越高。
在进行意图识别时,可以将任一文本片段或任一文本片段组合与各个意图对应的各个样本意图文本进行匹配,得到该文本片段或该文本片段组合与各个样本意图文本的相关程度。其中,该文本片段或该文本片段组合与任一样本意图文本的相关程度越高,表明该文本片段或该文本片段组合与该样本意图文本越相似,二者表达的意图越有可能相同。因此,可以基于该文本片段或该文本片段组合与各个样本意图文本的相关程度,以及各个样本意图文本对应的意图,确定该文本片段或该文本片段组合对应的候选意图。此处,可以选取相关程度最高且相关程度高于预设阈值的样本意图文本对应的意图,作为该文本片段或该文本片段组合对应的候选意图。
基于上述任一实施例,步骤130之后还包括:
基于待识别文本的意图识别结果,对待识别文本进行质检,得到待识别文本的语义质检结果。
此处,得到待识别文本的意图识别结果后,可以根据该意图识别结果对待识别文本进行质检,判断待识别文本的语义表达是否符合规范,从而得到语义质检结果。其中,语义质检结果可以包括质检通过或不通过,在质检不通过的情况下,还可以包括待识别文本中不符合规范的具体位置。若语义质检结果为质检不通过,还可以通过语音或弹出气泡等方式进行提醒。
在质检之前,可以根据实际应用场景的需求,预先设置质检规则,然后根据该质检规则对待识别文本进行质检。例如,可以设置若干个违反规范的样本意图,定义不符合规范情况下样本意图的逻辑关系,如样本意图A AND样本意图B,或,样本意图A OR样本意图B,并确定质检规则为若意图识别结果包含满足上述逻辑关系的意图,则质检不通过。此外,还可以设置符合规范的样本意图,定义符合规范情况下样本意图的逻辑关系,如样本意图A AND样本意图B,或,样本意图A OR样本意图B,并确定质检规则为若意图识别结果不包含满足上述逻辑关系的意图,则质检不通过。
在部分质检场景中,可能还需要检测待识别文本中是否出现了某些特定的关键词。例如,在涉及某一具体产品的营销过程中,需要检测坐席在与客户沟通过程中,是否针对该具体产品进行了产品营销。此种情形下,可以预先设置样本关键词和样本意图,定义符合规范或不符合规范情况下样本关键词与样本意图之间的逻辑关系,并确定相应的质检规则。随后,基于待识别文本及其意图识别结果,或者基于待识别文本的历史文本,以及待识别文本及其意图识别结果,利用上述质检规则进行质检。
例如,可以定义符合规范情况下样本关键词“录音笔”与样本意图“产品营销”之间的逻辑关系为:“录音笔”AND“产品营销”。若待识别文本或待识别文本的历史文本中存在样本关键词“录音笔”并且意图识别结果中包含样本意图“产品营销”,则质检通过,否则质检不通过。
需要说明的是,上述确定质检规则的方式可以结合使用,例如,可以设置样本关键词和样本意图,定义符合规范或不符合规范情况下样本关键词与样本意图之间的逻辑关系,以及样本意图之间的逻辑关系,并确定相应的质检规则。
本发明实施例提供的方法,根据上述意图识别方式得到的意图识别结果,对待识别文本进行质检,得到待识别文本的语义质检结果,提高了文本语义分析的准确性,从而提高了语义质检的准确性。
基于上述任一实施例,图5为本发明实施例提供的语义质检方法的流程示意图,如图5所示,该方法包括:
获取待识别文本。以客服场景为例,可以采集坐席和客户交互过程中的实时音频,并对音频数据进行实时语音识别,生成转写的文本。假设A1、A2、A3、…、An是坐席或者客户多段实时音频的转写文本,由于采用了实时语音识别方式,因此可以在一段实时音频转写完成后即开始意图识别和语义质检。此处,可以将当前转写得到的转写文本Ai作为当前的待识别文本进行意图识别和语义质检。
对待识别文本进行意图识别。此处,可以预先构建意图识别知识库。该意图识别知识库中可以包含实际应用场景下可能存在的各种意图,以及各种意图对应的样本意图文本。其中,任一意图可以对应多个不同的样本意图文本。通过计算待识别文本与样本意图文本之间的语义相似度,确定待识别文本的意图识别结果。
然而,当待识别文本长度较长(例如超过20字)时,其可能表达了多个意图。此时直接整句进行语义相似度计算以识别意图的效果不佳。因此,可以对待识别文本进行片段划分,得到多个文本片段,以保证每个文本片段仅表达一个意图。此处,可以按照标点符号(如逗号、句号或问号等)进行长句拆分。假设将待识别文本Ai拆分成为多个文本片段Ai1,Ai2,…Aim,其中m为文本片段的数量。当待识别文本长度较短时,可以直接对其进行意图识别,计算其与样本意图文本之间的语义相似度,从而确定待识别文本的意图识别结果。
由于单个文本片段可能可以完整表达一个意图,也有可能需要与其他文本片段组合之后共同表达一个意图。若某一文本片段需和其他文本片段组合后才能完整表达一个意图,单独对该文本片段进行意图识别得到的结果准确性可能欠佳。因此,为了提高意图识别的准确性,可以对各个文本片段以及各个文本片段组合分别进行意图识别,得到待识别文本的意图识别结果。其中,文本片段组合中包含的连续文本片段数量可以有多种。此处,可以根据当前待识别文本的语言表达环境下完整表达一个意图时所需的语句长度,以及片段划分的粒度,设定文本片段组合中包含的连续文本片段的最大数量。例如在中文表达环境下,通常用一句话或连续两句话即可清楚表达自己的意图,因此,当以句为单位划分文本片段时,可以设定文本片段组合中包含的连续文本片段的最大数量为2。
对每个可能完整表达一个意图的文本单位(各个文本片段以及各个文本片段组合)均进行了单独的意图识别,可以准确地将待识别文本中可能表达的所有意图均识别出来,提高了意图识别的准确性和全面性。
具体在意图识别时,将任一文本片段或任一文本片段组合与各个意图对应的各个样本意图文本进行匹配,得到该文本片段或该文本片段组合与各个样本意图文本的相关程度。基于该文本片段或该文本片段组合与各个样本意图文本的相关程度,以及各个样本意图文本对应的意图,确定该文本片段或该文本片段组合对应的候选意图。
如图6所示,假设有m个文本片段以及m-1个相邻两个文本片段构成的文本片段组合需要进行意图识别。此处可以开启多个线程进行并发处理,以提升意图识别效率。所有文本片段和文本片段组合均完成意图识别后,输出对应2m-1个候选意图和得分。
对于同一个文本片段,其自身会单独进行意图识别,得到对应的候选意图,并且该文本片段还会与其相邻的其他文本片段共同进行意图识别,并得到另一个候选意图。当一个文本片段命中不同的候选意图时,需要进行冲突解决。此时,可以根据各个文本片段以及各个文本片段所属文本片段组合对应的候选意图的得分,对所有候选意图进行筛选,解决同一文本片段命中不同候选意图的冲突,从而确定整个待识别文本的意图识别结果。其中,可以采用上述实施例中给出的冲突解决方式解决同一文本片段命中不同候选意图的冲突,在此不再赘述。
随后,可以基于待识别文本的意图识别结果,或,基于待识别文本及其意图识别结果,或,基于待识别文本的历史文本,以及待识别文本及其意图识别结果,对待识别文本进行质检,得到待识别文本的语义质检结果。其中,在客服场景下,待识别文本Ai的历史文本可以为之前采集的坐席的实时音频对应的转写文本,如A1、A2、…、Ai-1。
若语义质检结果为质检不通过,还可以触发提醒操作,以语音或弹出气泡的方式进行提醒。
基于上述任一实施例,图7为本发明实施例提供的意图识别装置的结构示意图,如图7所示,该装置包括:文本确定单元710、文本划分单元720和意图识别单元730。
其中,文本确定单元710用于确定待识别文本;
文本划分单元720用于对待识别文本进行片段划分,得到多个文本片段;
意图识别单元730用于对各个文本片段以及各个文本片段组合分别进行意图识别,得到待识别文本的意图识别结果;文本片段组合是多个连续文本片段的组合。
本发明实施例提供的装置,通过对待识别文本进行片段划分,使得每个文本片段仅表达一个意图,随后对各个文本片段以及各个文本片段组合分别进行意图识别,实现对每个可能完整表达一个意图的文本单位进行单独的意图识别,提高了意图识别的准确性和全面性,此外,利用上述意图识别的方式对待识别文本进行语义分析,克服了关键词模型存在的关键词难以枚举、泛化能力较差的缺陷,提高了文本语义分析的准确性。
基于上述任一实施例,文本片段组合是两个或三个连续文本片段的组合。
基于上述任一实施例,意图识别单元730用于:
对各个文本片段以及各个文本片段组合分别进行意图识别,得到各个文本片段以及各个文本片段组合对应的候选意图,以及候选意图的得分;
基于各个文本片段以及各个文本片段所属文本片段组合对应的候选意图和候选意图的得分,确定意图识别结果。
本发明实施例提供的装置,根据各个文本片段以及各个文本片段所属文本片段组合对应的候选意图和候选意图的得分,确定意图识别结果,可以解决同一文本片段命中不同候选意图的冲突,进一步提高了意图识别的准确性。
基于上述任一实施例,基于各个文本片段以及各个文本片段所属文本片段组合对应的候选意图和候选意图的得分,确定意图识别结果,包括:
确定任一文本片段所属文本片段组合对应的候选意图不一致,和/或,任一文本片段所属文本片段组合对应的候选意图与该文本片段对应的候选意图不一致,则确定其中得分最高的候选意图为该文本片段对应的意图;
基于各个文本片段对应的意图,确定意图识别结果。
基于上述任一实施例,基于各个文本片段以及各个文本片段所属文本片段组合对应的候选意图和候选意图的得分,确定意图识别结果,包括:
按得分由高到低的顺序遍历各个候选意图;
确定当前候选意图对应的文本片段或文本片段组合与意图识别结果中已有意图对应的文本片段或文本片段组合有重叠,则删除当前候选意图;否则,将当前候选意图加入到意图识别结果中。
基于上述任一实施例,对各个文本片段以及各个文本片段组合分别进行意图识别,得到各个文本片段以及各个文本片段组合对应的候选意图,包括:
将任一文本片段或任一文本片段组合与各个样本意图文本进行匹配,得到该文本片段或该文本片段组合与各个样本意图文本的相关程度;
基于该文本片段或该文本片段组合与各个样本意图文本的相关程度,以及各个样本意图文本对应的意图,确定该文本片段或该文本片段组合对应的候选意图。
基于上述任一实施例,该装置还包括语义质检单元,语义质检单元用于:
基于待识别文本的意图识别结果,对待识别文本进行质检,得到待识别文本的语义质检结果。
本发明实施例提供的装置,根据上述意图识别方式得到的意图识别结果,对待识别文本进行质检,得到待识别文本的语义质检结果,提高了文本语义分析的准确性,从而提高了语义质检的准确性。
基于上述任一实施例,图8为本发明实施例提供的意图识别系统的结构示意图,如图8所示,该系统包括:存储器810、处理器820、音频采集模块830、语音识别模块840。
其中,存储器810中存储有可在处理器820上运行的计算机程序;
音频采集模块830用于采集待检测的实时音频;
语音识别模块840用于对实时音频进行语音识别,得到待识别文本;
处理器用于执行上述程序以实现如上述任一实施例提供的意图识别方法的步骤。
图9示例了一种电子设备的实体结构示意图,如图9所示,该电子设备可以包括:处理器(processor)910、通信接口(Communications Interface)920、存储器(memory)930和通信总线940,其中,处理器910,通信接口920,存储器930通过通信总线940完成相互间的通信。处理器910可以调用存储器930中的逻辑指令,以执行意图识别方法,该方法包括:确定待识别文本;对所述待识别文本进行片段划分,得到多个文本片段;对各个文本片段以及各个文本片段组合分别进行意图识别,得到所述待识别文本的意图识别结果;所述文本片段组合是多个连续文本片段的组合。
此外,上述的存储器930中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
另一方面,本发明还提供一种计算机程序产品,所述计算机程序产品包括存储在非暂态计算机可读存储介质上的计算机程序,所述计算机程序包括程序指令,当所述程序指令被计算机执行时,计算机能够执行上述各方法所提供的意图识别方法,该方法包括:确定待识别文本;对所述待识别文本进行片段划分,得到多个文本片段;对各个文本片段以及各个文本片段组合分别进行意图识别,得到所述待识别文本的意图识别结果;所述文本片段组合是多个连续文本片段的组合。
又一方面,本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现以执行上述各提供的意图识别方法,该方法包括:确定待识别文本;对所述待识别文本进行片段划分,得到多个文本片段;对各个文本片段以及各个文本片段组合分别进行意图识别,得到所述待识别文本的意图识别结果;所述文本片段组合是多个连续文本片段的组合。
以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
Claims (8)
1.一种意图识别方法,其特征在于,包括:
确定待识别文本;
对所述待识别文本进行片段划分,得到多个文本片段;
对各个文本片段以及各个文本片段组合分别进行意图识别,得到所述待识别文本的意图识别结果;所述文本片段组合是多个连续文本片段的组合;
所述对各个文本片段以及各个文本片段组合分别进行意图识别,得到所述待识别文本的意图识别结果,包括:
对所述各个文本片段以及所述各个文本片段组合分别进行意图识别,得到所述各个文本片段以及所述各个文本片段组合对应的候选意图,以及所述候选意图的得分;
基于所述各个文本片段以及所述各个文本片段所属文本片段组合对应的候选意图和所述候选意图的得分,确定所述意图识别结果;
所述基于所述各个文本片段以及所述各个文本片段所属文本片段组合对应的候选意图和所述候选意图的得分,确定所述意图识别结果,包括:
确定任一文本片段所属文本片段组合对应的候选意图不一致,和/或,任一文本片段所属文本片段组合对应的候选意图与所述任一文本片段对应的候选意图不一致,则确定其中得分最高的候选意图为所述任一文本片段对应的意图;
基于所述各个文本片段对应的意图,确定所述意图识别结果。
2.根据权利要求1所述的意图识别方法,其特征在于,所述基于所述各个文本片段以及所述各个文本片段所属文本片段组合对应的候选意图和所述候选意图的得分,确定所述意图识别结果,包括:
按得分由高到低的顺序遍历各个候选意图;
确定当前候选意图对应的文本片段或文本片段组合与所述意图识别结果中已有意图对应的文本片段或文本片段组合有重叠,则删除所述当前候选意图;否则,将所述当前候选意图加入到所述意图识别结果中。
3.根据权利要求1所述的意图识别方法,其特征在于,所述对所述各个文本片段以及所述各个文本片段组合分别进行意图识别,得到所述各个文本片段以及所述各个文本片段组合对应的候选意图,包括:
将任一文本片段或任一文本片段组合与各个样本意图文本进行匹配,得到所述任一文本片段或所述任一文本片段组合与所述各个样本意图文本的相关程度;
基于所述任一文本片段或所述任一文本片段组合与所述各个样本意图文本的相关程度,以及所述各个样本意图文本对应的意图,确定所述任一文本片段或所述任一文本片段组合对应的候选意图。
4.根据权利要求1至3任一项所述的意图识别方法,其特征在于,所述对各个文本片段以及各个文本片段组合分别进行意图识别,得到所述待识别文本的意图识别结果,之后包括:
基于所述待识别文本的意图识别结果,对所述待识别文本进行质检,得到所述待识别文本的语义质检结果。
5.根据权利要求1至3任一项所述的意图识别方法,其特征在于,所述文本片段组合是两个或三个连续文本片段的组合。
6.一种意图识别装置,其特征在于,包括:
文本确定单元,用于确定待识别文本;
文本划分单元,用于对所述待识别文本进行片段划分,得到多个文本片段;
意图识别单元,用于对各个文本片段以及各个文本片段组合分别进行意图识别,得到所述待识别文本的意图识别结果;所述文本片段组合是多个连续文本片段的组合;
所述对各个文本片段以及各个文本片段组合分别进行意图识别,得到所述待识别文本的意图识别结果,包括:
对所述各个文本片段以及所述各个文本片段组合分别进行意图识别,得到所述各个文本片段以及所述各个文本片段组合对应的候选意图,以及所述候选意图的得分;
基于所述各个文本片段以及所述各个文本片段所属文本片段组合对应的候选意图和所述候选意图的得分,确定所述意图识别结果;
所述基于所述各个文本片段以及所述各个文本片段所属文本片段组合对应的候选意图和所述候选意图的得分,确定所述意图识别结果,包括:
确定任一文本片段所属文本片段组合对应的候选意图不一致,和/或,任一文本片段所属文本片段组合对应的候选意图与所述任一文本片段对应的候选意图不一致,则确定其中得分最高的候选意图为所述任一文本片段对应的意图;
基于所述各个文本片段对应的意图,确定所述意图识别结果。
7.一种电子设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1至5任一项所述意图识别方法的步骤。
8.一种非暂态计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至5任一项所述意图识别方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110920122.2A CN113642334B (zh) | 2021-08-11 | 2021-08-11 | 意图识别方法、装置、电子设备和存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110920122.2A CN113642334B (zh) | 2021-08-11 | 2021-08-11 | 意图识别方法、装置、电子设备和存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113642334A CN113642334A (zh) | 2021-11-12 |
CN113642334B true CN113642334B (zh) | 2023-12-05 |
Family
ID=78420842
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110920122.2A Active CN113642334B (zh) | 2021-08-11 | 2021-08-11 | 意图识别方法、装置、电子设备和存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113642334B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116052646B (zh) * | 2023-03-06 | 2023-06-09 | 北京水滴科技集团有限公司 | 语音识别方法、装置、存储介质和计算机设备 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111737989A (zh) * | 2020-06-24 | 2020-10-02 | 深圳前海微众银行股份有限公司 | 一种意图识别方法、装置、设备及存储介质 |
CN112037819A (zh) * | 2020-09-03 | 2020-12-04 | 阳光保险集团股份有限公司 | 一种基于语义的语音质检方法和装置 |
CN112949297A (zh) * | 2021-02-25 | 2021-06-11 | 深圳追一科技有限公司 | 意图识别方法、装置、计算机设备和计算机可读存储介质 |
WO2021135548A1 (zh) * | 2020-06-05 | 2021-07-08 | 平安科技(深圳)有限公司 | 语音的意图识别方法、装置、计算机设备及存储介质 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10489438B2 (en) * | 2016-05-19 | 2019-11-26 | Conduent Business Services, Llc | Method and system for data processing for text classification of a target domain |
-
2021
- 2021-08-11 CN CN202110920122.2A patent/CN113642334B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2021135548A1 (zh) * | 2020-06-05 | 2021-07-08 | 平安科技(深圳)有限公司 | 语音的意图识别方法、装置、计算机设备及存储介质 |
CN111737989A (zh) * | 2020-06-24 | 2020-10-02 | 深圳前海微众银行股份有限公司 | 一种意图识别方法、装置、设备及存储介质 |
CN112037819A (zh) * | 2020-09-03 | 2020-12-04 | 阳光保险集团股份有限公司 | 一种基于语义的语音质检方法和装置 |
CN112949297A (zh) * | 2021-02-25 | 2021-06-11 | 深圳追一科技有限公司 | 意图识别方法、装置、计算机设备和计算机可读存储介质 |
Non-Patent Citations (2)
Title |
---|
Human-Computer text conversation through NLP in Tamil using Intent Recognition;Udhayakumar Shanmugam et al.;《 2019 International Conference on Vision Towards Emerging Trends in Communication and Networking (ViTECoN)》;全文 * |
基于多模态信息融合的语音意图理解方法;郑彬彬;贾珈;蔡莲红;;中国科技论文在线(07);全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN113642334A (zh) | 2021-11-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110196901B (zh) | 对话系统的构建方法、装置、计算机设备和存储介质 | |
JP6007088B2 (ja) | 大量のコメント文章を用いた質問回答プログラム、サーバ及び方法 | |
KR102256240B1 (ko) | 논팩토이드형 질의 응답 시스템 및 방법 | |
JP7164701B2 (ja) | セマンティックテキストデータをタグとマッチングさせる方法、装置、及び命令を格納するコンピュータ読み取り可能な記憶媒体 | |
CN104503998B (zh) | 针对用户查询句的类型识别方法及装置 | |
KR101498331B1 (ko) | 텍스트 세그먼트를 가진 문서로부터 용어를 추출하기 위한 시스템 | |
US9436681B1 (en) | Natural language translation techniques | |
CN108829682B (zh) | 计算机可读存储介质、智能问答方法及智能问答装置 | |
CN107423440B (zh) | 一种基于情感分析的问答上下文切换与强化选择方法 | |
CN112487140A (zh) | 问答对话评测方法、装置、设备及存储介质 | |
US9772991B2 (en) | Text extraction | |
Hassan Awadallah et al. | Characterizing and predicting voice query reformulation | |
CN109101551B (zh) | 一种问答知识库的构建方法及装置 | |
CN111639484A (zh) | 坐席通话内容的分析方法 | |
CN113626573B (zh) | 一种销售会话异议及应对提取方法及系统 | |
Beleveslis et al. | A hybrid method for sentiment analysis of election related tweets | |
US20220365956A1 (en) | Method and apparatus for generating patent summary information, and electronic device and medium | |
CN113642334B (zh) | 意图识别方法、装置、电子设备和存储介质 | |
CN112562736A (zh) | 一种语音数据集质量评估方法和装置 | |
CN109800430B (zh) | 一种语义理解方法及系统 | |
CN111062832A (zh) | 智能提供专利答辩意见的辅助分析方法及装置 | |
CN111309288A (zh) | 适用于银行业务的软件需求规格文件的分析方法及装置 | |
CN112115237B (zh) | 烟草科技文献数据推荐模型的构建方法及装置 | |
JP2005202924A (ja) | 対訳判断装置、方法及びプログラム | |
Chandramouli et al. | Unsupervised paradigm for information extraction from transcripts using BERT |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |