CN111046145B - 交互意图路径的挖掘方法以及装置 - Google Patents

交互意图路径的挖掘方法以及装置 Download PDF

Info

Publication number
CN111046145B
CN111046145B CN201911337912.7A CN201911337912A CN111046145B CN 111046145 B CN111046145 B CN 111046145B CN 201911337912 A CN201911337912 A CN 201911337912A CN 111046145 B CN111046145 B CN 111046145B
Authority
CN
China
Prior art keywords
word
intention
barrel
interaction
paths
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201911337912.7A
Other languages
English (en)
Other versions
CN111046145A (zh
Inventor
严文君
潘岩
高俊鑫
刘磊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alipay Hangzhou Information Technology Co Ltd
Original Assignee
Alipay Hangzhou Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alipay Hangzhou Information Technology Co Ltd filed Critical Alipay Hangzhou Information Technology Co Ltd
Priority to CN201911337912.7A priority Critical patent/CN111046145B/zh
Publication of CN111046145A publication Critical patent/CN111046145A/zh
Application granted granted Critical
Publication of CN111046145B publication Critical patent/CN111046145B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3343Query execution using phonetics
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3344Query execution using natural language analysis
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Computational Linguistics (AREA)
  • General Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Acoustics & Sound (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Human Computer Interaction (AREA)
  • General Health & Medical Sciences (AREA)
  • Multimedia (AREA)
  • Artificial Intelligence (AREA)
  • Machine Translation (AREA)

Abstract

本说明书实施例提供交互意图路径的挖掘方法以及装置,其中所述交互意图路径的挖掘方法包括:获取交互过程中用户输入的用户语音信息对应的文本数据;对所述文本数据中包含的语句进行分词处理,获得所述语句的词单元;将所述词单元依次与多个词桶规则匹配,根据匹配结果提取与所述词桶规则匹配的词桶词单元;按照所述词桶规则的规则顺序对所述词桶词单元进行串联,生成所述语句对应的交互意图路径。

Description

交互意图路径的挖掘方法以及装置
技术领域
本说明书实施例涉及数据处理技术领域,特别涉及一种交互意图路径的挖掘方法。本说明书一个或者多个实施例同时涉及一种交互意图路径的挖掘装置,一种计算设备,以及一种计算机可读存储介质。
背景技术
随着人工智能的发展,智能机器人以更低的成本和更高的产能,进一步地推动了营销业务的发展。然而智能机器人的智能系统的质量极大地取决于知识库对于可能发生的用户提问的覆盖程度,由于每日会从业务场景中新增大量用户的用户语音信息,这些语料可以作为扩充知识库的重要来源。而这些用户语音信息有着严重的同质性,不同的语句可能包含着相同的意图,另一方面,过多冗余语料的引入不利于知识库的构建和维护,因此如何构建以及有效更新知识库成为一个亟待解决的重要问题。
发明内容
有鉴于此,本说明书实施例提供了一种交互意图路径的挖掘方法。本说明书一个或者多个实施例同时涉及一种交互意图路径的挖掘装置,一种计算设备,以及一种计算机可读存储介质,以解决现有技术中存在的技术缺陷。
根据本说明书实施例的第一方面,提供了一种交互意图路径的挖掘方法,包括:
获取交互过程中用户输入的用户语音信息对应的文本数据;
对所述文本数据中包含的语句进行分词处理,获得所述语句的词单元;
将所述词单元依次与多个词桶规则匹配,根据匹配结果提取与所述词桶规则匹配的词桶词单元;
按照所述词桶规则的规则顺序对所述词桶词单元进行串联,生成所述语句对应的交互意图路径。
可选的,所述按照所述词桶规则的规则顺序对所述词桶词单元进行串联,生成所述语句对应的交互意图路径步骤执行之后,还包括:
统计更新周期内生成的全量交互意图路径中各个交互意图路径的频次;
在所述各个交互意图路径中筛选出所述频次大于路径频次阈值的交互意图路径;
针对筛选出的交互意图路径进行去重,将去重后的交互意图路径作为所述更新周期内更新的交互意图路径。
可选的,所述针对筛选出的交互意图路径进行去重,将去重后的交互意图路径作为更新周期内更新的交互意图路径步骤执行之后,还包括:
通过将所述更新周期内更新的交互意图路径中任意一个交互意图路径与意图知识库中的交互意图路径进行对比的方式,判断所述任意一个交互意图路径是否存在于所述意图知识库;
若否,将所述任意一个交互意图路径加入所述意图知识库。
可选的,所述将所述任意一个交互意图路径加入所述意图知识库步骤执行之后,还包括:
获取所述意图知识库中新增的交互意图路径对应的回复信息;
建立所述回复信息与所述新增的交互意图路径的关联关系。
可选的,所述按照所述词桶规则的规则顺序对所述词桶词单元进行串联,生成所述语句对应的交互意图路径步骤执行之后,还包括:
根据所述语句中未与所述词桶规则匹配的词单元,更新词单元频次表。
可选的,所述根据所述语句中未与所述词桶规则匹配的词单元,更新词单元频次表步骤执行之后,还包括:
提取更新周期内所述词单元频次表中频次大于频次阈值的词单元;
将所述频次大于频次阈值的词单元作为新词单元嵌入包含所述新词单元的语句对应的交互意图路径。
可选的,所述将所述词单元作为新词单元嵌入包含所述新词单元的语句对应的交互意图路径步骤执行之后,还包括:
根据所述新词单元创建新词桶规则;
按照所述新词单元的频次从高到低将对应的新词桶规则进行排序,获得新词桶规则的新规则顺序;
将所述新规则顺序嵌入所述规则顺序。
可选的,所述获取交互过程中用户输入的用户语音信息对应的文本数据,包括:
获取交互过程中用户输入的超过一轮交互的用户语音信息;
通过语音识别将所述用户语音信息转化为文本数据。
可选的,所述获取交互过程中用户输入的用户语音信息对应的文本数据步骤执行之后,并所述对所述文本数据中包含的语句进行分词处理,获得所述语句的词单元步骤执行之前,还包括:
根据预设词典对所述文本数据进行修正。
可选的,在所述语句中存在多个与所述多个词桶规则中任一词桶规则匹配的词桶词单元的情况下,相应的,所述按照所述词桶规则的规则顺序对所述词桶词单元进行串联,生成所述语句对应的交互意图路径,包括:
将与所述任一词桶规则匹配的多个词桶词单元按照预设词单元顺序依次连接,组合为组合词桶词单元;
按照所述词桶规则的规则顺序对所述组合词桶词单元以及未组合的词桶词单元进行串联,生成所述语句对应的交互意图路径。
根据本说明书实施例的第二方面,提供了一种交互意图路径的挖掘装置,包括:
获取模块,被配置为获取交互过程中用户输入的用户语音信息对应的文本数据;
分词模块,被配置为对所述文本数据中包含的语句进行分词处理,获得所述语句的词单元;
提取模块,被配置为将所述词单元依次与多个词桶规则匹配,根据匹配结果提取与所述词桶规则匹配的词桶词单元;
生成模块,被配置为按照所述词桶规则的规则顺序对所述词桶词单元进行串联,生成所述语句对应的交互意图路径。
根据本说明书实施例的第三方面,提供了一种计算设备,包括:
存储器和处理器;
所述存储器用于存储计算机可执行指令,所述处理器用于执行所述计算机可执行指令:
获取交互过程中用户输入的用户语音信息对应的文本数据;
对所述文本数据中包含的语句进行分词处理,获得所述语句的词单元;
将所述词单元依次与多个词桶规则匹配,根据匹配结果提取与所述词桶规则匹配的词桶词单元;
按照所述词桶规则的规则顺序对所述词桶词单元进行串联,生成所述语句对应的交互意图路径。
根据本说明书实施例的第四方面,提供了一种计算机可读存储介质,其存储有计算机可执行指令,该指令被处理器执行时实现所述交互意图路径的挖掘方法的步骤。
本说明书一个实施例,通过将交互中用户输入的用户语音信息对应的文本数据中的各个语句进行分词,将分词后获得的词单元依次与预先根据业务需要配置的多个词桶规则匹配,提取各个语句中与各个词桶规则匹配的词桶词单元,实现了引入与业务场景相关的业务词汇规则作为词桶规则,并根据业务场景需要灵活地配置词桶规则,而按照各个词桶规则的规则顺序对所述各个语句中的词桶词单元以及对应的词桶规则进行串联,生成各个语句对应的交互意图路径,实现了通过设置词桶规则的规则顺序,将提取出的词桶词单元的按照规则顺序进行排序,提升了生成的交互意图路径可理解性,并进一步提高了交互意图路径的准确性。
附图说明
图1是本说明书一个实施例提供的一种交互意图路径的挖掘方法的流程图;
图2是本说明书一个实施例提供的一种应用于电销机器人的交互意图路径的挖掘方法的处理流程图;
图3是本说明书一个实施例提供的一种交互意图路径的挖掘装置的结构示意图;
图4是本说明书一个实施例提供的一种计算设备的结构框图。
具体实施方式
在下面的描述中阐述了很多具体细节以便于充分理解本说明书。但是本说明书能够以很多不同于在此描述的其它方式来实施,本领域技术人员可以在不违背本说明书内涵的情况下做类似推广,因此本说明书不受下面公开的具体实施的限制。
在本说明书一个或多个实施例中使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本说明书一个或多个实施例。在本说明书一个或多个实施例和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。还应当理解,本说明书一个或多个实施例中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。
应当理解,尽管在本说明书一个或多个实施例中可能采用术语第一、第二等来描述各种信息,但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如,在不脱离本说明书一个或多个实施例范围的情况下,第一也可以被称为第二,类似地,第二也可以被称为第一。取决于语境,如在此所使用的词语“如果”可以被解释成为“在……时”或“当……时”或“响应于确定”。
在本说明书中,提供了一种交互意图路径的挖掘方法,本说明书一个或者多个实施例同时涉及一种交互意图路径的挖掘装置,一种计算设备,以及一种计算机可读存储介质,在下面的实施例中逐一进行详细说明。
本说明书提供的一种交互意图路径的挖掘方法实施例如下:
图1示出了根据本说明书一个实施例提供的一种交互意图路径的挖掘方法的流程图,包括步骤S102至步骤S108。
步骤S102,获取交互过程中用户输入的用户语音信息对应的文本数据。
实际应用中,在人机交互或智能交互的场景中,需要根据用户的语音信息提供进行交互的回复信息,比如在电销机器人领域、导购或者客服领域等,本说明书实施例以在电销机器人领域的应用为例进行说明,导购、客服领域的具体实现与在电销机器人领域的具体实现类似,参照在电销机器人领域的具体实现即可,在此不再赘述。
所述用户语音信息,可以是在人机交互的过程中用户通过语音工具输入的语音信息,所述交互意图,是指用户在交互过程中通过输入的用户语音信息想要传达的意思,这种交互意图可以用交互意图路径的形式进行表示。
相应的,意图知识库,可以是交互意图路径的集合,具体实施时,可以根据业务场景中业务规则挖掘用户的交互意图路径,将挖掘到的用户的交互意图路径不断地更新到意图知识库,有利于意图知识库的扩充与维护。
所述文本数据,可以是将用户语音信息进行语音识别后的文字信息,具体的,一个文本数据中可以包含用户输入的用户语音信息中一个语句,也可以包括多个语句,在此不做限制。
实际应用中,以电销机器人为例,在电销机器人与用户进行交互过程中,需要通过用户输入的用户语音信息对用户的交互意图路径进行挖掘,将挖掘出的用户的交互意图路径与意图知识库中的交互意图路径进行匹配,进而获得与匹配的交互意图路径对应的回复信息,将对应的回复信息转化为语音信息作为提供给用户的回复,若对用户的交互意图路径挖掘的不准确或者在意图知识库中匹配不到与用户的交互意图路径相似度高的交互意图路径,则会导致提供的回复满足不了用户的需求,因此能不能提供给用户满意的回复很大程度上取决于挖掘到的用户的交互意图路径与意图知识库中交互意图路径的匹配程度,即意图知识库中的交互意图路径能不能尽可能的覆盖用户的交互意图路径。
具体实施时,不需要把所有的用户语音信息进行交互意图路径挖掘,比如交互轮次仅为一轮的语音对话,通常并不具有交互意图路径挖掘的价值,本说明书实施例提供的一种可选实施方式中,获取交互过程中用户输入的用户语音信息对应的文本数据,具体采用如下方式实现:
获取交互过程中用户输入的超过一轮交互的用户语音信息;
通过语音识别将所述用户语音信息转化为文本数据。
实际应用中,若交互过程中只有一个交互轮次,通常表明用户直接拒绝进行后续对话,因此不具有交互意图路径挖掘的价值,而获取超过一轮交互的用户语音信息通常具有实际意义,即具有交互意图路径挖掘的价值,则通过语音识别将超过一轮交互的用户语音信息转换为文本数据。
以电销机器人为例,在电销机器人与用户进行交互过程中,电销机器人通过呼叫用户与用户进行交互,用户输入的第一轮的用户语音信息为:“你好”,电销机器人的回复信息为:“你好,这是某某公司,我们公司正在推出某某产品”,这时候如果用户对这个产品不感兴趣,就会直接拒绝并挂断电话;
如果用户对这个产品感兴趣,则会针对自身感兴趣的内容进行问询,进而输入第二轮的用户语音信息,电销机器人获取用户输入的第二轮用户语音信息,通过语音识别将用户语音信息转化为文本数据,进而针对此文本数据进行交互意图路径挖掘。
本说明书实施例,获取交互过程中超过一轮交互的用户语音信息,并通过语音识别将用户语音信息转换为文本数据,进而根据文本数据进行意图挖掘作为扩充意图知识库的来源使意图知识库的扩充更具实用性,更加贴合业务场景。
具体实施时,获取到的文本数据中可能存在错别字,本说明书实施例提供的一种可选实施方式中,针对文本数据中可能存在的错别字,还需根据预设词典对所述文本数据进行修正,以此提高了文本数据的可靠性,并进一步,可以提高分词的准确性,以及后续生成交互意图路径的准确性。所述预设词典,可以包括工具词典,还可以包括自定义的业务词典,具体实施时,可以将与业务相关的业务词汇:产品、购买、推荐、退货等加入预设词典,通过这些业务词汇对文本数据中的错别字进行修正。
以上述电销机器人为例,获取到的本文数据包含语句:“如果推货的话,多久可以退款?”,将这条语句按照预设词典进行修正,可以将“推货”按照销售业务修正为“退货”,修正后这条语句变为:“如果退货的话,多久可以退款?”
步骤S104,对所述文本数据中包含的语句进行分词处理,获得所述语句的词单元。
具体的,通过使用各种分词工具,对上述获取的文本数据中的语句进行分词,获得语句的词单元,实际应用中,语句的表达方式可能有很多种,但是重要的业务词单元却是固定的,因此可以引入部分业务场景相关的词汇对语句进行分词处理,获得更为贴合业务场景的词单元,可以更好的挖掘用户的交互意图路径。
以上述本文数据中包含的上述语句为例,将“如果退货的话,多久可以退款?”进行分词,分词后获得词单元:“如果”、“退货”、“的”、“话”、“多久”、“可以”、“退款”。
步骤S106,将所述词单元依次与多个词桶规则匹配,根据匹配结果提取与所述词桶规则匹配的词桶词单元。
所述词桶规则,是指承接同一业务场景不同角度的业务规则,通过这些业务规则与上述步骤S104中获得的词单元进行匹配,可以获得与这一业务规则匹配的业务词汇,即词桶词单元,具体的,词桶规则可以是以正则表达式构建的规则。
沿用上例,上述语句“如果退货的话,多久可以退款?”分词后获得的词单元为“如果”、“退货”、“的”、“话”、“多久”、“可以”、“退款”,首先将词单元“如果”依次与词桶规则:规则1、规则2、规则3、规则4进行匹配,其没有与任意词桶规则匹配,接着将词单元“退货”依次与词桶规则:规则1、规则2、规则3、规则4进行匹配,则词单元“退货”与词桶规则1匹配,以此类推,提取出此语句中与规则1匹配的词桶词单元为:“退货”,与规则2匹配的词桶词单元为:“多久”,与规则3匹配的词桶词单元为:“可以”,与规则4匹配的词桶词单元为:“退款”。
步骤S108,按照所述词桶规则的规则顺序对所述词桶词单元进行串联,生成所述语句对应的交互意图路径。
所述词桶规则的规则顺序,可以是根据常规语法顺序预先设定,对与词桶规则对应的词桶词单元进行串联的顺序,实际应用中,上述步骤S104中获得的词单元也可以按照此规则顺序依次与词桶规则进行匹配,提取出与词桶规则匹配的词桶词单元,并按照此规则顺序将这些匹配的词桶词单元进行串联,生成交互意图路径。
此外,还可以根据词桶规则对应的业务词汇的重要程度设置此顺序,越靠前的词桶词单元对于交互意图路径来说越重要,在此不做限制。
具体的,所述串联,是指将与词桶规则匹配的词桶词单元通过特定的符号进行串联,比如,将词桶词单元“退货”与词桶词单元“多久”以符号“_”进行串联,串联后成为:“退货_多久”,此外,还可以通过其他符号进行串联,在此不做限制。
所述交互意图路径,是指通过将词桶词单元串联形成的具有意思表达的意图路径。
沿用上例,将上述语句“如果退货的话,多久可以退款?”中提取出的与规则1匹配的词桶词单元为:“退货”,与规则2匹配的词桶词单元为:“多久”,与规则3匹配的词桶词单元为:“可以”,与规则4匹配的词桶词单元为:“退款”,将这些词桶词单元,按照根据常规语法设定的词桶规则的规则顺序:规则1、规则2、规则3、规则4依次串联,串联后生成此语句的交互意图路径1为:退货_多久_可以_退款。
实际应用中,存在语句中有多个词单元与一个词桶规则匹配的情况,本说明书实施例提供的一种可选实施方式中,在所述语句中存在多个与所述多个词桶规则中任一词桶规则匹配的词桶词单元的情况下,相应的,所述按照所述词桶规则的规则顺序对所述词桶词单元进行串联,生成所述语句对应的交互意图路径,包括:
将与所述任一词桶规则匹配的多个词桶词单元按照预设词单元顺序依次连接,组合为组合词桶词单元;
按照所述词桶规则的规则顺序对所述组合词桶词单元以及未组合的词桶词单元进行串联,生成所述语句对应的交互意图路径。
实际应用中,所述预设词单元顺序,可以按照业务词汇的重要性进行排序。
所述未组合的词桶词单元,是指未作为组合词桶词单元中包含的任一词桶词单元的其他词桶词单元。
以语句“需要自己组装,还是有师傅上门安装?”为例,将此语句进行分词处理后获得的词单元为“需要”、“自己”、“组装”、“还是”、“有”、“师傅”、“上门”、“安装”,词桶规则有规则A、规则B、规则C,与规则A匹配的词桶词单元有两个,分别为“组装”和“安装”,而规则A的预设词单元顺序为安装、组装,则将这两个词桶词单元按照预设词单元顺序依次排列连接作为一个组合词桶词单元:“安装-组装”,与规则B匹配的词桶词单元为:“上门”,与规则C匹配的词桶词单元为:“师傅”,将组合词桶词单元以及未组合的词桶词单元,按照词桶规则顺序:规则A、规则B、规则C的顺序依次串联,串联后生成此语句的交互意图路径为:安装_组装_上门_师傅。
本说明书实施例,在语句中存在多个与多个词桶规则中任一词桶规则匹配的词桶词单元的情况下,将与这任一词桶规则匹配的多个词桶词单元按照预设词单元顺序依次连接,组合为组合词桶词单元,并按照词桶规则的规则顺序对组合词桶词单元以及未组合的词桶词单元进行串联,生成语句对应的交互意图路径,实现了在一个词桶规则中匹配多个词桶词单元,并可以根据业务场景的需要调整词桶规则以及与词桶规则匹配的多个词桶单元的顺序,进一步,优化生成的交互意图路径,使生成的交互意图路径更准确,也更加贴合业务场景。
具体实施时,在针对语句进行分词处理获得的词单元中,除与词桶规则匹配的词桶词单元之外,还包括未与词桶规则匹配的词单元,本说明书实施例提供的一种可选实施方式中,针对语句中未与所述词桶规则匹配的词单元,还需要根据所述语句中未与所述词桶规则匹配的词单元,更新词单元频次表,以此了解未与词桶规则匹配的词单元,以及这些词单元出现的频次,以便根据这些词单元的频次对词单元进行进一步的筛选和处理。
所述词单元频次表,是指统计语句中未与所述词桶规则匹配的词单元,以及这些词单元出现的频次的对应关系表,实际应用中,此词单元频次表,用于统计一个更新周期内出现的未与所述词桶规则匹配的词单元的频次,而这个频次可以显示出对应的词单元的重要性;
具体的,更新周期,是指将挖掘到的交互意图路径挖掘加入意图知识库的一个时间周期,这个更新周期,可以根据业务需要进行设置,比如,一天、三天、七天等,在此不做限制。
沿用上例,上述语句:“如果退货的话,多久可以退款?”对应的交互意图路径1为:退货_多久_可以_退款,而此语句中未与词桶规则匹配的词单元包括:“如果”、“的”、“话”,而这三个词在词单元频次表中记录的频次为:“如果”9次,“的”18次,“话”2次,则根据这个语句中的这三个词,将词单元频次表中记录的频次更新为:“如果”10次,“的”19次,“话”3次。
在上述根据语句中未与所述词桶规则匹配的词单元,更新词单元频次表的基础上,在本说明书实施例提供的一种可选实施方式中,还需要:
提取更新周期内所述词单元频次表中频次大于频次阈值的词单元;
将所述频次大于频次阈值的词单元作为新词单元嵌入包含所述新词单元的语句对应的交互意图路径。
实际应用中,提取更新周期内词单元频次表中频次大于频次阈值的词单元,即提取出在语句中除词桶词单元外出现较多的词单元,这些词单元既然在语句中出现的更为频繁,表明其相较于其他词汇更重要或更具代表性,对于交互意图路径的影响也更大。
具体的,所述将所述词单元作为新词单元嵌入包含所述新词单元的语句对应的交互意图路径,可以将新词单元嵌入交互意图路径的尾部,也可以将新词单元嵌入其他的部位,在此不做限制。
沿用上例,上述语句:“如果退货的话,多久可以退款?”对应的交互意图路径1为:退货_多久_可以_退款,而此语句中未与词桶规则匹配的词单元包括:“如果”、“的”、“话”,这三个词在词单元频次表中记录的频次为:“如果”22次,“的”49次,“话”11次,而预设的频次阈值为25,则此语句中只有词单元“的”的频次大于预设的频次阈值,将“的”作为新词单元嵌入此语句的交互意图路径的末尾,嵌入后,此语句对应的交互意图路径1更新为:退货_多久_可以_退款_的。
本说明书实施例,提取更新周期内所述词单元频次表中频次大于频次阈值的词单元,将这些频次大于频次阈值的词单元作为新词单元嵌入包含所述新词单元的语句对应的交互意图路径。
词单元作为新词单元嵌入包含此新词单元的语句对应的交互意图路径,实现了将出现频繁的新词单元嵌入交互意图路径,提高了交互意图路径的准确性。
在将新词单元嵌入包含此新词单元的语句对应的交互意图路径的基础上,本说明书实施例提供的一种可选实施方式中,还需要:
根据所述新词单元创建新词桶规则;
按照所述新词单元的频次从高到低将对应的新词桶规则进行排序,获得新词桶规则的新规则顺序;
将所述新规则顺序嵌入所述规则顺序。
具体的,根据所述新词单元创建新词桶规则,是指创建出可以匹配新词单元的词桶规则,实际应用中,为已经加入交互意图路径的新词单元创建新词桶规则,可以使新词单元作为后续生成的交互意图路径的一部分,增加了交互意图路径的完整性,提高了交互意图路径的准确性。
进一步,将新词桶规则按照新词单元的频次从高到底进行排序,获得的新规则顺序嵌入词桶规则的规则顺序,可以是将新规则顺序嵌入词桶规则的规则顺序的末尾。
此外,还可以根据语法顺序,将这些新词桶规则分别排列词桶规则中的某个词桶规则前或某个词桶规则后,以此更新词桶规则的规则顺序,便于对交互意图路径的理解。
本说明书实施例,根据所述新词单元创建新词桶规则,按照所述新词单元的频次从高到低将对应的新词桶规则进行排序,获得新词桶规则的新规则顺序,并将新规则顺序嵌入词桶规则的规则顺序,实现了为已经加入交互意图路径的新词单元创建新词桶规则,使新词单元作为后续生成的交互意图路径的一部分,并按照顺序进行排列,增加了交互意图路径的完整性,提高了生成的交互意图路径的准确性。
实际应用中,在更新周期内生成的交互意图路径中有些交互意图路径是频次很少的,而针对有些交互意图路径来说,又存在很多重复的交互意图路径,这些频次很少或者重复存在的交互意图路径在业务场景中的应用意义不大,本说明书实施例提供的一种可选实施方式中,在按照所述词桶规则的规则顺序对所述词桶词单元进行串联,生成所述语句对应的交互意图路径之后,还包括:
统计更新周期内生成的全量交互意图路径中各个交互意图路径的频次;
在所述各个交互意图路径中筛选出所述频次大于路径频次阈值的交互意图路径;
针对筛选出的交互意图路径进行去重,将去重后的交互意图路径作为所述更新周期内更新的交互意图路径。
沿用上例,据统计,更新周期内生成了4种交互意图路径,上述语句:“如果退货的话,多久可以退款?”对应的交互意图路径1的频次为58次,此外,还有交互意图路径2的频次为5,交互意图路径3的频次为38,交互意图路径4的生频次为20,而预设的路径频次阈值为15,则在所有的交互意图路径中将频次大于15的交互意图路径筛选出来,筛选出的交互意图路径中包含58条交互意图路径1、38条交互意图路径3和20条交互意图路径4,将这3种交互意图路径去重后,剩余3条交互意图路径,分别为交互意图路径1、交互意图路径3和交互意图路径4。
本说明书实施例,筛选出更新周期内频次大于路径频次阈值的交互意图路径,可以减少不重要的交互意图路径的分析,再将筛选出的交互意图路径去重,可以使更新周期内获得的更新的交互意图路径更为精简。
在上述获得更新周期内更新的交互意图路径的基础上,本说明书实施例提供的一种可选实施方式中,针对筛选出的交互意图路径进行去重,将去重后的交互意图路径作为更新周期内更新的交互意图路径之后,还包括:
通过将所述更新周期内更新的交互意图路径中任意一个交互意图路径与意图知识库中的交互意图路径进行对比的方式,判断所述任意一个交互意图路径是否存在于所述意图知识库;
若是,表明此任意一个交互意图路径针对于意图知识库不是增量的交互意图路径,不需将此任意一个交互意图路径加入所述意图知识库;
若否,表明此任意一个交互意图路径针对于意图知识库是增量的交互意图路径,将所述任意一个交互意图路径加入所述意图知识库。
沿用上例,将上述更新周期内更新的3条交互意图路径与意图知识库中的交互意图路径对比后,发现意图知识库中存在交互意图路径1和交互意图路径3,而不存在交互意图路径4,则将交互意图路径4作为新增的交互意图路径加入意图知识库。
本说明书实施例,将更新周期内更新的交互意图路径中不存在于意图知识库的交互意图路径加入意图知识库,使得意图知识库更为精简,并减少了维护意图知识库的成本。
实际应用中,对交互意图路径的挖掘并更新意图知识库是为了提供给用户更准确的回复,本说明书实施例提供的一种可选实施方式中,在将所述任意一个交互意图路径加入所述意图知识库之后,还包括:
获取所述意图知识库中新增的交互意图路径对应的回复信息;
建立所述回复信息与所述新增的交互意图路径的关联关系。
所述回复信息,是指针对意图知识库中新增的交互意图路径的问题或者话语进行回复的信息。
实际应用中,所述建立所述回复信息与所述新增的交互意图路径的关联关系,可以根据回复信息对新增的交互意图路径进行打标,具体的,可以是根据回复信息的信息标识对新增的交互意图路径进行标记,此信息标识可以唯一地确定一条回复信息,则通过此标记可以快速查找到与交互意图路径对应的回复信息,此外,还有其他的建立关联关系的方式,比如建立交互意图路径与回复信息之间的对应关系表等,在此不做限制。
本说明书实施例,通过获取意图知识库中新增的交互意图路径对应的回复信息,并建立回复信息对新增的交互意图路径之间的关联关系,增加了提供给用户的回复的效率以及准确性。
下述结合附图2,以本说明书提供的交互意图路径的挖掘方法在电销机器人的应用为例,对所述交互意图路径的挖掘方法进行进一步说明。其中,图2示出了本说明书一个实施例提供的一种应用于电销机器人的交互意图路径的挖掘方法的处理流程图,具体步骤包括步骤S202至步骤S220。
步骤S202,获取电销机器人与用户交互过程中用户输入的用户语音信息对应的文本数据。
步骤S204,根据预设词典对所述文本数据进行修正。
步骤S206,对所述文本数据中包含的语句进行分词处理,获得所述语句的词单元。
步骤S208,将所述词单元依次与多个词桶规则匹配,根据匹配结果提取与所述词桶规则匹配的词桶词单元。
步骤S210,按照所述词桶规则的规则顺序对所述词桶词单元进行串联,生成所述语句对应的交互意图路径。
步骤S212,统计更新周期内生成的全量交互意图路径中各个交互意图路径的频次。
步骤S214,在所述各个交互意图路径中筛选出所述频次大于路径频次阈值的交互意图路径。
步骤S216,针对筛选出的交互意图路径进行去重,将去重后的交互意图路径作为所述更新周期内更新的交互意图路径。
步骤S218,通过将所述更新周期内更新的交互意图路径中任意一个交互意图路径与意图知识库中的交互意图路径进行对比的方式,判断所述任意一个交互意图路径是否存在于所述意图知识库;
若是,表明此任意一个交互意图路径针对于意图知识库不是增量的交互意图路径,不需将此任意一个交互意图路径加入所述意图知识库;
若否,表明此任意一个交互意图路径针对于意图知识库是增量的交互意图路径,执行下述步骤S220。
步骤S220,将所述任意一个交互意图路径加入所述意图知识库。
本说明书一个实施例实现了,通过将交互中用户输入的用户语音信息对应的文本数据中的各个语句进行分词,将分词后获得的词单元依次与预先根据业务需要配置的多个词桶规则匹配,提取各个语句中与各个词桶规则匹配的词桶词单元,实现了引入与业务场景相关的业务词汇规则作为词桶规则,并根据业务场景需要灵活地配置词桶规则,而按照各个词桶规则的规则顺序对所述各个语句中的词桶词单元以及对应的词桶规则进行串联,生成各个语句对应的交互意图路径,实现了通过设置词桶规则的规则顺序,将提取出的词桶词单元的按照规则顺序进行排序,提升了生成的交互意图路径可理解性,并进一步提高了交互意图路径的准确性。
本说明书提供的一种交互意图路径的挖掘装置实施例如下:
与上述方法实施例相对应,本说明书还提供了交互意图路径的挖掘装置实施例,图3示出了本说明书一个实施例提供的一种交互意图路径的挖掘装置的结构示意图。如图3所示,该装置包括:
获取模块302,被配置为获取交互过程中用户输入的用户语音信息对应的文本数据;
分词模块304,被配置为对所述文本数据中包含的语句进行分词处理,获得所述语句的词单元;
提取模块306,被配置为将所述词单元依次与多个词桶规则匹配,根据匹配结果提取与所述词桶规则匹配的词桶词单元;
生成模块308,被配置为按照所述词桶规则的规则顺序对所述词桶词单元进行串联,生成所述语句对应的交互意图路径。
可选的,所述交互意图路径的挖掘装置,还包括:
统计模块,被配置为统计更新周期内生成的全量交互意图路径中各个交互意图路径的频次;
筛选模块,被配置为在所述各个交互意图路径中筛选出所述频次大于路径频次阈值的交互意图路径;
去重模块,被配置为针对筛选出的交互意图路径进行去重,将去重后的交互意图路径作为所述更新周期内更新的交互意图路径。
可选的,所述交互意图路径的挖掘装置,还包括:
判断模块,被配置为通过将所述更新周期内更新的交互意图路径中任意一个交互意图路径与意图知识库中的交互意图路径进行对比的方式,判断所述任意一个交互意图路径是否存在于所述意图知识库;
若否,运行加入模块,所述加入模块,被配置为将所述任意一个交互意图路径加入所述意图知识库。
可选的,所述交互意图路径的挖掘装置,还包括:
获取信息模块,被配置为获取所述意图知识库中新增的交互意图路径对应的回复信息;
建立模块,被配置为建立所述回复信息与所述新增的交互意图路径的关联关系。
可选的,所述交互意图路径的挖掘装置,还包括:
更新模块,被配置为根据所述语句中未与所述词桶规则匹配的词单元,更新词单元频次表。
可选的,所述交互意图路径的挖掘装置,还包括:
提取模块,被配置为提取更新周期内所述词单元频次表中频次大于频次阈值的词单元;
嵌入模块,被配置为将所述频次大于频次阈值的词单元作为新词单元嵌入包含所述新词单元的语句对应的交互意图路径。
可选的,所述交互意图路径的挖掘装置,还包括:
创建模块,被配置为根据所述新词单元创建新词桶规则;
获得顺序模块,被配置为按照所述新词单元的频次从高到低将对应的新词桶规则进行排序,获得新词桶规则的新规则顺序;
嵌入顺序模块,被配置为将所述新规则顺序嵌入所述规则顺序。
可选的,所述获取模块302,包括:
获取语音信息子模块,被配置为获取交互过程中用户输入的超过一轮交互的用户语音信息;
转化子模块,被配置为通过语音识别将所述用户语音信息转化为文本数据。
可选的,所述交互意图路径的挖掘装置,还包括:
修正模块,被配置为根据预设词典对所述文本数据进行修正。
可选的,在所述语句中存在多个与所述多个词桶规则中任一词桶规则匹配的词桶词单元的情况下,相应的,所述生成模块308,包括:
组合子模块,被配置为将与所述任一词桶规则匹配的多个词桶词单元按照预设词单元顺序依次连接,组合为组合词桶词单元;
生成路径字子模块,被配置为按照所述词桶规则的规则顺序对所述组合词桶词单元以及未组合的词桶词单元进行串联,生成所述语句对应的交互意图路径。
上述为本实施例的一种交互意图路径的挖掘装置的示意性方案。需要说明的是,该交互意图路径的挖掘装置的技术方案与上述的交互意图路径的挖掘方法的技术方案属于同一构思,交互意图路径的挖掘装置的技术方案未详细描述的细节内容,均可以参见上述交互意图路径的挖掘方法的技术方案的描述。
本说明书提供的一种计算设备实施例如下:
图4示出了根据本说明书一个实施例提供的一种计算设备400的结构框图。该计算设备400的部件包括但不限于存储器410和处理器420。处理器420与存储器410通过总线430相连接,数据库450用于保存数据。
计算设备400还包括接入设备440,接入设备440使得计算设备400能够经由一个或多个网络460通信。这些网络的示例包括公用交换电话网(PSTN)、局域网(LAN)、广域网(WAN)、个域网(PAN)或诸如因特网的通信网络的组合。接入设备440可以包括有线或无线的任何类型的网络接口(例如,网络接口卡(NIC))中的一个或多个,诸如IEEE802.11无线局域网(WLAN)无线接口、全球微波互联接入(Wi-MAX)接口、以太网接口、通用串行总线(USB)接口、蜂窝网络接口、蓝牙接口、近场通信(NFC)接口,等等。
在本说明书的一个实施例中,计算设备400的上述部件以及图4中未示出的其他部件也可以彼此相连接,例如通过总线。应当理解,图4所示的计算设备结构框图仅仅是出于示例的目的,而不是对本说明书范围的限制。本领域技术人员可以根据需要,增添或替换其他部件。
计算设备400可以是任何类型的静止或移动计算设备,包括移动计算机或移动计算设备(例如,平板计算机、个人数字助理、膝上型计算机、笔记本计算机、上网本等)、移动电话(例如,智能手机)、可佩戴的计算设备(例如,智能手表、智能眼镜等)或其他类型的移动设备,或者诸如台式计算机或PC的静止计算设备。计算设备400还可以是移动式或静止式的服务器。
本说明书提供一种计算设备,包括存储器410、处理器420及存储在存储器上并可在处理器上运行的计算机指令,所述处理器420用于执行如下计算机可执行指令:
获取交互过程中用户输入的用户语音信息对应的文本数据;
对所述文本数据中包含的语句进行分词处理,获得所述语句的词单元;
将所述词单元依次与多个词桶规则匹配,根据匹配结果提取与所述词桶规则匹配的词桶词单元;
按照所述词桶规则的规则顺序对所述词桶词单元进行串联,生成所述语句对应的交互意图路径。
上述为本实施例的一种计算设备的示意性方案。需要说明的是,该计算设备的技术方案与上述的交互意图路径的挖掘方法的技术方案属于同一构思,计算设备的技术方案未详细描述的细节内容,均可以参见上述交互意图路径的挖掘方法的技术方案的描述。
本说明书提供的一种计算机可读存储介质实施例如下:
本说明书提供一种计算机可读存储介质,其存储有计算机指令,该指令被处理器执行时以用于:
获取交互过程中用户输入的用户语音信息对应的文本数据;
对所述文本数据中包含的语句进行分词处理,获得所述语句的词单元;
将所述词单元依次与多个词桶规则匹配,根据匹配结果提取与所述词桶规则匹配的词桶词单元;
按照所述词桶规则的规则顺序对所述词桶词单元进行串联,生成所述语句对应的交互意图路径。
上述为本实施例的一种计算机可读存储介质的示意性方案。需要说明的是,该存储介质的技术方案与上述的交互意图路径的挖掘方法的技术方案属于同一构思,存储介质的技术方案未详细描述的细节内容,均可以参见上述交互意图路径的挖掘方法的技术方案的描述。
上述对本说明书特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下,在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。
所述计算机指令包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、电载波信号、电信信号以及软件分发介质等。需要说明的是,所述计算机可读介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减,例如在某些司法管辖区,根据立法和专利实践,计算机可读介质不包括电载波信号和电信信号。
需要说明的是,对于前述的各方法实施例,为了简便描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本说明书实施例并不受所描述的动作顺序的限制,因为依据本说明书实施例,某些步骤可以采用其它顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定都是本说明书实施例所必须的。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其它实施例的相关描述。
以上公开的本说明书优选实施例只是用于帮助阐述本说明书。可选实施例并没有详尽叙述所有的细节,也不限制该发明仅为所述的具体实施方式。显然,根据本说明书实施例的内容,可作很多的修改和变化。本说明书选取并具体描述这些实施例,是为了更好地解释本说明书实施例的原理和实际应用,从而使所属技术领域技术人员能很好地理解和利用本说明书。本说明书仅受权利要求书及其全部范围和等效物的限制。

Claims (12)

1.一种交互意图路径的挖掘方法,包括:
获取交互过程中用户输入的用户语音信息对应的文本数据;
对所述文本数据中包含的语句进行分词处理,获得所述语句的词单元;
将所述词单元依次与多个词桶规则匹配,根据匹配结果提取与所述词桶规则匹配的业务词汇作为词桶词单元,其中,所述词桶规则为业务场景的业务规则,且所述业务规则匹配有业务词汇;
按照所述词桶规则的规则顺序对所述词桶词单元进行串联,生成所述语句对应的交互意图路径;
对更新周期内更新的交互意图路径进行处理,将处理后的交换意图路径中不存在于意图知识库的交互意图路径加入意图知识库;
获取所述意图知识库中新增的交互意图路径对应的回复信息,建立所述回复信息与所述新增的交互意图路径的关联关系。
2.根据权利要求1所述的交互意图路径的挖掘方法,所述对更新周期内更新的交互意图路径进行处理,还包括:
统计更新周期内生成的全量交互意图路径中各个交互意图路径的频次;
在所述各个交互意图路径中筛选出所述频次大于路径频次阈值的交互意图路径;
针对筛选出的交互意图路径进行去重,将去重后的交互意图路径作为所述更新周期内更新的交互意图路径。
3.根据权利要求2所述的交互意图路径的挖掘方法,所述针对筛选出的交互意图路径进行去重,将去重后的交互意图路径作为更新周期内更新的交互意图路径步骤执行之后,还包括:
通过将所述更新周期内更新的交互意图路径中任意一个交互意图路径与意图知识库中的交互意图路径进行对比的方式,判断所述任意一个交互意图路径是否存在于所述意图知识库;
若否,将所述任意一个交互意图路径加入所述意图知识库。
4.根据权利要求1所述的交互意图路径的挖掘方法,所述按照所述词桶规则的规则顺序对所述词桶词单元进行串联,生成所述语句对应的交互意图路径步骤执行之后,还包括:
根据所述语句中未与所述词桶规则匹配的词单元,更新词单元频次表。
5.根据权利要求4所述的交互意图路径的挖掘方法,所述根据所述语句中未与所述词桶规则匹配的词单元,更新词单元频次表步骤执行之后,还包括:
提取更新周期内所述词单元频次表中频次大于频次阈值的词单元;
将所述频次大于频次阈值的词单元作为新词单元嵌入包含所述新词单元的语句对应的交互意图路径。
6.根据权利要求5所述的交互意图路径的挖掘方法,所述将所述词单元作为新词单元嵌入包含所述新词单元的语句对应的交互意图路径步骤执行之后,还包括:
根据所述新词单元创建新词桶规则;
按照所述新词单元的频次从高到低将对应的新词桶规则进行排序,获得新词桶规则的新规则顺序;
将所述新规则顺序嵌入所述规则顺序。
7.根据权利要求1所述的交互意图路径的挖掘方法,所述获取交互过程中用户输入的用户语音信息对应的文本数据,包括:
获取交互过程中用户输入的超过一轮交互的用户语音信息;
通过语音识别将所述用户语音信息转化为文本数据。
8.根据权利要求7所述的交互意图路径的挖掘方法,所述获取交互过程中用户输入的用户语音信息对应的文本数据步骤执行之后,并所述对所述文本数据中包含的语句进行分词处理,获得所述语句的词单元步骤执行之前,还包括:
根据预设词典对所述文本数据进行修正。
9.根据权利要求1所述的交互意图路径的挖掘方法,在所述语句中存在多个与所述多个词桶规则中任一词桶规则匹配的词桶词单元的情况下,相应的,所述按照所述词桶规则的规则顺序对所述词桶词单元进行串联,生成所述语句对应的交互意图路径,包括:
将与所述任一词桶规则匹配的多个词桶词单元按照预设词单元顺序依次连接,组合为组合词桶词单元;
按照所述词桶规则的规则顺序对所述组合词桶词单元以及未组合的词桶词单元进行串联,生成所述语句对应的交互意图路径。
10.一种交互意图路径的挖掘装置,包括:
获取模块,被配置为获取交互过程中用户输入的用户语音信息对应的文本数据;
分词模块,被配置为对所述文本数据中包含的语句进行分词处理,获得所述语句的词单元;
提取模块,被配置为将所述词单元依次与多个词桶规则匹配,根据匹配结果提取与所述词桶规则匹配的业务词汇作为词桶词单元,其中,所述词桶规则为业务场景的业务规则,且所述业务规则匹配有业务词汇;
生成模块,被配置为按照所述词桶规则的规则顺序对所述词桶词单元进行串联,生成所述语句对应的交互意图路径;对更新周期内更新的交互意图路径进行处理,将处理后的交换意图路径中不存在于意图知识库的交互意图路径加入意图知识库;
获取所述意图知识库中新增的交互意图路径对应的回复信息,建立所述回复信息与所述新增的交互意图路径的关联关系。
11.一种计算设备,包括:
存储器和处理器;
所述存储器用于存储计算机可执行指令,所述处理器用于执行所述计算机可执行指令:
获取交互过程中用户输入的用户语音信息对应的文本数据;
对所述文本数据中包含的语句进行分词处理,获得所述语句的词单元;
将所述词单元依次与多个词桶规则匹配,根据匹配结果提取与所述词桶规则匹配的业务词汇作为词桶词单元,其中,所述词桶规则为业务场景的业务规则,且所述业务规则匹配有业务词汇;
按照所述词桶规则的规则顺序对所述词桶词单元进行串联,生成所述语句对应的交互意图路径;
对更新周期内更新的交互意图路径进行处理,将处理后的交换意图路径中不存在于意图知识库的交互意图路径加入意图知识库;
获取所述意图知识库中新增的交互意图路径对应的回复信息,建立所述回复信息与所述新增的交互意图路径的关联关系。
12.一种计算机可读存储介质,其存储有计算机指令,该指令被处理器执行时实现权利要求1至9任意一项所述交互意图路径的挖掘方法的步骤。
CN201911337912.7A 2019-12-23 2019-12-23 交互意图路径的挖掘方法以及装置 Active CN111046145B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911337912.7A CN111046145B (zh) 2019-12-23 2019-12-23 交互意图路径的挖掘方法以及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911337912.7A CN111046145B (zh) 2019-12-23 2019-12-23 交互意图路径的挖掘方法以及装置

Publications (2)

Publication Number Publication Date
CN111046145A CN111046145A (zh) 2020-04-21
CN111046145B true CN111046145B (zh) 2023-10-27

Family

ID=70238590

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911337912.7A Active CN111046145B (zh) 2019-12-23 2019-12-23 交互意图路径的挖掘方法以及装置

Country Status (1)

Country Link
CN (1) CN111046145B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113177079A (zh) * 2020-12-04 2021-07-27 崔秀芬 基于人工智能的交互事件更新方法及云计算互动中心
CN112380358A (zh) * 2020-12-31 2021-02-19 神思电子技术股份有限公司 一种行业知识库的快速构建方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104077298A (zh) * 2013-03-27 2014-10-01 百度国际科技(深圳)有限公司 基于组合词的词典挖掘方法及系统
CN104375847A (zh) * 2013-08-14 2015-02-25 华为技术有限公司 识别业务类型的方法及装置
CN108920497A (zh) * 2018-05-23 2018-11-30 北京奇艺世纪科技有限公司 一种人机交互方法及装置
CN109739961A (zh) * 2018-12-24 2019-05-10 科大讯飞股份有限公司 一种人机语言交互方法及装置

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9183195B2 (en) * 2013-03-15 2015-11-10 Disney Enterprises, Inc. Autocorrecting text for the purpose of matching words from an approved corpus
JP2016061954A (ja) * 2014-09-18 2016-04-25 株式会社東芝 対話装置、方法およびプログラム
US10885442B2 (en) * 2018-02-02 2021-01-05 Tata Consultancy Services Limited Method and system to mine rule intents from documents
US11048881B2 (en) * 2018-02-09 2021-06-29 Tata Consultancy Services Limited Method and system for identification of relation among rule intents from a document

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104077298A (zh) * 2013-03-27 2014-10-01 百度国际科技(深圳)有限公司 基于组合词的词典挖掘方法及系统
CN104375847A (zh) * 2013-08-14 2015-02-25 华为技术有限公司 识别业务类型的方法及装置
CN108920497A (zh) * 2018-05-23 2018-11-30 北京奇艺世纪科技有限公司 一种人机交互方法及装置
CN109739961A (zh) * 2018-12-24 2019-05-10 科大讯飞股份有限公司 一种人机语言交互方法及装置

Also Published As

Publication number Publication date
CN111046145A (zh) 2020-04-21

Similar Documents

Publication Publication Date Title
US11113234B2 (en) Semantic extraction method and apparatus for natural language, and computer storage medium
CN103077714B (zh) 信息的识别方法和装置
CN110019742B (zh) 用于处理信息的方法和装置
CN103268313A (zh) 一种自然语言的语义解析方法及装置
CN111428474A (zh) 基于语言模型的纠错方法、装置、设备及存储介质
CN111046145B (zh) 交互意图路径的挖掘方法以及装置
CN111831911A (zh) 查询信息的处理方法、装置、存储介质和电子装置
CN111445903B (zh) 企业名称识别方法及装置
CN105096934A (zh) 构建语音特征库的方法、语音合成方法、装置及设备
CN112988753B (zh) 一种数据搜索方法和装置
CN111813923A (zh) 文本摘要方法、电子设备及存储介质
CN111159334A (zh) 用于房源跟进信息处理的方法及系统
CN104216896A (zh) 一种查找联系人信息的方法及装置
US20230106226A1 (en) Code enrichment for training language models relating to computer programming
CN113535749A (zh) 查询语句生成方法及装置
CN116610781A (zh) 任务模型训练方法以及装置
CN111539228A (zh) 向量模型训练方法及装置、相似度确定方法及装置
CN111538817A (zh) 人机交互方法和装置
US11580101B2 (en) Method and apparatus for generating context category dataset
CN113918712A (zh) 数据处理方法以及装置
CN106844357B (zh) 大句库翻译方法
CN110597765A (zh) 一种大零售呼叫中心异构数据源数据处理方法及装置
CN111783433A (zh) 一种文本检索纠错方法和装置
CN112732743B (zh) 一种基于中文自然语言的数据分析方法及装置
CN111090737A (zh) 词库更新方法、装置、电子设备及可读存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant