CN109446509A - 一种对话语料意图分析方法、系统及电子设备 - Google Patents
一种对话语料意图分析方法、系统及电子设备 Download PDFInfo
- Publication number
- CN109446509A CN109446509A CN201811038349.9A CN201811038349A CN109446509A CN 109446509 A CN109446509 A CN 109446509A CN 201811038349 A CN201811038349 A CN 201811038349A CN 109446509 A CN109446509 A CN 109446509A
- Authority
- CN
- China
- Prior art keywords
- intention
- corpus
- sentences
- dialogue corpus
- dialogue
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000004458 analytical method Methods 0.000 title claims abstract description 62
- 238000000034 method Methods 0.000 claims abstract description 28
- 238000012549 training Methods 0.000 claims description 18
- 238000002372 labelling Methods 0.000 claims description 9
- 238000004590 computer program Methods 0.000 claims description 8
- 235000008694 Humulus lupulus Nutrition 0.000 claims 1
- 238000007405 data analysis Methods 0.000 abstract description 3
- 238000003058 natural language processing Methods 0.000 abstract description 2
- 238000012163 sequencing technique Methods 0.000 abstract 1
- 238000010586 diagram Methods 0.000 description 7
- 230000008569 process Effects 0.000 description 6
- 230000006399 behavior Effects 0.000 description 3
- 230000009191 jumping Effects 0.000 description 3
- 230000006870 function Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000002093 peripheral effect Effects 0.000 description 2
- KIUKXJAPPMFGSW-DNGZLQJQSA-N (2S,3S,4S,5R,6R)-6-[(2S,3R,4R,5S,6R)-3-Acetamido-2-[(2S,3S,4R,5R,6R)-6-[(2R,3R,4R,5S,6R)-3-acetamido-2,5-dihydroxy-6-(hydroxymethyl)oxan-4-yl]oxy-2-carboxy-4,5-dihydroxyoxan-3-yl]oxy-5-hydroxy-6-(hydroxymethyl)oxan-4-yl]oxy-3,4,5-trihydroxyoxane-2-carboxylic acid Chemical compound CC(=O)N[C@H]1[C@H](O)O[C@H](CO)[C@@H](O)[C@@H]1O[C@H]1[C@H](O)[C@@H](O)[C@H](O[C@H]2[C@@H]([C@@H](O[C@H]3[C@@H]([C@@H](O)[C@H](O)[C@H](O3)C(O)=O)O)[C@H](O)[C@@H](CO)O2)NC(C)=O)[C@@H](C(O)=O)O1 KIUKXJAPPMFGSW-DNGZLQJQSA-N 0.000 description 1
- 230000003796 beauty Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 210000000744 eyelid Anatomy 0.000 description 1
- 230000001815 facial effect Effects 0.000 description 1
- 229920002674 hyaluronan Polymers 0.000 description 1
- 229960003160 hyaluronic acid Drugs 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000003064 k means clustering Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 238000012827 research and development Methods 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M3/00—Automatic or semi-automatic exchanges
- H04M3/42—Systems providing special services or facilities to subscribers
- H04M3/487—Arrangements for providing information services, e.g. recorded voice services or time announcements
- H04M3/493—Interactive information services, e.g. directory enquiries ; Arrangements therefor, e.g. interactive voice response [IVR] systems or voice portals
- H04M3/4936—Speech interaction details
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M2203/00—Aspects of automatic or semi-automatic exchanges
- H04M2203/35—Aspects of automatic or semi-automatic exchanges related to information services provided via a voice call
- H04M2203/355—Interactive dialogue design tools, features or methods
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02P—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
- Y02P90/00—Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
- Y02P90/30—Computing systems specially adapted for manufacturing
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Human Computer Interaction (AREA)
- Signal Processing (AREA)
- Machine Translation (AREA)
Abstract
本发明涉及自然语言处理技术,提供了一种对话语料意图分析方法,所述对话语料包含多条语句,所述方法包含:基于预设意图识别模型对每条所述语句进行意图识别,确定每条所述语句中所包含的意图信息;基于每条所述语句在对应的所述对话语料中出现的先后顺序及所述对应的意图信息,生成意图分析树;确定所述分析树中,各节点间的跳转概率。基于本发明实施例所提供的方法,可基于大量的历史数据分析得出各个对话语料中所包含的意图信息之间的关联关系,并在此基础上,可通过统计得出各个意图信息之间的跳转概率,从而可为后续的实际应用提供参考。此外本发明还提供一种对话语料意图分析系统及电子设备。
Description
技术领域
本发明涉及自然语言处理技术,尤其涉及一种对话语料意图分析方法、系统及电子设备。
背景技术
随着互联网的飞速发展,网络应用越来越广泛,网络客服、网络销售推广已经普及到各行各业,深入到日常商业服务的各个环节。而随着网络时间的积累,大数据时代也已到来。
为了更好的把握客户心理、了解客户行为,以提供更精准的商业服务,越来越多的基于大数据的客户行为分析以纷纷接入具体的服务应用。
以网络客服、销售来看,无论是基于人工的网络客户还是基于智能系统的网络客服,在于客户进行交互过程中,会产生大量的数据信息,从这些数据信息中往往可分析出客户的行为模式,由此可见,如何有效、精准的从大数据中分析出实际需求的信息,已成为行业的重要研发方向。
发明内容
本发明的实施例提供了一种对话语料意图分析方法,所述对话语料包含多条语句,所述方法包含:基于预设意图识别模型对每条所述语句进行意图识别,确定每条所述语句中所包含的意图信息;基于每条所述语句在对应的所述对话语料中出现的先后顺序及所述对应的意图信息,生成意图分析树;确定所述分析树中,各节点间的跳转概率。
在一实施中,所述预设意图识别模型的构建方法包含:将所述对话语料进行问、答语句的分类;分别对各所述对话语料中的所述问语句和所述答语句进行合并,得到问语句集合、答语句集合;分别对所述问语句集合、所述答语句集合进行聚类,获得相应的分类;从各所述分类语句中分别抽取预设数量的训练语句;对所述训练语句进行意图标注;基于标注后的所述训练语句对所述预设意图识别算法进行训练,得到所述预设意图识别模型。
在一实施中,所述基于每条所述语句在对应的所述对话语料中出现的先后顺序及所述对应的意图信息,生成所述意图分析树,具体包含:
将各所述对话语料中的每条所述语句的意图信息作为所述意图分析树的节点,并基于每条所述语句在对应的所述对话语料中出现的先后顺序,确定所述节点的父子关系;
基于各所述对话语料确定出的各所述节点及所述父子关系进行对应合并,生成所述意图分析树。
在一实施中,所述确定所述分析树中,各节点间的跳转概率具体包含:
统计各所述对话语料中各所述语句的意图信息及在对应的所述对话语料中出现的先后顺序,确定所述各节点间的跳转概率。
在一实施中,在生成所述意图分析树前,更包含步骤:对各所述对话语料中各所述语句的会话身份进行标注;并在生成所述意图分析树时,对所述会话身份进行展示。
基于本发明实施例所提供的方法,可基于大量的历史数据分析得出各个对话语料中所包含的意图信息之间的关联关系,并在此基础上,可通过统计得出各个意图信息之间的跳转概率,从而可为后续的实际应用提供参考。更进一步的,在对语句进行意图识别时,本发明的实施例中,可基于预设意图识别模型对各语句进行识别,而该预设意图识别模型的训练语料是从相同的对话语料中提取出来,并经由人工标注而获得,所训练出的预设意图识别模型的识别准确率更高,结果更符合实际需求,从而为后续的意图分析树的生成提供了良好的数据基础,保证了分析结果的可靠性。
本发明还提供了一种对话语料意图分析系统,所述系统包含服务器及显示设备,其中所述服务器存储有计算机程序,所述计算机程序可执行实现上述对话语料意图分析方法,并基于分析结果生成展示信息,发送至所述显示设备,所述显示设备接收所述展示信息,并进行对所述展示信息进行显示。
在一实施中,所述展示信息的形式可包含图示、电子表格、文字。
此外,本发明另提供了一种电子设备,包括:至少一个处理器;以及,与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行上述对话语料意图分析方法。
附图说明
一个或多个实施方式通过与之对应的附图中的图片进行示例性说明,这些示例性说明并不构成对实施方式的限定,附图中具有相同参考数字标号的元件表示为类似的元件,除非有特别申明,附图中的图不构成比例限制。
图1绘示本发明第一实施例所提供的对话语料意图分析方法流程图;
图2绘示图1所示实施例中预设意图识别模型的构建方法流程图;
图3绘示了本实施例中意图分析树的生成过程示意图;
图4绘示本发明一实施例所提供的意图分析树结构示意图;
图5绘示本发明第二实施例所提供的对话语料意图分析方法流程图;
图6绘示本发明第二实施例所提供的意图分析树结构示意图。
具体实施方式
为使本发明实施方式的目的、技术方案和优点更加清楚,下面将结合附图对本发明的各实施方式进行详细的阐述。然而,本领域的普通技术人员可以理解,在本发明各实施方式中,为了使读者更好地理解本申请而提出了许多技术细节。但是,即使没有这些技术细节和基于以下各实施方式的种种变化和修改,也可以实现本申请所要求保护的技术方案。
本发明的实施例中,是针对对话语料进行的意图分析,所谓对话语料是指包含了多条语句,问答语句的、针对一个完整的业务场景所产生的语料数据,故每个对话语料都包含了多条语句。
以产品销售场景为例,客户A向销售人员B咨询产品C的相关信息的过程中,所产生的问答语句,其内容主要包含客户的咨询问题,以及销售人员针对客户的问题所给出的回答,或者销售人员根据了解到的客户需求所提出的进一步推销信息,每个对话都包含了开始语句和结束语句,其中开始语句是一个对话的起始,可以是客户主动发起的咨询问题,也可以是销售人员主动向客户发起的需求询问;结束语句为一个对话的终结,具体根据对话的实际状况而定。
该些用于分析的对话语料可以是基于大量的历史数据中提取出来的真实对话语料,可以是基于网页上获取得到,也可以是基于应用系统获得。根据具体的应用场景,可选择从对应的专业相关的渠道来获取这些对话语料。
请参照图1,图1绘示本发明第一实施例所提供的对话语料意图分析方法流程图。
如图1所示,所述对话语料意图分析方法包含以下步骤:
步骤101,基于预设意图识别模型对每条所述语句进行意图识别,确定每条所述语句中所包含的意图信息。
如上文所述,每个对话语料包含了多条语句,在本步骤中,可先将每个对话语料中的各语句提取,再基于预设意图识别模型对各个语句进行意图识别,以确定各语句中所包含的意图信息。所谓意图信息是指语句中所包含的意图,例如,语句:“这个项目包含了哪些内容?”,其中所包含的意图信息为项目内容咨询。
为了更准确的识别出语句中所包含的意图信息,需要依赖于所使用的意图识别模型的准确度,较佳地,本实施例中,预设意图识别模型可基于图2所示的方法进行构建,从而保证识别结果的准确性和适用性。
如图2所示,所述预设意图识别模型的构建方法包含:
步骤201,将所述对话语料进行问、答语句的分类。
在构建预设意图识别模型的过程中,可使用意图分析中使用的对话语料,从而使得对意图识别模型的训练语料更加贴合实际的应用场景,从而提高识别的准确度和专业度。
在本步骤中,可先对各个对话语料中的问语句、答语句进行分类,确定出对话语料中的语句中所归属的类型。
步骤202,分别对各所述对话语料中的所述问语句和所述答语句进行合并,得到问语句集合、答语句集合。
基于步骤101的分类结果,可将所有对话语料中的问语句进行提取,合并并归为一类,答语句也进行相同处理,从而得到问语句集合、答语句集合。
步骤203,分别对所述问语句集合、所述答语句集合进行聚类,获得相应的分类。
具体而言,可基于K-means聚类算法,分别将问语句集合和答语句集合进行聚类,以将这两个语句集合再分别划分为多个小类别。
步骤204,从各所述分类语句中分别抽取预设数量的训练语句。
如上文所述,对话语料是基于大量的历史数据中提取出来的真实对话语料,不可避免的,会存在大量的重复情况,这种重复不仅包含整个对话语料的完全重复,也包含了不同对话语料中可包含相同的语句的重复,而对于这些重复的语句,其中所包含的意图信息也是重复的,在本步骤中,通过从各分类的语句中抽取出预设数据的训练语句,可在一定程度上降低重复语句的出现概率,更进一步的,由于这些语句是分别来自各个分类,那么可在一定程度上,保证了各个分类具有一定数量的训练语句,也就是说,各个分类中所包含的意图信息,可在一定程度上进行了保留,避免因盲目删减而导致的数据缺失的问题。
步骤205,对所述训练语句进行意图标注。
具体而言,可通过人工标注的方式对训练语句进行意图标注,在人工标注过程中,可根据实际的应用需求对具体的意图信息进行具体的设置,从而使得识别结果可更具有参考价值。
例如,语句“今天雨很大,有伞吗?”,若在通用的应用场景中,可将其意图信息标注为无意图信息,而当应用场景改为生活用品销售应用时,则可将其意图信息标注为“雨具咨询”。
步骤206,基于标注后的所述训练语句对所述预设意图识别算法进行训练,得到所述预设意图识别模型。
通过对预设意图识别算法的反复训练,以获得准确度符合预期的预设意图识别模型,从而完成预设意图识别模型的构建。
通过在步骤101中应用通过上述方法构建的预设意图识别模型对各语句进行意图识别,可获得更准确及符合实际应用需求的识别结果。
步骤102,基于每条所述语句在对应的所述对话语料中出现的先后顺序及所述对应的意图信息,生成意图分析树。
在一个对话语料中,不仅包含了各条语句,还包含了各语句出现的先后顺序。在本实施例中,可基于这些先后顺序构建意图分析树。
具体而言,可先分别将各对话语料中的每条语句的意图信息作为意图分析树的节点,并基于每条语句在对应的所述对话语料中出现的先后顺序,确定各节点之间的父子关系;
然后,基于各对话语料确定出的各节点及父子关系进行对应合并,生成意图分析树。
请参照图3,图3绘示了本实施例中意图分析树的生成过程示意图。
如图3所示,以医疗美容行业为例,对话语料1包含语句及对应的意图信息如下:
“请问脸部微调具体要做哪些项目?”,意图信息:项目内容咨询;
“您好,包含的项目比较多,激光美肤、玻尿酸微调等”,意图信息:无;
“激光美肤怎么收费?”,意图信息:项目价格咨询;
“大概是2000左右”,意图信息:无。
对话语料2包含语句及对应的意图信息如下:
“请问这边割双眼皮怎么收费?”,意图信息:项目价格咨询;
“最近有活动价1388。”,意图信息:无;
“具体怎么预约?”,意图信息:项目内容咨询;
“方便的话,请提供您的手机号进行登记,我们这边会帮忙安排”,意图信息:用户信息咨询。
“不方便”,意图信息:无。
基于对话语料1,可生成分支1:项目内容咨询-项目价格咨询;基于对话语料2,可生成分支2:项目价格咨询-项目内容咨询-用户信息咨询。
对上述两个分枝进行合并,生成意图分析树,以获得各意图信息之间的跳转关系。
步骤103,确定所述分析树中,各节点间的跳转概率。
本步骤中,可通过统计各所述对话语料中各所述语句的意图信息及在对应的所述对话语料中出现的先后顺序,确定所述各节点间的跳转概率。
具体可而言,可先在所有对话语料中,统计当前意图信息后的第一个意图信息,分别累加每一种意图信息出现的次数,然后将这些意图信息按照其出现次数从高到低排序,再分别将每种意图信息出现的次数除以所有意图信息总的出现次数,即可计算出从当前意图信息跳转到某一个指定意图的比例(概率)
然后,以当前意图信息为父结点,以后续的意图信息为子结点,在结点连线上标注出从当前意图跳转到相应意图的比例(概率),对于跳转概率小于一定阈值(如5%)的后续意图,统一合并为其“其他”。
最后,分别将后续意图信息(除了标记为“其他”的结点)设置为当前意图信息,重复上述步骤,直至无法扩展出新的节点。
具体可参照图4所示,图4绘示本发明一实施例所提供的意图分析树结构示意图。
通过本实施例所提供的对话语料意图分析方法,可基于大量的历史数据分析得出各个对话语料中所包含的意图信息之间的关联关系,并在此基础上,可通过统计得出各个意图信息之间的跳转概率,从而可为后续的实际应用提供参考。
请参照图5,图5绘示本发明第二实施例所提供的对话语料意图分析方法流程图。
如图5所示,本发明第二实施例所提供的对话语料意图分析方法包含步骤:
步骤501,基于预设意图识别模型对每条所述语句进行意图识别,确定每条所述语句中所包含的意图信息。
步骤502,对各所述对话语料中各所述语句的会话身份进行标注。
步骤503,基于每条所述语句在对应的所述对话语料中出现的先后顺序及所述对应的意图信息,生成意图分析树。
步骤504,在所述意图分析树中,对所述会话身份进行展示。
步骤505,确定所述分析树中,各节点间的跳转概率。
其中本实施例中的步骤501、503和505的详细说明可对应参照第一实施例中的步骤101、102及103中的内容说明。
本实施例与第一实施例的区别在于,本实施例更包含步骤502:对各所述对话语料中各所述语句的会话身份进行标注,并在步骤504中,在所述意图分析树中,对所述会话身份进行展示。
具体而言,意图信息的会话身份不同,可能会产生不同的结果,可先将各对话语料中的语句的会话身份进行标注,也就是说,将各语句对应的话语者身份进行标注,会话身份可包含客户、销售人员,并最终将该会话身份进行展示,从而通过不同意图信息的会话身份来进一步了解对话中,各个意图信息的跳转关系,及销售人员在进行引导时,可能会产生的结果。从而为实际的应用提供更全面的参考。请参照图6,图6绘示本实施例所提供的意图分析树结构示意图。
基于同样的发明构思,本发明还提供了一种对话语料意图分析系统,所述系统包含服务器及显示设备,其中所述服务器存储有计算机程序,所述计算机程序可执行实现图1实施例或图2实施例中所提供的对话语料意图分析方法,并基于分析结果生成展示信息,发送至所述显示设备,所述显示设备接收所述展示信息,并进行对所述展示信息进行显示。
其中,所述展示信息的形式可包含图示、电子表格、文字等。
更进一步的,本发明还提供一种电子设备,包括:至少一个处理器;以及,与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行图1实施例或图2实施例所提供的对话语料意图分析方法。
其中,存储器和处理器采用总线方式连接,总线可以包括任意数量的互联的总线和桥,总线将一个或多个处理器和存储器的各种电路连接在一起。总线还可以将诸如外围设备、稳压器和功率管理电路等之类的各种其他电路连接在一起,这些都是本领域所公知的,因此,本文不再对其进行进一步描述。总线接口在总线和收发机之间提供接口。收发机可以是一个元件,也可以是多个元件,比如多个接收器和发送器,提供用于在传输介质上与各种其他装置通信的单元。经处理器处理的数据通过天线在无线介质上进行传输,进一步,天线还接收数据并将数据传送给处理器。
处理器负责管理总线和通常的处理,还可以提供各种功能,包括定时,外围接口,电压调节、电源管理以及其他控制功能。而存储器可以被用于存储处理器在执行操作时所使用的数据。
本发明又一实施例涉及一种计算机可读存储介质,存储有计算机程序。计算机程序被处理器执行时,实现上述方法实施例。
本领域技术人员可以理解,实现上述实施例方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序存储在一个存储介质中,包括若干指令用以使得一个设备(可以是单片机,芯片等)或处理器(processor)执行本申请各个实施例方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-OnlyMemory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (8)
1.一种对话语料意图分析方法,其特征在于,所述对话语料包含多条语句,所述方法包含:基于预设意图识别模型对每条所述语句进行意图识别,确定每条所述语句中所包含的意图信息;
基于每条所述语句在对应的所述对话语料中出现的先后顺序及所述对应的意图信息,生成意图分析树;
确定所述分析树中,各节点间的跳转概率。
2.如权利要求1所述的方法,其特征在于,所述预设意图识别模型的构建方法包含:
将所述对话语料进行问、答语句的分类;
分别对各所述对话语料中的所述问语句和所述答语句进行合并,得到问语句集合、答语句集合;
分别对所述问语句集合、所述答语句集合进行聚类,获得相应的分类;
从各所述分类语句中分别抽取预设数量的训练语句;
对所述训练语句进行意图标注;
基于标注后的所述训练语句对所述预设意图识别算法进行训练,得到所述预设意图识别模型。
3.如权利要求1所述的方法,其特征在于,所述基于每条所述语句在对应的所述对话语料中出现的先后顺序及所述对应的意图信息,生成所述意图分析树,具体包含:
将各所述对话语料中的每条所述语句的意图信息作为所述意图分析树的节点,并基于每条所述语句在对应的所述对话语料中出现的先后顺序,确定所述节点的父子关系;
基于各所述对话语料确定出的各所述节点及所述父子关系进行对应合并,生成所述意图分析树。
4.如权利要求1所述的方法,其特征在于,所述确定所述分析树中,各节点间的跳转概率具体包含:
统计各所述对话语料中各所述语句的意图信息及在对应的所述对话语料中出现的先后顺序,确定所述各节点间的跳转概率。
5.如权利要求1所述的方法,其特征在于,在生成所述意图分析树前,更包含步骤:
对各所述对话语料中各所述语句的会话身份进行标注;
并在生成所述意图分析树时,对所述会话身份进行展示。
6.一种对话语料意图分析系统,其特征在于,所述系统包含服务器及显示设备,其中所述服务器存储有计算机程序,所述计算机程序可执行实现权利要求1至5中任一项所述的对话语料意图分析方法,并基于分析结果生成展示信息,发送至所述显示设备,所述显示设备接收所述展示信息,并进行对所述展示信息进行显示。
7.如权利要求6所述的系统,其特征在于,所述展示信息的形式可包含图示、电子表格、文字。
8.一种电子设备,其特征在于,包括:
至少一个处理器;以及,
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行如权利要求1至5中任一所述的对话语料意图分析方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811038349.9A CN109446509B (zh) | 2018-09-06 | 2018-09-06 | 一种对话语料意图分析方法、系统及电子设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811038349.9A CN109446509B (zh) | 2018-09-06 | 2018-09-06 | 一种对话语料意图分析方法、系统及电子设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109446509A true CN109446509A (zh) | 2019-03-08 |
CN109446509B CN109446509B (zh) | 2023-04-07 |
Family
ID=65530303
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811038349.9A Active CN109446509B (zh) | 2018-09-06 | 2018-09-06 | 一种对话语料意图分析方法、系统及电子设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109446509B (zh) |
Cited By (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110162775A (zh) * | 2019-03-11 | 2019-08-23 | 腾讯科技(深圳)有限公司 | 确定意图识别准确度的方法、装置及计算机设备 |
CN110377722A (zh) * | 2019-07-29 | 2019-10-25 | 中国工商银行股份有限公司 | 响应方法及装置、电子设备和可读存储介质 |
CN110995945A (zh) * | 2019-11-29 | 2020-04-10 | 中国银行股份有限公司 | 一种生成外呼流程的数据处理方法、装置、设备及系统 |
CN111143524A (zh) * | 2019-12-06 | 2020-05-12 | 联想(北京)有限公司 | 一种用户意图确定方法及电子设备 |
CN111242431A (zh) * | 2019-12-31 | 2020-06-05 | 联想(北京)有限公司 | 信息处理方法和装置、构建客服对话工作流的方法和装置 |
CN111683182A (zh) * | 2020-06-11 | 2020-09-18 | 中国银行股份有限公司 | 一种业务节点的处理方法及系统 |
CN111881267A (zh) * | 2020-05-25 | 2020-11-03 | 重庆兆光科技股份有限公司 | 一种抽取对话语料中关键语句的方法、系统、设备及介质 |
CN112131357A (zh) * | 2020-08-21 | 2020-12-25 | 国网浙江省电力有限公司杭州供电公司 | 一种基于智能对话模型的用户意图识别方法及装置 |
CN112989794A (zh) * | 2019-12-16 | 2021-06-18 | 科沃斯商用机器人有限公司 | 模型训练方法、装置、智能机器人和存储介质 |
CN114239496A (zh) * | 2021-11-12 | 2022-03-25 | 北京卓思天成数据咨询股份有限公司 | 服务状态生成方法、装置、设备及计算机可读存储介质 |
WO2022156086A1 (zh) * | 2021-01-21 | 2022-07-28 | 平安科技(深圳)有限公司 | 人机交互方法、装置、设备及存储介质 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20070208556A1 (en) * | 2006-03-03 | 2007-09-06 | Samsung Electronics Co., Ltd. | Apparatus for providing voice dialogue service and method of operating the same |
CN105335400A (zh) * | 2014-07-22 | 2016-02-17 | 阿里巴巴集团控股有限公司 | 针对用户的提问意图获取答案信息的方法及装置 |
CN105786798A (zh) * | 2016-02-25 | 2016-07-20 | 上海交通大学 | 一种人机交互中自然语言意图理解方法 |
CN106653019A (zh) * | 2016-12-07 | 2017-05-10 | 华南理工大学 | 一种基于用户注册信息的人机对话控制方法及系统 |
CN108009287A (zh) * | 2017-12-25 | 2018-05-08 | 北京中关村科金技术有限公司 | 一种基于对话系统的回答数据生成方法以及相关装置 |
-
2018
- 2018-09-06 CN CN201811038349.9A patent/CN109446509B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20070208556A1 (en) * | 2006-03-03 | 2007-09-06 | Samsung Electronics Co., Ltd. | Apparatus for providing voice dialogue service and method of operating the same |
CN105335400A (zh) * | 2014-07-22 | 2016-02-17 | 阿里巴巴集团控股有限公司 | 针对用户的提问意图获取答案信息的方法及装置 |
CN105786798A (zh) * | 2016-02-25 | 2016-07-20 | 上海交通大学 | 一种人机交互中自然语言意图理解方法 |
CN106653019A (zh) * | 2016-12-07 | 2017-05-10 | 华南理工大学 | 一种基于用户注册信息的人机对话控制方法及系统 |
CN108009287A (zh) * | 2017-12-25 | 2018-05-08 | 北京中关村科金技术有限公司 | 一种基于对话系统的回答数据生成方法以及相关装置 |
Cited By (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110162775B (zh) * | 2019-03-11 | 2024-08-20 | 腾讯科技(深圳)有限公司 | 确定意图识别准确度的方法、装置及计算机设备 |
CN110162775A (zh) * | 2019-03-11 | 2019-08-23 | 腾讯科技(深圳)有限公司 | 确定意图识别准确度的方法、装置及计算机设备 |
CN110377722A (zh) * | 2019-07-29 | 2019-10-25 | 中国工商银行股份有限公司 | 响应方法及装置、电子设备和可读存储介质 |
CN110995945A (zh) * | 2019-11-29 | 2020-04-10 | 中国银行股份有限公司 | 一种生成外呼流程的数据处理方法、装置、设备及系统 |
CN111143524A (zh) * | 2019-12-06 | 2020-05-12 | 联想(北京)有限公司 | 一种用户意图确定方法及电子设备 |
CN112989794A (zh) * | 2019-12-16 | 2021-06-18 | 科沃斯商用机器人有限公司 | 模型训练方法、装置、智能机器人和存储介质 |
CN111242431A (zh) * | 2019-12-31 | 2020-06-05 | 联想(北京)有限公司 | 信息处理方法和装置、构建客服对话工作流的方法和装置 |
CN111881267A (zh) * | 2020-05-25 | 2020-11-03 | 重庆兆光科技股份有限公司 | 一种抽取对话语料中关键语句的方法、系统、设备及介质 |
CN111683182B (zh) * | 2020-06-11 | 2022-05-27 | 中国银行股份有限公司 | 一种业务节点的处理方法及系统 |
CN111683182A (zh) * | 2020-06-11 | 2020-09-18 | 中国银行股份有限公司 | 一种业务节点的处理方法及系统 |
CN112131357A (zh) * | 2020-08-21 | 2020-12-25 | 国网浙江省电力有限公司杭州供电公司 | 一种基于智能对话模型的用户意图识别方法及装置 |
WO2022156086A1 (zh) * | 2021-01-21 | 2022-07-28 | 平安科技(深圳)有限公司 | 人机交互方法、装置、设备及存储介质 |
CN114239496A (zh) * | 2021-11-12 | 2022-03-25 | 北京卓思天成数据咨询股份有限公司 | 服务状态生成方法、装置、设备及计算机可读存储介质 |
CN114239496B (zh) * | 2021-11-12 | 2023-10-24 | 北京卓思天成数据咨询股份有限公司 | 服务状态生成方法、装置、设备及计算机可读存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN109446509B (zh) | 2023-04-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109446509B (zh) | 一种对话语料意图分析方法、系统及电子设备 | |
CN109522556B (zh) | 一种意图识别方法及装置 | |
CN112733042B (zh) | 推荐信息的生成方法、相关装置及计算机程序产品 | |
CN105657129A (zh) | 通话信息获取方法和装置 | |
CN113360622B (zh) | 用户对话信息的处理方法、装置及计算机设备 | |
CN105117387B (zh) | 一种智能机器人交互系统 | |
US20220138770A1 (en) | Method and apparatus for analyzing sales conversation based on voice recognition | |
CN110890088A (zh) | 语音信息反馈方法、装置、计算机设备和存储介质 | |
CN108733635B (zh) | 一种文本信息展示方法及装置 | |
CN114090755A (zh) | 基于知识图谱的回复语句确定方法、装置及电子设备 | |
CN110162359A (zh) | 新手引导信息的推送方法、装置及系统 | |
CN109508367A (zh) | 自动提取问答语料的方法、在线智能客服系统及电子设备 | |
Alam et al. | Comparative study of speaker personality traits recognition in conversational and broadcast news speech. | |
CN112818227A (zh) | 内容推荐方法、装置、电子设备及存储介质 | |
CN112053205A (zh) | 通过机器人情绪识别的产品推荐方法及装置 | |
CN114202402A (zh) | 行为特征预测方法及装置 | |
CN110427470A (zh) | 问答处理方法、装置及电子设备 | |
CN111984764A (zh) | 流单原因分析方法、装置、计算机设备及可读存储介质 | |
US20160314701A1 (en) | Method and system for managing a wordgraph | |
CN109919657A (zh) | 用户需求信息的获取方法、装置、存储介质及语音设备 | |
CN111539806A (zh) | 一种公告内容结构化的方法及相关装置 | |
CN112463947A (zh) | 营销方案迭代方法、系统、计算机设备及可读存储介质 | |
CN112328871A (zh) | 一种基于rpa模块的回复生成方法、装置、设备及存储介质 | |
CN111882339A (zh) | 预测模型训练及响应率预测方法、装置、设备及存储介质 | |
CN111883111A (zh) | 话术训练处理方法、装置、计算机设备和可读存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |