CN116431794A - 一种基于流程自动化机器人技术的智能问答方法及系统 - Google Patents
一种基于流程自动化机器人技术的智能问答方法及系统 Download PDFInfo
- Publication number
- CN116431794A CN116431794A CN202310707603.4A CN202310707603A CN116431794A CN 116431794 A CN116431794 A CN 116431794A CN 202310707603 A CN202310707603 A CN 202310707603A CN 116431794 A CN116431794 A CN 116431794A
- Authority
- CN
- China
- Prior art keywords
- channel
- response
- carrying
- content
- identification
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 50
- 238000005516 engineering process Methods 0.000 title claims abstract description 31
- 230000004044 response Effects 0.000 claims abstract description 93
- 238000000605 extraction Methods 0.000 claims abstract description 32
- 238000012545 processing Methods 0.000 claims abstract description 25
- 230000011218 segmentation Effects 0.000 claims abstract description 21
- 238000004801 process automation Methods 0.000 claims abstract description 16
- 230000003993 interaction Effects 0.000 claims description 23
- 238000004458 analytical method Methods 0.000 claims description 15
- 238000005457 optimization Methods 0.000 claims description 9
- 238000012216 screening Methods 0.000 claims description 7
- 230000003313 weakening effect Effects 0.000 claims description 6
- 230000008569 process Effects 0.000 description 10
- 238000003058 natural language processing Methods 0.000 description 9
- 230000000694 effects Effects 0.000 description 6
- 230000008901 benefit Effects 0.000 description 4
- 238000004364 calculation method Methods 0.000 description 4
- 238000010586 diagram Methods 0.000 description 3
- 230000006872 improvement Effects 0.000 description 3
- 239000000463 material Substances 0.000 description 3
- 230000009466 transformation Effects 0.000 description 3
- 238000004891 communication Methods 0.000 description 2
- 238000010276 construction Methods 0.000 description 2
- 230000008451 emotion Effects 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 238000000513 principal component analysis Methods 0.000 description 2
- 238000007619 statistical method Methods 0.000 description 2
- 238000000844 transformation Methods 0.000 description 2
- 238000013473 artificial intelligence Methods 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000007635 classification algorithm Methods 0.000 description 1
- 238000007621 cluster analysis Methods 0.000 description 1
- 238000010219 correlation analysis Methods 0.000 description 1
- 238000007418 data mining Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000005065 mining Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/332—Query formulation
- G06F16/3329—Natural language query formulation or dialogue systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/205—Parsing
- G06F40/216—Parsing using statistical methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02P—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
- Y02P90/00—Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
- Y02P90/02—Total factory control, e.g. smart factories, flexible manufacturing systems [FMS] or integrated manufacturing systems [IMS]
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Computational Linguistics (AREA)
- Mathematical Physics (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- General Health & Medical Sciences (AREA)
- Human Computer Interaction (AREA)
- Probability & Statistics with Applications (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明提供了一种基于流程自动化机器人技术的智能问答方法及系统,涉及智能问答技术领域,包括:读取客服工作聊天记录,进行聊天响应的准确标识,提取聊天记录的关键词特征,进行关键词特征的词性分类,构建多个词性的通道集合,进行关联强弱标识,交互实时客户的消息内容,进行消息内容的内容分割提取,匹配识别,输出每一通道的应答内容,对所有通道进行共性应答内容提取,计算联合通道强弱特征值,根据最高联合通道强弱特征值对应的共性应答内容进行消息内容的应答处理。本发明解决了现有技术中智能问答系统存在不能根据历史聊天记录进行分析,使得问答系统回答较为固定,导致不能准确、针对性地回答不同用户的问题的技术问题。
Description
技术领域
本发明涉及智能问答技术领域,具体涉及一种基于流程自动化机器人技术的智能问答方法及系统。
背景技术
随着互联网和人工智能技术的快速发展,智能问答系统越来越广泛地应用于客户服务、在线咨询等场景,为了提供更好的用户体验,智能问答系统需要不断优化以生成更准确、满足客户需求的回答。而现今常用的智能问答还存在着一定的弊端,对于智能问答还存在着一定的可提升空间。
发明内容
本申请通过提供了一种基于流程自动化机器人技术的智能问答方法及系统,旨在解决现有技术中智能问答系统存在不能根据历史聊天记录进行分析,使得问答系统回答较为固定,导致不能准确、针对性地回答不同用户的问题的技术问题。
鉴于上述问题,本申请提供了一种基于流程自动化机器人技术的智能问答方法及系统。
本申请公开的第一个方面,提供了一种基于流程自动化机器人技术的智能问答方法,所述方法包括:读取客服工作聊天记录,并进行聊天响应的准确标识;提取所述聊天记录的关键词特征,并进行关键词特征的词性分类,构建多个词性的通道集合,并基于所述准确标识进行所述通道集合与应答内容的关联强弱标识;交互实时客户的消息内容,并进行所述消息内容的内容分割提取;基于所述通道集合进行内容分割提取结果的通道匹配识别,并基于匹配识别结果中的关联强弱标识输出每一通道的应答内容;对所有通道进行共性应答内容提取,并基于所有通道的关联强弱标识计算联合通道强弱特征值;根据最高联合通道强弱特征值对应的共性应答内容进行所述消息内容的应答处理。
本申请公开的另一个方面,提供了一种基于流程自动化机器人技术的智能问答系统,所述系统用于上述方法,所述系统包括:聊天记录获取模块,所述聊天记录获取模块用于读取客服工作聊天记录,并进行聊天响应的准确标识;关键词特征提取模块,所述关键词特征提取模块用于提取所述聊天记录的关键词特征,并进行关键词特征的词性分类,构建多个词性的通道集合,并基于所述准确标识进行所述通道集合与应答内容的关联强弱标识;消息内容交互模块,所述消息内容交互模块用于交互实时客户的消息内容,并进行所述消息内容的内容分割提取;通道匹配识别模块,所述通道匹配识别模块用于基于所述通道集合进行内容分割提取结果的通道匹配识别,并基于匹配识别结果中的关联强弱标识输出每一通道的应答内容;共性应答提取模块,所述共性应答提取模块用于对所有通道进行共性应答内容提取,并基于所有通道的关联强弱标识计算联合通道强弱特征值;消息应答处理模块,所述消息应答处理模块用于根据最高联合通道强弱特征值对应的共性应答内容进行所述消息内容的应答处理。
本申请中提供的一个或多个技术方案,至少具有如下技术效果或优点:
读取客服工作聊天记录,进行聊天响应的准确标识,提取所述聊天记录的关键词特征,进行关键词特征的词性分类,构建多个词性的通道集合,进行关联强弱标识,交互实时客户的消息内容,进行所述消息内容的内容分割提取,进行匹配识别,输出每一通道的应答内容,对所有通道进行共性应答内容提取,计算联合通道强弱特征值,根据最高联合通道强弱特征值对应的共性应答内容进行所述消息内容的应答处理。解决了现有技术中智能问答系统存在不能根据历史聊天记录进行分析,使得问答系统回答较为固定,导致不能准确、针对性地回答不同用户的问题的技术问题,实现了从客服工作聊天记录中提取关键词特征,并标识通道集合与应答内容之间的关联强弱,达到提高问答系统的准确性、针对性和可靠性,以及提高问答系统对不同类型问题的处理能力的技术效果。
上述说明仅是本申请技术方案的概述,为了能够更清楚了解本申请的技术手段,而可依照说明书的内容予以实施,并且为了让本申请的上述和其它目的、特征和优点能够更明显易懂,以下特举本申请的具体实施方式。
附图说明
图1为本申请实施例提供了一种基于流程自动化机器人技术的智能问答方法流程示意图;
图2为本申请实施例提供了一种基于流程自动化机器人技术的智能问答方法中进行联合通道强弱特征值的计算的可能的流程示意图;
图3为本申请实施例提供了一种基于流程自动化机器人技术的智能问答方法中进行通道匹配识别的顺序和频率调用可能的流程示意图;
图4为本申请实施例提供了一种基于流程自动化机器人技术的智能问答系统可能的结构示意图。
附图标记说明:聊天记录获取模块10,关键词特征提取模块20,消息内容交互模块30,通道匹配识别模块40,共性应答提取模块50,消息应答处理模块60。
具体实施方式
本申请实施例通过提供一种基于流程自动化机器人技术的智能问答方法,解决了现有技术中智能问答系统存在不能根据历史聊天记录进行分析,使得问答系统回答较为固定,导致不能准确、针对性地回答不同用户的问题的技术问题,实现了从客服工作聊天记录中提取关键词特征,并标识通道集合与应答内容之间的关联强弱,达到提高问答系统的准确性、针对性和可靠性,以及提高问答系统对不同类型问题的处理能力的技术效果。
在介绍了本申请基本原理后,下面将结合说明书附图来具体介绍本申请的各种非限制性的实施方式。
实施例一
如图1所示,本申请实施例提供了一种基于流程自动化机器人技术的智能问答方法,所述方法包括:
步骤S100:读取客服工作聊天记录,并进行聊天响应的准确标识;
具体而言,读取来自实际客户与客服之间的对话内容,包括文本信息,有时可能还包括共享的图片、链接等其他媒体元素,系统对这些聊天记录进行分析和处理,以便提取有关问题和回答的关键信息,这部分涉及自然语言处理技术,包括分词、词性标注和语义关联等,通过这些方法对聊天记录进行解析和标识,用于后续构建通道集合和关联强弱标识。
步骤S200:提取所述聊天记录的关键词特征,并进行关键词特征的词性分类,构建多个词性的通道集合,并基于所述准确标识进行所述通道集合与应答内容的关联强弱标识;
具体而言,通过自然语言处理技术在聊天记录中解析关键词和短语,这些关键词是问题和回答中具有代表性的词汇,用于帮助系统了解对话的核心内容。将提取到的关键词根据其词性进行分类,如名词、动词、形容词等,以此帮助系统更好地理解聊天记录中的语义结构。根据关键词在问答对中的出现情况和频率,为每种词性创建一个通道集合,为后续生成关联强弱标识时匹配词性与答案之间的关联打下基础。
基于准确标识,包括准确性、评判通道内词与应答的关联强弱,进行通道集合与应答内容的关联强弱标识,其中,准确性为系统根据先前步骤的聊天响应准确标识评估通道内词与应答回复的关联程度,通道内词与应答的关联强弱标识为系统通过比较通道内词与应答回复之间的相似度来衡量关系强度。综合以上两个角度,系统生成综合相关性和准确性因素的关联强弱标识,这些关联强弱标识有助于处理实时客户消息并产生高质量的回答。
步骤S300:交互实时客户的消息内容,并进行所述消息内容的内容分割提取;
具体而言,通过不同平台,如Web聊天窗口、社交媒体、短信等,与在线实时客户进行交互,接收他们发送的消息或问题,运用自然语言处理技术对其进行解析,包括分词、词性标注、去除无关内容、停用词等,其中,分词即将实时客户消息中的长文本拆分为单词和短语;词性标注即为分词结果中的每个单词分配一个词性,如名词、动词、形容词等;去除无关内容、停用词等即消除噪音,使得分析更加准确。通过以上步骤,系统提取出实时客户消息的核心内容,该核心内容可为后续基于通道集合进行内容分割提取结果的通道匹配识别等操作提供依据。
步骤S400:基于所述通道集合进行内容分割提取结果的通道匹配识别,并基于匹配识别结果中的关联强弱标识输出每一通道的应答内容;
具体而言,采用自然语言处理(NLP)技术,针对实时客户消息的内容分割提取结果,依据先前构建的多个词性通道集合进行匹配,即在通道集合中找到与客户问题相关联的关键词和短语。参考之前生成的关联强弱标识,采用相关度分析、词向量相似性比较或其他统计方法对通道内词与答回复之间的关联强度进行定量评估,以找到与当前问题最相关的回答内容,进而评估各通道在解决当前客户问题方面的有效性。根据不同通道的关联强弱标识,为每个通道生成相应的应答内容,在该过程中,高关联强度表示更准确地回答了客户的问题,反之则可能表示回答不够恰当。
其中,自然语言处理(NLP)技术是一种编程技术,使计算机能够理解和生成人类语言,在本例中,NLP技术用于从聊天记录提取和解析关键信息,这对后续处理实时客户问题至关重要,典型的NLP技术包括分词、词性标注和命名实体识别等。
综合这些步骤,系统可根据通道匹配识别和关联强弱标识确定适当的回答内容,接下来,可实施进一步的计算和分析,以优化最终回答并满足用户的需求。
步骤S500:对所有通道进行共性应答内容提取,并基于所有通道的关联强弱标识计算联合通道强弱特征值;
进一步而言,如图2所示,本申请步骤S500还包括:
步骤S510:对所述客户进行历史交互信息统计,并基于统计结果提取客户特征;
步骤S520:对所述客户特征进行特征分析,确定主特征和辅助特征;
步骤S530:基于所述主特征和所述辅助特征分别进行关联名词库匹配,基于匹配结果和关联值构建用户特征库;
步骤S540:通过所述用户特征库生成应答内容的辅助关联特征值;
步骤S550:基于所述辅助关联特征值进行所述联合通道强弱特征值的计算。
具体而言,从数据库或日志文件中收集和分析特定客户与智能问答系统过去的互动记录,包括聊天记录、问题类型、回答内容等。利用数据挖掘技术从历史交互记录中提取有用信息,包括关联规则学习、聚类分析、文本挖掘等,以及特征提取方法,根据统计结果,使用专家知识、对话上下文分析、情感分析等从这些数据中提取客户特征,包括常见问题领域、交流风格、客户满意度,其中,常见问题领域为确定客户经常关注的主题或问题领域;交流风格为识别客户的沟通习惯或语言风格,如正式、非正式、长篇幅等; 客户满意度为通过分析聊天记录中的情感和调查反馈等,了解客户对先前回答的满意程度。
对先前提取的客户特征进行进一步分析,以找出具有代表性且对回答生成最具影响力的主要特征以及次要特征,根据重要性对特征进行分类,从而区分为主要特征和辅助特征,示例性地,通过主成分分析技术(PCA),为客户特征分配权重,表明每个特征在回答生成过程中的重要性,然后根据权重进一步区分主特征和辅助特征,以此帮助系统优先考虑主要特征调整回答内容,同时兼顾辅助特征。
将主特征和辅助特征与预先构建的关联名词库进行匹配,所述关联名词库包含针对特定领域或话题的关键词、短语以及它们与各个特征之间的关系,基于关联名词库匹配的结果和关联值,为每个客户构建一个用户特征库,包含对回答生成有重要作用的主要特征以及补充性的辅助特征,
识别影响客户满意度的关键因素,并将其与相关领域或话题的名词库进行关联,针对每个客户分析其用户特征库,提取与回答生成相关的主特征和辅助特征,根据用户特征库中的内容,计算主特征和辅助特征之间的关联程度,形成一组辅助关联特征值,这些特征值将为后续构建和优化回答提供依据。
通过加权平均法,将用户特征库生成的辅助关联特征值与之前计算得出的通道关联强弱标识结合,以便为每个客户提供更个性化和针对性的回答,基于整合后的辅助关联特征值,重新计算联合通道强弱特征值,该值在考虑了客户需求和兴趣的基础上,综合评估不同通道对实时问题的解答能力。
进一步而言,本申请步骤S510还包括:
步骤S511:设置事件的响应触发阈值;
步骤S512:当进行所述历史交互信息统计时,通过所述响应触发阈值执行事件的触发筛选;
步骤S513:通过触发筛选结果生成特征时序的弱化关联;
步骤S514:基于所述弱化关联完成所述客户特征的提取。
具体而言,为系统的响应事件建立一个触发阈值,这意味着当某个计算出的联合通道强弱特征值或辅助关联特征值超过设定的阈值时,系统将视其为足够相关并触发相应的回答生成操作。阈值可以根据实际需求进行调整,以满足不同场景下的准确性和相应速度标准,较高的阈值会使得智能问答系统对问题产生少量但高质量的回答,而较低的阈值可能导致更多但不太相关的回答。
使用文本分类算法,如神经网络等,对聊天记录进行自动标签分类,标签包括事件类型,如经营主体变更、材料转型等,当从客户历史交互信息中统计数据时,特别关注那些可能对回答生成结果产生较大影响的重要事件,例如,经营主体变更和材料转型等事件可能导致与先前交互不同的回答需求。
采用相似度计算方法,例如余弦相似度,等方法比较当前问题与已标记事件之间的相似程度,根据预设响应触发阈值来判断这些事件是否足够重要而需要针对性地调整回答内容,当相似度超过预设的触发阈值时,意味着它们非常关键且需优先考虑,则系统需要针对性地调整回答内容。
在分析历史交互信息时,某些过去相关的特征可能由于经营主体变更、材料转型等关键事件而不再与客户当前需求密切关联,因此,在识别这些事件后,需要对相应的特征进行弱化处理。通过调整不再密切相关特征的权重或影响程度,在用户特征库中创建一个弱化关联版本,这样一来,答案生成过程将优先考虑客户最近和当前需求的特征。
在完成特征时序的弱化关联操作之后,根据新权重和影响程度重新提取客户特征,这些调整后的特征将更加准确地反映客户当前需求和兴趣,将调整后的客户特征保存到用户特征库中,使得系统可以根据实际需求产生更具针对性的回答。
步骤S600:根据最高联合通道强弱特征值对应的共性应答内容进行所述消息内容的应答处理。
从所有计算出的联合通道强弱特征值中找到最高值,即最高联合通道强弱特征值,这表示与实时客户问题相关度最高的共性应答内容。根据最高联合通道强弱特征值确定相应的共性应答内容,这个回答是在多个通道中匹配度最高且包含最关键信息的回答。最后,系统将选定的共性应答内容作为回复发送给实时客户,这样的答案能够更准确地解决客户的问题,同时也表现出智能问答系统的有效性和高效性。
进一步而言,本申请步骤S600还包括:
步骤S610:设置相似比对区间;
步骤S620:基于所述相似比对区间对所述联合通道强弱特征值进行顺序特征值分析,判断是否存在多个联合通道强弱特征值满足所述相似比对区间;
步骤S630:当存在多个联合通道强弱特征值满足所述相似比对区间时,则基于所述多个联合通道强弱特征值对应的多个共性应答内容生成选择回复结果;
步骤S640:通过所述选择回复结果进行所述消息内容的应答处理。
具体而言,确定一个相似比对区间,用于比较当前问题与历史问题之间的相似性,该区间用于帮助系统查找具有类似问题的现有解决方案或回答,从而为当前问题提供参考,相似比对区间可以根据实际需求进行调整,较宽的相似比对区间可能包含更多的历史问题以供检索,增加答案生成的参考来源;而较窄的相似比对区间能够只关注更紧密相关的问题,从而避免处理无关问题。
在确定相似比对区间之后,根据各自的联合通道强弱特征值对通道进行顺序特征值分析,以此明确不同通道之间的相关性并挖掘潜在的价值,通过对联合通道强弱特征值进行逐一分析,判断与当前问题或需求相符合的通道是否存在多个,并检查它们是否位于预定义的相似比对区间内。示例性地,计算不同通道之间的相关系数,以评估它们在相似比对区间内的相关性,设定一个阈值来判断哪些联合通道强弱特征值满足相似比对区间的要求,超过阈值的通道将被认为对当前问题具有足够的参考价值。当发现存在多个联合通道强弱特征值满足所述相似比对区间时,智能问答系统可以充分利用这些通道之间的关联性以生成更准确、满足客户需求的回答。
在发现存在多个联合通道强弱特征值满足所述相似比对区间的情况下,系统从这些通道中找出存在的共同点或相似之处,如类似问题的解答、相近主题等,将其视为共性应答内容。结合这些共性应答内容,针对当前问题生成一个综合性的选择回复结果,这种回答既考虑了与现有问题相关的多个通道的优势,也充分利用了它们之间的联系和共性。
根据前面步骤产生的选择回复结果,基于多个相关通道所提供的共性应答内容,制定出更精确、贴近客户需求的答案,以满足用户需求和解决问题。
进一步而言,如图3所示,本申请还包括:
步骤S710:设置识别的记忆联动关联时间区间;
步骤S720:当进行所述消息内容的交互后,基于所述记忆联动关联时间区间进行区间内问题调用,并读取回复结果;
步骤S730:根据问题调用结果和所述回复结果生成记忆约束权重值;
步骤S740:通过所述记忆约束权重值进行所述通道匹配识别的顺序和频率调用。
具体而言,确定一个时间区间,用于识别和提取客户与智能问答系统之间的历史交互,示例性地,通过滑动时间窗口或固定时间窗口来选取特定时间区间内的交互记录,例如在过去30天、90天或1年的数据中查找有关用户特征和行为模式的信息。这个区间定义了处理哪些先前互动数据以理解用户需求、找出相关信息并生成答案。该记忆联动关联时间区间可以根据实际需求进行调整,以便权衡历史信息和当前信息的重要性,较长的时间区间可以提供更多上下文信息和长期趋势,而较短的时间区间可以凸显用户近期兴趣和需求。
在完成与客户的消息内容交互之后,智能问答系统根据预设的记忆联动关联时间区间从历史数据中提取相关问题及其回答,即在已设定的时间区间内检索与当前问题类似或相关的历史问题,这有助于分析客户以往的需求与偏好,以更好地处理新问题。针对每个调用的历史问题,系统读取和分析相应的回复结果,这些回复结果可以为现有问题提供参考信息,帮助系统生成更准确且满足用户需求的答案。
评估上述历史数据在当前问题中的影响程度,为此,将为每个查询到的相关问题及其回复生成一个记忆约束权重值。一方面,采用皮尔逊相关系数法,计算历史问题与回答与当前问题的相关性,基于评估结果,分配给相应问题的记忆约束权重值;另一方面,利用时间衰减函数,如指数衰减,来衡量历史问题及回答在时间维度上的影响力,将此作为记忆约束权重值的一部分。
记忆约束权重值代表了相应历史问题与回复在处理现有问题时的重要性,较高的权重值表示相应历史问题和回答对当前问题更具参考价值,而较低的权重值则会减小其对答案的影响。
利用计算出的记忆约束权重值来优化通道的匹配识别,根据历史问题和回答对现有问题的相关性,以及时间维度,调整不同通道在处理当前问题时的顺序或优先级,以此适当地调整各通道的调用顺序和频率,进而充分利用历史数据以生成更贴合客户需求的回答。
进一步而言,本申请还包括:
步骤S810:读取客户关于所述共性应答内容的回复内容,并基于所述回复内容生成所述共性应答内容的应答结果标识;
步骤S820:通过所述应答结果标识执行通道匹配识别的识别自检,并生成自检结果;
步骤S830:基于所述自检结果完成通道匹配识别的匹配优化。
具体而言,在向客户提供了基于共性应答内容的选择回复结果后,收集并阅读客户对该答案的反馈或响应,根据客户的回复内容,为这些共性应答内容生成一个应答结果标识,这一标识用于帮助系统评估每个共性应答内容在满足客户需求方面的表现,并用作未来优化答案生成过程的依据。
利用之前生成的应答结果标识对通道匹配识别进行识别自检,评估系统是否针对性地关注了正确的特征,或者是否忽略了某些可能影响回答质量的特征。
根据识别自检的结果,找出需要改进的地方,例如权重分配问题、忽略某些关键特征或对特定特征关注度不足等,根据自检结果,对通道匹配识别进行优化,包括调整特征权重、引入注意力机制以增强关键特征在问题处理中的作用以及重新评估通道匹配策略等。
进一步而言,本申请步骤S830还包括:
步骤S831:对所述自检结果进行自检统计,并进行自检的人工标识;
步骤S832:通过所述人工标识和自检统计结果生成注意约束单元;
步骤S833:当后续执行通道匹配时,基于所述注意约束单元执行匹配结果的注意约束,以完成通道匹配识别的匹配优化。
具体而言,对自检结果进行统计分析,以量化问题答案的质量、答案正确率等方面的表现,详细了解系统在回答各类问题时的优缺点以确定需要改进的部分。将自检结果提交给专业人员进行人工标识,这些人员可以为每个回答打上相应的标签,如“准确”、“不准确”或“需改进”等,以进一步评估并指导系统的优化过程。
依据人工标识和自检统计结果来了解智能问答回答系统的表现,明确在各个领域中存在的问题、需要改进的地方,以及关注的优先级。根据分析结果,创建一个或多个注意约束单元,用以针对性地优化智能问答回答系统,该约束单元主要功能是调整系统关注的特征权重,使其更有效地关注关键信息,并有针对性地提高回答质量。
在后续执行通道匹配过程中,将开发的注意约束单元应用于现有模型,便于系统关注到核心特征并提高回答质量。通过结合注意约束单元的功能,逐步优化通道匹配识别过程,例如调整通道选择、特征权重等,使系统能够更准确地解决用户问题。
综上所述,本申请实施例所提供的一种基于流程自动化机器人技术的智能问答方法及系统具有如下技术效果:
读取客服工作聊天记录,进行聊天响应的准确标识,提取所述聊天记录的关键词特征,进行关键词特征的词性分类,构建多个词性的通道集合,进行关联强弱标识,交互实时客户的消息内容,进行所述消息内容的内容分割提取,进行匹配识别,输出每一通道的应答内容,对所有通道进行共性应答内容提取,计算联合通道强弱特征值,根据最高联合通道强弱特征值对应的共性应答内容进行所述消息内容的应答处理。解决了现有技术中智能问答系统存在不能根据历史聊天记录进行分析,使得问答系统回答较为固定,导致不能准确、针对性地回答不同用户的问题的技术问题,实现了从客服工作聊天记录中提取关键词特征,并标识通道集合与应答内容之间的关联强弱,达到提高问答系统的准确性、针对性和可靠性,以及提高问答系统对不同类型问题的处理能力的技术效果。
实施例二
基于与前述实施例中一种基于流程自动化机器人技术的智能问答方法相同的发明构思,如图4所示,本申请提供了一种基于流程自动化机器人技术的智能问答系统,所述系统包括:
聊天记录获取模块10,所述聊天记录获取模块10用于读取客服工作聊天记录,并进行聊天响应的准确标识;
关键词特征提取模块20,所述关键词特征提取模块20用于提取所述聊天记录的关键词特征,并进行关键词特征的词性分类,构建多个词性的通道集合,并基于所述准确标识进行所述通道集合与应答内容的关联强弱标识;
消息内容交互模块30,所述消息内容交互模块30用于交互实时客户的消息内容,并进行所述消息内容的内容分割提取;
通道匹配识别模块40,所述通道匹配识别模块40用于基于所述通道集合进行内容分割提取结果的通道匹配识别,并基于匹配识别结果中的关联强弱标识输出每一通道的应答内容;
共性应答提取模块50,所述共性应答提取模块50用于对所有通道进行共性应答内容提取,并基于所有通道的关联强弱标识计算联合通道强弱特征值;
消息应答处理模块60,所述消息应答处理模块60用于根据最高联合通道强弱特征值对应的共性应答内容进行所述消息内容的应答处理。
进一步而言,所述系统还包括:
历史信息统计模块,用于对所述客户进行历史交互信息统计,并基于统计结果提取客户特征;
特征分析模块,用于对所述客户特征进行特征分析,确定主特征和辅助特征;
关联匹配模块,用于基于所述主特征和所述辅助特征分别进行关联名词库匹配,基于匹配结果和关联值构建用户特征库;
辅助特征值生成模块,用于通过所述用户特征库生成应答内容的辅助关联特征值;
特征值计算模块,用于基于所述辅助关联特征值进行所述联合通道强弱特征值的计算。
进一步而言,所述系统还包括:
阈值设置模块,用于设置事件的响应触发阈值;
筛选模块,用于当进行所述历史交互信息统计时,通过所述响应触发阈值执行事件的触发筛选;
弱化关联生成模块,用于通过触发筛选结果生成特征时序的弱化关联;
客户特征提取模块,用于基于所述弱化关联完成所述客户特征的提取。
进一步而言,所述系统还包括:
关联时间区间设置模块,用于设置识别的记忆联动关联时间区间;
问题调用模块,用于当进行所述消息内容的交互后,基于所述记忆联动关联时间区间进行区间内问题调用,并读取回复结果;
权重值生成模块,用于根据问题调用结果和所述回复结果生成记忆约束权重值;
调用模块,用于通过所述记忆约束权重值进行所述通道匹配识别的顺序和频率调用。
进一步而言,所述系统还包括:
比对区间设置模块,用于设置相似比对区间;
特征值分析模块,用于基于所述相似比对区间对所述联合通道强弱特征值进行顺序特征值分析,判断是否存在多个联合通道强弱特征值满足所述相似比对区间;
选择回复结果生成模块,用于当存在多个联合通道强弱特征值满足所述相似比对区间时,则基于所述多个联合通道强弱特征值对应的多个共性应答内容生成选择回复结果;
应答处理模块,用于通过所述选择回复结果进行所述消息内容的应答处理。
进一步而言,所述系统还包括:
回复内容读取模块,用于读取客户关于所述共性应答内容的回复内容,并基于所述回复内容生成所述共性应答内容的应答结果标识;
识别自检模块,用于通过所述应答结果标识执行通道匹配识别的识别自检,并生成自检结果;
匹配优化模块,用于基于所述自检结果完成通道匹配识别的匹配优化。
进一步而言,所述系统还包括:
自检统计模块,用于对所述自检结果进行自检统计,并进行自检的人工标识;
注意约束单元生成模块,用于通过所述人工标识和自检统计结果生成注意约束单元;
注意约束模块,用于当后续执行通道匹配时,基于所述注意约束单元执行匹配结果的注意约束,以完成通道匹配识别的匹配优化。
本说明书通过前述对一种基于流程自动化机器人技术的智能问答方法的详细描述,本领域技术人员可以清楚的知道本实施例中一种基于流程自动化机器人技术的智能问答方法及系统,对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本申请。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本申请的精神或范围的情况下,在其它实施例中实现。因此,本申请将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。
Claims (8)
1.一种基于流程自动化机器人技术的智能问答方法,其特征在于,所述方法包括:
读取客服工作聊天记录,并进行聊天响应的准确标识;
提取所述聊天记录的关键词特征,并进行关键词特征的词性分类,构建多个词性的通道集合,并基于所述准确标识进行所述通道集合与应答内容的关联强弱标识;
交互实时客户的消息内容,并进行所述消息内容的内容分割提取;
基于所述通道集合进行内容分割提取结果的通道匹配识别,并基于匹配识别结果中的关联强弱标识输出每一通道的应答内容;
对所有通道进行共性应答内容提取,并基于所有通道的关联强弱标识计算联合通道强弱特征值;
根据最高联合通道强弱特征值对应的共性应答内容进行所述消息内容的应答处理。
2.如权利要求1所述的方法,其特征在于,所述方法还包括:
对所述客户进行历史交互信息统计,并基于统计结果提取客户特征;
对所述客户特征进行特征分析,确定主特征和辅助特征;
基于所述主特征和所述辅助特征分别进行关联名词库匹配,基于匹配结果和关联值构建用户特征库;
通过所述用户特征库生成应答内容的辅助关联特征值;
基于所述辅助关联特征值进行所述联合通道强弱特征值的计算。
3.如权利要求2所述的方法,其特征在于,所述方法还包括:
设置事件的响应触发阈值;
当进行所述历史交互信息统计时,通过所述响应触发阈值执行事件的触发筛选;
通过触发筛选结果生成特征时序的弱化关联;
基于所述弱化关联完成所述客户特征的提取。
4.如权利要求1所述的方法,其特征在于,所述方法还包括:
设置识别的记忆联动关联时间区间;
当进行所述消息内容的交互后,基于所述记忆联动关联时间区间进行区间内问题调用,并读取回复结果;
根据问题调用结果和所述回复结果生成记忆约束权重值;
通过所述记忆约束权重值进行所述通道匹配识别的顺序和频率调用。
5.如权利要求1所述的方法,其特征在于,所述方法还包括:
设置相似比对区间;
基于所述相似比对区间对所述联合通道强弱特征值进行顺序特征值分析,判断是否存在多个联合通道强弱特征值满足所述相似比对区间;
当存在多个联合通道强弱特征值满足所述相似比对区间时,则基于所述多个联合通道强弱特征值对应的多个共性应答内容生成选择回复结果;
通过所述选择回复结果进行所述消息内容的应答处理。
6.如权利要求1所述的方法,其特征在于,所述方法还包括:
读取客户关于所述共性应答内容的回复内容,并基于所述回复内容生成所述共性应答内容的应答结果标识;
通过所述应答结果标识执行通道匹配识别的识别自检,并生成自检结果;
基于所述自检结果完成通道匹配识别的匹配优化。
7.如权利要求6所述的方法,其特征在于,所述方法还包括:
对所述自检结果进行自检统计,并进行自检的人工标识;
通过所述人工标识和自检统计结果生成注意约束单元;
当后续执行通道匹配时,基于所述注意约束单元执行匹配结果的注意约束,以完成通道匹配识别的匹配优化。
8.一种基于流程自动化机器人技术的智能问答系统,其特征在于,用于实施权利要求1-7任一项所述的一种基于流程自动化机器人技术的智能问答方法,包括:
聊天记录获取模块,所述聊天记录获取模块用于读取客服工作聊天记录,并进行聊天响应的准确标识;
关键词特征提取模块,所述关键词特征提取模块用于提取所述聊天记录的关键词特征,并进行关键词特征的词性分类,构建多个词性的通道集合,并基于所述准确标识进行所述通道集合与应答内容的关联强弱标识;
消息内容交互模块,所述消息内容交互模块用于交互实时客户的消息内容,并进行所述消息内容的内容分割提取;
通道匹配识别模块,所述通道匹配识别模块用于基于所述通道集合进行内容分割提取结果的通道匹配识别,并基于匹配识别结果中的关联强弱标识输出每一通道的应答内容;
共性应答提取模块,所述共性应答提取模块用于对所有通道进行共性应答内容提取,并基于所有通道的关联强弱标识计算联合通道强弱特征值;
消息应答处理模块,所述消息应答处理模块用于根据最高联合通道强弱特征值对应的共性应答内容进行所述消息内容的应答处理。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310707603.4A CN116431794B (zh) | 2023-06-15 | 2023-06-15 | 一种基于流程自动化机器人技术的智能问答方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310707603.4A CN116431794B (zh) | 2023-06-15 | 2023-06-15 | 一种基于流程自动化机器人技术的智能问答方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN116431794A true CN116431794A (zh) | 2023-07-14 |
CN116431794B CN116431794B (zh) | 2023-08-15 |
Family
ID=87092973
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310707603.4A Active CN116431794B (zh) | 2023-06-15 | 2023-06-15 | 一种基于流程自动化机器人技术的智能问答方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116431794B (zh) |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112148862A (zh) * | 2020-10-15 | 2020-12-29 | 腾讯科技(深圳)有限公司 | 一种问题意图识别方法、装置、存储介质及电子设备 |
CN112396444A (zh) * | 2019-08-15 | 2021-02-23 | 阿里巴巴集团控股有限公司 | 一种智能机器人应答方法及装置 |
CN115455158A (zh) * | 2022-08-24 | 2022-12-09 | 阿里巴巴(中国)有限公司 | 智能聊天的信息处理方法、装置、电子设备及存储设备 |
CN115795007A (zh) * | 2022-11-17 | 2023-03-14 | 中国平安人寿保险股份有限公司 | 智能问答方法、智能问答装置、电子设备及存储介质 |
WO2023083262A1 (zh) * | 2021-11-12 | 2023-05-19 | 华为技术有限公司 | 基于多设备提供服务的方法、相关装置及系统 |
-
2023
- 2023-06-15 CN CN202310707603.4A patent/CN116431794B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112396444A (zh) * | 2019-08-15 | 2021-02-23 | 阿里巴巴集团控股有限公司 | 一种智能机器人应答方法及装置 |
CN112148862A (zh) * | 2020-10-15 | 2020-12-29 | 腾讯科技(深圳)有限公司 | 一种问题意图识别方法、装置、存储介质及电子设备 |
WO2023083262A1 (zh) * | 2021-11-12 | 2023-05-19 | 华为技术有限公司 | 基于多设备提供服务的方法、相关装置及系统 |
CN115455158A (zh) * | 2022-08-24 | 2022-12-09 | 阿里巴巴(中国)有限公司 | 智能聊天的信息处理方法、装置、电子设备及存储设备 |
CN115795007A (zh) * | 2022-11-17 | 2023-03-14 | 中国平安人寿保险股份有限公司 | 智能问答方法、智能问答装置、电子设备及存储介质 |
Non-Patent Citations (3)
Title |
---|
YI-HUI CHEN ET AL.: ""Intelligent SPARQL Query Generation for Natural Language Processing Systems"", 《IEEE》, pages 38 - 50 * |
桑瑞婷: ""面向高校迎新的机器人问答系统研究"", 《中国优秀硕士学位论文全文数据库 (信息科技辑)》, no. 8 * |
钞芳宁: ""多轮交互问答机器人研究与实现"", 《中国优秀硕士学位论文全文数据库 (信息科技辑)》, no. 5 * |
Also Published As
Publication number | Publication date |
---|---|
CN116431794B (zh) | 2023-08-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110765244B (zh) | 获取应答话术的方法、装置、计算机设备及存储介质 | |
US10846488B2 (en) | Collating information from multiple sources to create actionable categories and associated suggested actions | |
US20210192143A1 (en) | Natural language generation using pinned text and multiple discriminators | |
WO2020244073A1 (zh) | 基于语音的用户分类方法、装置、计算机设备及存储介质 | |
Coussement et al. | Integrating the voice of customers through call center emails into a decision support system for churn prediction | |
KR102100214B1 (ko) | 음성 인식 기반의 세일즈 대화 분석 방법 및 장치 | |
CN112732871A (zh) | 一种机器人催收获取客户意向标签的多标签分类方法 | |
CN102402717A (zh) | 数据分析设备和方法 | |
CN110275949A (zh) | 用于贷款应用的自动应答方法及系统 | |
CN116150651A (zh) | 基于ai的深度合成检测方法和系统 | |
Ali et al. | K-means clustering to improve the accuracy of decision tree response classification | |
CN112667792A (zh) | 人机对话数据处理方法、装置、计算机设备和存储介质 | |
CN116431794B (zh) | 一种基于流程自动化机器人技术的智能问答方法及系统 | |
CN111736804A (zh) | 一种基于用户评论识别App关键功能的方法及装置 | |
CN115730058A (zh) | 一种基于知识融合的推理问答方法 | |
CN113673237A (zh) | 模型训练、意图识别方法、装置、电子设备及存储介质 | |
CN113139058A (zh) | 一种用户障碍识别方法和系统 | |
CN113177164A (zh) | 基于大数据的多平台协同新媒体内容监控管理系统 | |
Bianchi et al. | A machine learning based help desk approach for units involved in official surveys | |
KR102135098B1 (ko) | 세종실록을 이용한 정책 자문 서비스 시스템 | |
KR20200088164A (ko) | 소셜 네트워크 서비스 메시지의 감정 분석을 위한 POS(part of speech) 특징기반의 감정 분석 방법 및 이를 수행하는 감정 분석 장치 | |
CN117668205B (zh) | 智慧物流客服处理方法、系统、设备及存储介质 | |
CN113239164B (zh) | 多轮对话流程构建方法、装置、计算机设备及存储介质 | |
CN117131183B (zh) | 一种基于会话模拟的客服自动回复方法及系统 | |
JP4348145B2 (ja) | 文章分類プログラム、文章分類方法および文章分類装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |