CN113641808A - 基于槽位信息的解答方法、装置、设备及存储介质 - Google Patents
基于槽位信息的解答方法、装置、设备及存储介质 Download PDFInfo
- Publication number
- CN113641808A CN113641808A CN202110874820.3A CN202110874820A CN113641808A CN 113641808 A CN113641808 A CN 113641808A CN 202110874820 A CN202110874820 A CN 202110874820A CN 113641808 A CN113641808 A CN 113641808A
- Authority
- CN
- China
- Prior art keywords
- information
- user
- target
- slot position
- entity information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 49
- 239000013598 vector Substances 0.000 claims description 87
- 238000012545 processing Methods 0.000 claims description 17
- 238000012549 training Methods 0.000 claims description 15
- 238000004590 computer program Methods 0.000 claims description 13
- 238000004422 calculation algorithm Methods 0.000 claims description 11
- 238000012544 monitoring process Methods 0.000 claims description 9
- 238000004364 calculation method Methods 0.000 claims description 8
- 238000004891 communication Methods 0.000 claims description 8
- 238000003058 natural language processing Methods 0.000 claims description 6
- 230000011218 segmentation Effects 0.000 claims description 6
- 238000010801 machine learning Methods 0.000 claims description 5
- 230000014509 gene expression Effects 0.000 claims description 4
- 230000009286 beneficial effect Effects 0.000 abstract description 3
- 238000005516 engineering process Methods 0.000 description 15
- 238000007726 management method Methods 0.000 description 10
- 230000008569 process Effects 0.000 description 8
- 238000000605 extraction Methods 0.000 description 7
- 238000013473 artificial intelligence Methods 0.000 description 5
- 238000004458 analytical method Methods 0.000 description 4
- 230000004048 modification Effects 0.000 description 4
- 238000012986 modification Methods 0.000 description 4
- 230000006978 adaptation Effects 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 238000012550 audit Methods 0.000 description 2
- 238000012423 maintenance Methods 0.000 description 2
- 230000001360 synchronised effect Effects 0.000 description 2
- 238000013475 authorization Methods 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000004140 cleaning Methods 0.000 description 1
- 230000008094 contradictory effect Effects 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 230000003203 everyday effect Effects 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 238000007526 fusion splicing Methods 0.000 description 1
- 230000003862 health status Effects 0.000 description 1
- 230000008676 import Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000012954 risk control Methods 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/332—Query formulation
- G06F16/3329—Natural language query formulation or dialogue systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
- G06F40/295—Named entity recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0281—Customer communication at a business location, e.g. providing product or service information, consulting
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Computational Linguistics (AREA)
- Artificial Intelligence (AREA)
- General Health & Medical Sciences (AREA)
- Development Economics (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- Strategic Management (AREA)
- Mathematical Physics (AREA)
- Health & Medical Sciences (AREA)
- Finance (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Accounting & Taxation (AREA)
- Game Theory and Decision Science (AREA)
- Entrepreneurship & Innovation (AREA)
- Human Computer Interaction (AREA)
- Marketing (AREA)
- General Business, Economics & Management (AREA)
- Economics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明提供了一种基于槽位信息的解答方法、装置、设备及存储介质,其中方法包括:通过智能客服机器人获取用户当前提出的用户问题,获取指定时间内的槽位信息,提取所述用户问题中的实体信息,结合所述用户问题和槽位信息中的目标信息获取回复语句,将所述回复语句发送给所述智能客服机器人以展示给所述用户。本发明的有益效果:使智能客服机器人具有多轮对话的能力,可以有效的利用用户的历史问话记录,使与用户的对话更加流畅,提高用户的体验。
Description
技术领域
本发明涉及人工智能领域,特别涉及一种基于槽位信息的解答方法、装置、设备及存储介质。
背景技术
智能客服机器人是在大规模知识处理基础上发展起来的一项面向行业的应用,它具备大规模知识处理技术、自然语言理解技术、知识管理技术、自动问答系统、推理技术等等,具有行业通用性,不仅为企业提供了细粒度知识管理技术,还为企业与海量用户之间的沟通建立了一种基于自然语言的快捷有效的技术手段。
目前,现有的业界智能客服机器人都不具备多轮对话能力,无法利用同一用户之前的历史问话记录,导致智能客服机器人与用户的对话不流畅,使用户的体验不佳。
发明内容
本发明的主要目的为提供一种基于槽位信息的解答方法、装置、设备及存储介质,旨在解决智能客服机器人不具备多轮对话能力的问题。
本发明提供了一种基于槽位信息的解答方法,包括:
通过智能客服机器人获取用户当前提出的用户问题,并提取所述用户问题中的实体信息;
基于所述用户问题获取指定时间内的槽位信息;所述槽位信息为槽位中记录的历史实体信息;
判断所述槽位信息中是否具有与所述实体信息中相关的目标信息;
若具有,则结合所述用户问题和所述目标信息获取回复语句;
将所述回复语句发送给所述智能客服机器人以展示给所述用户。
进一步地,所述基于所述用户问题获取指定时间内的槽位信息的步骤之前,还包括:
获取所述用户在所述指定时间内的多轮对话;
提取所述多轮对话中的相应的历史实体信息;
分析所述历史实体信息所属的槽位;
将所述历史实体信息保存于所述槽位中,构成所述槽位对应的所述槽位信息。
进一步地,所述提取所述用户问题中的实体信息的步骤之后,还包括:
分析所述实体信息所属的目标槽位;
判断所述目标槽位中是否存在有所述历史实体信息;
若具有所述历史实体信息,则将所述实体信息与所述历史实体信息进行压栈保存。
进一步地,所述提取所述用户问题中的实体信息的步骤,包括:
将所述用户问题进行标准化处理,得到处理后的标准化问题,并赋予所述标准化问题对应的所述用户的TOKEN标签,其中所述标准化处理包括根据特殊字符标识库剔除所述问题中的标点符号、统一语种、删除不相关词句,所述不相关词句包括问候语、形容词以及脏词;
通过BERT训练模型fine-tuning的方式对所述标准化问题进行分词处理,得到所述标准化问题对应的词向量集;
按照词性将所述词向量集中与所述实体信息无关的词汇剔除,得到目标词向量集;
将所述目标词向量集中的每个词输入至预先设置的相识度模型中,得到所述实体信息;其中,所述相识度模型为预先根据对应的各种实体信息的不同表达方式训练而成。
进一步地,所述结合所述用户问题和所述目标信息获取回复语句的步骤,包括:
将所述用户问题和所述目标信息进行向量化,分别得到问题向量和信息向量;
将所述问题向量和所述信息向量进行拼接,得到目标向量;
将所述目标向量输入至自然语言处理中的机器学习模型进行计算,从而得到所述目标向量所属的目标类别;
采用文本算法计算所述目标向量与所述目标类别中各个预设问题向量的相似度值;
从所述各所述预设问题向量中,提取所述相似度值最大的目标问题向量;
从预设的数据库中获取所述目标问题向量所对应的所述回复语句。
进一步地,所述获取用户当前提出的用户问题的步骤,包括:
通过业务数据库获取所述用户与所述智能客服机器人的通话信息;
将所述通话信息转化为文字信息,得到所述用户问题;
将所述用户问题存放至本地文件,通过日志监控采集,并上传至集群服务器文件系统上。
进一步地,基于所述用户问题获取指定时间内的槽位信息的步骤之前,还包括:
检测所述用户问题与所述智能客服机器人所对应服务行业的相关值;
判断所述相关值是否大于相关阈值;
若所述相关值大于相关阈值,则执行所述基于所述用户问题获取指定时间内的槽位信息的步骤。
本发明还提供了一种基于槽位信息的解答装置,包括:
第一获取模块,用于通过智能客服机器人获取用户当前提出的用户问题,并提取所述用户问题中的实体信息;
第二获取模块,用于基于所述用户问题获取指定时间内的槽位信息;所述槽位信息为槽位中记录的历史实体信息;
判断模块,用于判断所述槽位信息中是否具有与所述实体信息中相关的目标信息;
结合模块,用于若具有,则结合所述用户问题和所述目标信息获取回复语句;
发送模块,用于将所述回复语句发送给所述智能客服机器人以展示给所述用户。
本发明还提供了一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现上述任一项所述方法的步骤。
本发明还提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述任一项所述的方法的步骤。
本发明的有益效果:通过智能客服机器人获取用户当前提出的用户问题,获取指定时间内的槽位信息,提取所述用户问题中的实体信息,结合所述用户问题和槽位信息中的目标信息获取回复语句,将所述回复语句发送给所述智能客服机器人以展示给所述用户。从而使智能客服机器人具有多轮对话的能力,可以有效的利用用户的历史问话记录,使与用户的对话更加流畅,提高用户的体验。
附图说明
图1是本发明一实施例的一种基于槽位信息的解答方法的流程示意图;
图2是本发明一实施例的一种基于槽位信息的解答装置的结构示意框图;
图3为本申请一实施例的计算机设备的结构示意框图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明的一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
需要说明,本发明实施例中所有方向性指示(诸如上、下、左、右、前、后等)仅用于解释在某一特定姿态(如附图所示)下各部件之间的相对位置关系、运动情况等,如果该特定姿态发生改变时,则该方向性指示也相应地随之改变,所述的连接可以是直接连接,也可以是间接连接。
本文中术语“和/或”,仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。
另外,在本发明中如涉及“第一”、“第二”等的描述仅用于描述目的,而不能理解为指示或暗示其相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。另外,各个实施例之间的技术方案可以相互结合,但是必须是以本领域普通技术人员能够实现为基础,当技术方案的结合出现相互矛盾或无法实现时应当认为这种技术方案的结合不存在,也不在本发明要求的保护范围之内。
参照图1,本发明提出一种基于槽位信息的解答方法,包括:
S1:通过智能客服机器人获取用户当前提出的用户问题,提取所述用户问题中的实体信息;
S2:基于所述用户问题获取指定时间内的槽位信息;所述槽位信息为槽位中记录的历史实体信息;
S3:判断所述槽位信息中是否具有与所述实体信息中相关的目标信息;
S4:若具有,则结合所述用户问题和所述目标信息获取回复语句;
S5:将所述回复语句发送给所述智能客服机器人以展示给所述用户。
如上述步骤S1所述,通过智能客服机器人获取用户当前提出的用户问题。其中采集的用户问题可以是语音格式,也可以是文字格式,若为语音格式,可以通过语音识别技术将其转化为文字格式,采集的方式可以是在智能客服机器人中设置一个采集模块,用于采集该用户问题。需要说明的是,智能客服机器人一般通过语音与客户进行沟通。提取所述用户问题中的实体信息。其中,可以通过相识度提取模型进行提取,相识度提取模型的说明后续有详细论述,此处不再赘述,应当理解的是,可以实现提取实体信息的模型都可以作为相识度模型,例如TextRank关键词提取模型、特征提取模型等。
如上述步骤S2所述,基于所述用户问题获取指定时间内的槽位信息。该指定时间为过去与用户沟通的一段时间内,例如为1天以内,槽位信息为对应槽位所记录有实体信息的信息,理解为对实体信息的记录以及基于该实体信息的回答语句、问题等。一般会设置多个槽位,例如可以包括基金名称,产品属性,基金经理等槽位,而对应的槽位包括多个,且一个槽位信息中也可以包括多个实体信息,若用户问题无特殊说明,则获取的槽位信息为最近的一个实体信息。
如上述步骤S3所述,判断所述槽位信息中是否具有与所述实体信息中相关的目标信息。其中,判断的方式为将提取出的实体信息与槽位信息中的预存的历史实体信息进行比对,比对的方式可以是相似度计算,也可以是语义识别,从而可以达到对槽位信息中是否具有与所述实体信息中相关的目标信息的判断。若槽位信息中没有与实体信息相关的目标信息,则需要直接基于该实体信息从智能客服机器人获取对应的回答语句,该情况一般为用户在指定时间内没有询问过该实体信息中的语句,此时,若用户的问题不清晰,则可以继续询问。
如上述步骤S4所述,当具有该目标信息时,则可以结合用户问题和目标信息快速获取到对应的回复语句,且不需要用户将问题表达足够清晰,例如若用户在指定时间段内已经问过对应的基金名称,然后此次的问题为“上次的基金风险高吗”,则可以直接获取到该基金名称对应的风险等级回复用户,无需再向客户详细询问是哪一种基金。当然,为了准确回答用户,则对应的回复语句应当是“基金名称+风险”所构成的回复语句,从而便于用户判断是否得到所需的答案。
如上述步骤S5所述,将所述回复语句发送给所述智能客服机器人以展示给所述用户。即将回复语句发送给智能客服机器人,由智能客服机器人将该回复语句转化为对应的回复语音,对用户提出的用户问题进行解答。其中,将回复语句发送给智能机器人之后,智能机器人可以通过发送给用户的终端以实现发送给用户,若智能机器人为现场与客户交流,则也可以通过智能机器人的音频播放端(例如耳机、音箱等)进行播放。从而使智能客服机器人具有多轮对话的能力,可以有效的利用用户的历史问话记录,使与用户的对话更加流畅,提高用户的体验。
在一个实施例中,所述基于所述用户问题获取指定时间内的槽位信息的步骤S2之前,还包括:
S101:获取所述用户在所述指定时间内的多轮对话;
S102:提取所述多轮对话中的相应的历史实体信息;
S103:分析所述历史实体信息所属的槽位;
S104:将所述历史实体信息保存于所述槽位中,构成所述槽位对应的所述槽位信息。
如上述步骤S101所述,在提取历史实体信息之前,应当先将历史实体信息保存在对应的槽位之中,获取的方式为先获取用户指定时间内的多轮对话,在获取每轮对话时,都会记录对话内容,因此可以从对应的存储位置处获取到该多轮对话。
如上述步骤S102所述,提取所述多轮对话中的相应的历史实体信息。其中提取历史实体信息的方式与提取实体信息的方式相同,此处不再赘述。
如上述步骤S103所述,分析所述历史实体信息所属的槽位,即不同的历史信息具有相应的槽位,例如各类基金名称应当归于基金名称所在的槽位,分析的方式可以是对各个历史实体信息进行语义识别,或者是事先建立各个实体信息与各个槽位的关联关系表,根据该关联关系表则可以获取到各个历史实体信息对应的槽位。
如上述步骤S104所述,将所述历史实体信息保存于所述槽位中,构成所述槽位对应的所述槽位信息,当该槽位信息包括多个历史实体信息时,则可以在槽位中进行压栈保存,即根据沟通的时间,对各个历史实体信息进行保存,若无特殊说明,在分析实体信息时调用距离当前时间最近的历史实体信息进行分析。
在一个实施例中,所述提取所述用户问题中的实体信息的步骤S3之后,还包括:
S401:分析所述实体信息所属的目标槽位;
S402:判断所述目标槽位中是否存在有所述历史实体信息;
S403:若具有所述历史实体信息,则将所述实体信息与所述历史实体信息进行压栈保存。
如上述步骤S401-S403所述,实现了将实体信息保存在槽位中,即先分析出实体信息所属的目标槽位,分析方式可以是对实体信息进行语义识别,或者是事先建立各个实体信息与各个槽位的关联关系表,根据该关联关系表则可以获取到实体信息对应的目标槽位。若该目标槽位中存在有历史实体信息,则可以将实体信息与历史实体信息进行压栈保存,其中,压栈保存的方式为根据沟通的时间的先后顺序,对实体信息进行保存。
在一个实施例中,所述提取所述用户问题中的实体信息的步骤S1,包括:
S101:将所述用户问题进行标准化处理,得到处理后的标准化问题,并赋予所述标准化问题对应的所述用户的TOKEN标签,其中所述标准化处理包括根据特殊字符标识库剔除所述问题中的标点符号、统一语种、删除不相关词句,所述不相关词句包括问候语、形容词以及脏词;
S102:通过BERT训练模型fine-tuning的方式对所述标准化问题进行分词处理,得到所述标准化问题对应的词向量集;
S103:按照词性将所述词向量集中与所述实体信息无关的词汇剔除,得到目标词向量集;
S104:将所述目标词向量集中的每个词输入至预先设置的相识度模型中,得到所述实体信息;其中,所述相识度模型为预先根据对应的各种实体信息的不同表达方式训练而成。
如上述步骤S101所述,将基于专业词库和特殊字符标识库,例如“基金”、“风险”、“基金经理”等专业词汇对用户问题进行预处理,基于该专业词汇对用户问题中的词句进行标准化处理,标准化处理包括对词句中的词语进行转换、对脏词进行清洗和过滤,对重复的问题和词语进行去重,对同义词进行替换,然后建立TOKEN列表将用户问题导入数据库,其目的是为了通过TOKEN对问题进行标记,以便于后续进行搜索。
如上述步骤S102所述,通过BERT训练模型fine-tuning的方式对所述标准化问题进行分词处理,得到所述标准化问题对应的词向量集。通过BERT中文训练模型对标准问题构建词向量,具体为读取基于标准问题对应的数据集,获取数据集中文本数据。其中BERT中文训练模型基于所述专业词库训练而成,该所述专业词库也可以是生成的数据集,即可以通过BERT预训练模型先读取数据集的文本数据,然后根据训练结果调整模型参数,得到BERT中文训练模型。
如上述步骤S103所述,按照词性将所述词向量集中与所述实体信息无关的词汇剔除,得到目标词向量集。即在本发明中,实体信息一般为名词,即可以将其余的动词,助词等删除,以减小后续分析的工作量,使与客户的沟通更加流畅。其中词性可以根据自然语言处理模型(NLP)进行处理得到,对各个分词进行词性标注,而后根据标注的词性剔除。
如上述步骤S104所述,将所述目标词向量集中的每个词输入至预先设置的相识度模型中,得到所述实体信息。其中相识度模型为根据预先构建的训练数据集训练得到,该训练数据集包括了各种实体信息中不同的词汇表示,从而实现了对相识度模型的训练,将对应的词输入至相识度模型中即可以得到对应的实体信息。其中相识度子模型为TextRank关键词提取模型、特征提取模型中的任一种模型。
在一个实施例中,所述结合所述用户问题和所述目标信息获取回复语句的步骤S4,包括:
S101:将所述用户问题和所述目标信息进行向量化,分别得到问题向量和信息向量;
S102:将所述问题向量和所述信息向量进行拼接,得到目标向量;
S103:将所述目标向量输入至自然语言处理中的机器学习模型进行计算,从而得到所述目标向量所属的目标类别;
S104:采用文本算法计算所述目标向量与所述目标类别中各个预设问题向量的相似度值;
S105:从所述各所述预设问题向量中,提取所述相似度值最大的目标问题向量;
S506:从预设的数据库中获取所述目标问题向量所对应的所述回复语句。
如上述步骤S101所述,将所述用户问题和所述目标信息进行向量化,分别得到问题向量和信息向量。其中,向量化的方式可以是通过Google word2vec工具进行向量化,从而得到对应的问题向量和信息向量。
如上述步骤S102所述,将问题向量和所述信息向量进行拼接,得到目标向量。其中拼接的方法可以进行融合拼接,也可以是直接拼接,后续计算过程中,可以将问题向量与信息向量分别与预设问题向量进行相似度计算,再将计算得到两个相似度求和作为最终的相似度即可。也可以通过融合的方式,例如将两个向量进行比例相加,得到的目标向量,后续再直接与预设问题向量计算相似度即可。
如上述步骤S103所述,其中自然语言中的机器学习模型为基于预设数据库中的实体信息训练而成,具体可以为,输入目标向量时,提取目标向量中的实体向量和/或信息向量,然后根据实体向量对应的类别对目标向量进行分类,以便于后续快速得到相应的答案。
如上述步骤S104所述,采用文本算法计算所述目标向量与所述目标类别中各个预设问题向量的相似度值。其中各个预设问题向量分别为不同的预设问题所对应的向量,一般是事先进行向量化得到,需要说明的是该预设问题向量化的方式与用户向量以及,目标信息的向量化方式相同,以便于计算相似度。文本算法可以是任意的算法,例如为WMD算法(word mover’s distance)、simhash算法、基于余弦相似度的算法、基于SVM向量模型进行计算等。
如上述步骤S105所述,从所述各所述预设问题向量中,提取所述相似度值最大的目标问题向量。其中,由于目标向量与各个预设问题向量的相似度值均已计算得到,从而可以从中提取所述相似度值最大的目标问题向量。
如上述步骤S506所述,从预设的数据库中获取所述目标问题向量所对应的所述回复语句。即该目标问题对应的向量所对应的问题,视为用户所表达的问题,因此获取到该目标问题向量所对应的回复语句,即为用户问题的回复语句,从而实现对用户问题的快速回答。
在一个实施例中,所述过智能客服机器人获取用户当前提出的用户问题的步骤S1,包括:
S111:通过业务数据库获取所述用户与所述智能客服机器人的通话信息;
S112:将所述通话信息转化为文字信息,得到所述用户问题;
S113:将所述用户问题存放至本地文件,以通过日志监控采集的方式上传至集群服务器文件系统上。
如上述步骤S111-S113所述,实现了对用户问题的收集,以便于后续对智能客服机器人进行优化,即对通话信息进行采集,前期可以采用离线方式和定时方式进行收集,后期可以根据业务需求和增加服务器资源进行实时采集处理,采集的方式为通过将通话信息转化为文字信息,然后存放至本地进行保存,其中,本地文件为系统事先所设置的文件,用于接收该用户问题并进行接收。再通过日志监控采集本地文件中的数据,其中,日志监控为每天定时遍历数据,若发生了改变,如增加、减少、修改等情况,则将对应的上述对应的数据上传至集群服务器文件系统上,以便于后续进行数据分析,进一步优化智能服务机器人等。
在一个实施例中,基于所述用户问题获取指定时间内的槽位信息的步骤S2之前,还包括:
S121:检测所述用户问题与所述智能客服机器人所对应服务行业的相关值;
S122:判断所述相关值是否大于相关阈值;
S123:若所述相关值大于相关阈值,则执行所述基于所述用户问题获取指定时间内的槽位信息的步骤。
如上述步骤S121-S123所述,检测用户问题与所述智能客服机器人所对应服务行业的相关值。检测的方式可以是通过文本分类器将用户问题进行分词,然后对分词后的各个词语进行熵化,赋予各个词语不同的权值(权值的赋予可以根据基金业务进行赋予,例如基金业务相关的词语可以赋予权值大一些),然后根据公式:
计算得到相关值Weight(t),其中threshold为预设的参数值,一般可以取1,然后将相关值与预设的相关阈值进行比较,若大于,则执行所述基于所述用户问题获取指定时间内的槽位信息的步骤,若小于,则说明该问题与基金业务不相关,即视为与基金业务不相关,可以不用获取对应的回复语句。
本发明还提供了一种基于槽位信息的解答装置,包括:
第一获取模块,用于通过智能客服机器人获取用户当前提出的用户问题,并提取所述用户问题中的实体信息;
第二获取模块,用于基于所述用户问题获取指定时间内的槽位信息;所述槽位信息为槽位中记录的历史实体信息;
判断模块,用于判断所述槽位信息中是否具有与所述实体信息中相关的目标信息;
结合模块,用于若具有,则结合所述用户问题和所述目标信息获取回复语句;
发送模块,用于将所述回复语句发送给所述智能客服机器人以展示给所述用户。
本发明的有益效果:通过智能客服机器人获取用户当前提出的用户问题,获取指定时间内的槽位信息,提取所述用户问题中的实体信息,结合所述用户问题和槽位信息中的目标信息获取回复语句,将所述回复语句发送给所述智能客服机器人以展示给所述用户。从而使智能客服机器人具有多轮对话的能力,可以有效的利用用户的历史问话记录,使与用户的对话更加流畅,提高用户的体验。
参照图3,本申请实施例中还提供一种计算机设备,该计算机设备可以是服务器,其内部结构可以如图3所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口和数据库。其中,该计算机设计的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储各种槽位信息等。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时可以实现上述任一实施例所述的基于槽位信息的解答方法。
本领域技术人员可以理解,图3中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定。
本申请实施例可以基于人工智能技术对相关的数据进行获取和处理。其中,人工智能(Artificial Intelligence,AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。
人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、机器人技术、生物识别技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。
本申请实施例还提供一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时可以实现上述任一实施例所述的基于槽位信息的解答方法。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储与一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的和实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可以包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM一多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双速据率SDRAM(SSRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、装置、物品或者方法不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、装置、物品或者方法所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、装置、物品或者方法中还存在另外的相同要素。
区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。区块链(Blockchain),本质上是一个去中心化的数据库,是一串使用密码学方法相关联产生的数据块,每一个数据块中包含了一批次网络交易的信息,用于验证其信息的有效性(防伪)和生成下一个区块。区块链可以包括区块链底层平台、平台产品服务层以及应用服务层。
区块链底层平台可以包括用户管理、基础服务、智能合约以及运营监控等处理模块。其中,用户管理模块负责所有区块链参与者的身份信息管理,包括维护公私钥生成(账户管理)、密钥管理以及用户真实身份和区块链地址对应关系维护(权限管理)等,并且在授权的情况下,监管和审计某些真实身份的交易情况,提供风险控制的规则配置(风控审计);基础服务模块部署在所有区块链节点设备上,用来验证业务请求的有效性,并对有效请求完成共识后记录到存储上,对于一个新的业务请求,基础服务先对接口适配解析和鉴权处理(接口适配),然后通过共识算法将业务信息加密(共识管理),在加密之后完整一致的传输至共享账本上(网络通信),并进行记录存储;智能合约模块负责合约的注册发行以及合约触发和合约执行,开发人员可以通过某种编程语言定义合约逻辑,发布到区块链上(合约注册),根据合约条款的逻辑,调用密钥或者其它的事件触发执行,完成合约逻辑,同时还提供对合约升级注销的功能;运营监控模块主要负责产品发布过程中的部署、配置的修改、合约设置、云适配以及产品运行中的实时状态的可视化输出,例如:告警、监控网络情况、监控节点设备健康状态等。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的权利要求范围之内。
Claims (10)
1.一种基于槽位信息的解答方法,其特征在于,包括:
通过智能客服机器人获取用户提出的用户问题,并提取所述用户问题中的实体信息;
基于所述用户问题获取指定时间内的槽位信息;所述槽位信息为槽位中记录的历史实体信息;
判断所述槽位信息中是否具有与所述实体信息中相关的目标信息;
若具有,则结合所述用户问题和所述目标信息获取回复语句;
将所述回复语句发送给所述智能客服机器人以展示给所述用户。
2.如权利要求1所述的基于槽位信息的解答方法,其特征在于,所述基于所述用户问题获取指定时间内的槽位信息的步骤之前,还包括:
获取所述用户在所述指定时间内的多轮对话;
提取所述多轮对话中的相应的历史实体信息;
分析所述历史实体信息所属的槽位;
将所述历史实体信息保存于所述槽位中,构成所述槽位对应的所述槽位信息。
3.如权利要求2所述的基于槽位信息的解答方法,其特征在于,所述提取所述用户问题中的实体信息的步骤之后,还包括:
分析所述实体信息所属的目标槽位;
判断所述目标槽位中是否存在有所述历史实体信息;
若具有所述历史实体信息,则将所述实体信息与所述历史实体信息进行压栈保存。
4.如权利要求1所述的基于槽位信息的解答方法,其特征在于,所述提取所述用户问题中的实体信息的步骤,包括:
将所述用户问题进行标准化处理,得到处理后的标准化问题,并赋予所述标准化问题对应的所述用户的TOKEN标签,其中所述标准化处理包括根据特殊字符标识库剔除所述问题中的标点符号、统一语种、删除不相关词句,所述不相关词句包括问候语、形容词以及脏词;
通过BERT训练模型fine-tuning的方式对所述标准化问题进行分词处理,得到所述标准化问题对应的词向量集;
按照词性将所述词向量集中与所述实体信息无关的词汇剔除,得到目标词向量集;
将所述目标词向量集中的每个词输入至预先设置的相识度模型中,得到所述实体信息;其中,所述相识度模型为预先根据对应的各种实体信息的不同表达方式训练而成。
5.如权利要求1所述的基于槽位信息的解答方法,其特征在于,所述结合所述用户问题和所述目标信息获取回复语句的步骤,包括:
将所述用户问题和所述目标信息进行向量化,分别得到问题向量和信息向量;
将所述问题向量和所述信息向量进行拼接,得到目标向量;
将所述目标向量输入至自然语言处理中的机器学习模型进行计算,从而得到所述目标向量所属的目标类别;
采用文本算法计算所述目标向量与所述目标类别中各个预设问题向量的相似度值;
从所述各所述预设问题向量中,提取所述相似度值最大的目标问题向量;
从预设的数据库中获取所述目标问题向量所对应的所述回复语句。
6.如权利要求1所述的基于槽位信息的解答方法,其特征在于,所述通过智能客服机器人获取用户当前提出的用户问题的步骤,包括:
通过业务数据库获取所述用户与所述智能客服机器人的通话信息;
将所述通话信息转化为文字信息,得到所述用户问题;
将所述用户问题存放至本地文件,以通过日志监控采集的方式上传至集群服务器文件系统上。
7.如权利要求1所述的基于槽位信息的解答方法,其特征在于,基于所述用户问题获取指定时间内的槽位信息的步骤之前,还包括:
检测所述用户问题与所述智能客服机器人所对应服务行业的相关值;
判断所述相关值是否大于相关阈值;
若所述相关值大于相关阈值,则执行所述基于所述用户问题获取指定时间内的槽位信息的步骤。
8.一种基于槽位信息的解答装置,其特征在于,包括:
第一获取模块,用于通过智能客服机器人获取用户当前提出的用户问题,并提取所述用户问题中的实体信息;
第二获取模块,用于基于所述用户问题获取指定时间内的槽位信息;所述槽位信息为槽位中记录的历史实体信息;
判断模块,用于判断所述槽位信息中是否具有与所述实体信息中相关的目标信息;
结合模块,用于若具有,则结合所述用户问题和所述目标信息获取回复语句;
发送模块,用于将所述回复语句发送给所述智能客服机器人以展示给所述用户。
9.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至7中任一项所述方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至7中任一项所述的方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110874820.3A CN113641808A (zh) | 2021-07-30 | 2021-07-30 | 基于槽位信息的解答方法、装置、设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110874820.3A CN113641808A (zh) | 2021-07-30 | 2021-07-30 | 基于槽位信息的解答方法、装置、设备及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113641808A true CN113641808A (zh) | 2021-11-12 |
Family
ID=78419150
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110874820.3A Pending CN113641808A (zh) | 2021-07-30 | 2021-07-30 | 基于槽位信息的解答方法、装置、设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113641808A (zh) |
-
2021
- 2021-07-30 CN CN202110874820.3A patent/CN113641808A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110597991B (zh) | 文本分类方法、装置、计算机设备及存储介质 | |
CN111026842B (zh) | 自然语言处理方法、自然语言处理装置及智能问答系统 | |
CN111506722A (zh) | 基于深度学习技术的知识图谱问答方法、装置及设备 | |
CN112612894B (zh) | 意图识别模型的训练方法、装置、计算机设备和存储介质 | |
CN111883140B (zh) | 基于知识图谱和声纹识别的认证方法、装置、设备及介质 | |
CN111858877A (zh) | 多类型问题智能问答方法、系统、设备及可读存储介质 | |
CN113688221B (zh) | 基于模型的话术推荐方法、装置、计算机设备和存储介质 | |
CN112836061A (zh) | 智能推荐的方法、装置以及计算机设备 | |
CN114647713A (zh) | 基于虚拟对抗的知识图谱问答方法、设备及存储介质 | |
CN113990352A (zh) | 用户情绪识别与预测方法、装置、设备及存储介质 | |
CN113204619B (zh) | 基于自然语言处理的语句补全方法、装置、设备及介质 | |
CN113873088A (zh) | 语音通话的交互方法、装置、计算机设备和存储介质 | |
US11615787B2 (en) | Dialogue system and method of controlling the same | |
CN113821587A (zh) | 文本相关性确定方法、模型训练方法、装置及存储介质 | |
CN111489736B (zh) | 座席话术自动评分装置及方法 | |
CN111324712A (zh) | 对话回复方法及服务端 | |
CN113064997B (zh) | 基于bert模型的意图分析方法、装置、设备及介质 | |
CN113111157B (zh) | 问答处理方法、装置、计算机设备和存储介质 | |
CN114528851B (zh) | 回复语句确定方法、装置、电子设备和存储介质 | |
CN113641808A (zh) | 基于槽位信息的解答方法、装置、设备及存储介质 | |
CN111899765B (zh) | 基于情绪预测模型的语音发送方法、装置和计算机设备 | |
CN111883112B (zh) | 基于多模式标识的语义识别方法、装置和计算机设备 | |
CN113312481A (zh) | 基于区块链的文本分类方法、装置、设备以及存储介质 | |
CN114398183A (zh) | 基于区块链的任务分配方法、装置、设备以及存储介质 | |
CN113468306A (zh) | 语音对话方法、装置、电子设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |