CN117520522B - 一种基于rpa和ai结合的智能对话方法、装置及电子设备 - Google Patents
一种基于rpa和ai结合的智能对话方法、装置及电子设备 Download PDFInfo
- Publication number
- CN117520522B CN117520522B CN202311843969.0A CN202311843969A CN117520522B CN 117520522 B CN117520522 B CN 117520522B CN 202311843969 A CN202311843969 A CN 202311843969A CN 117520522 B CN117520522 B CN 117520522B
- Authority
- CN
- China
- Prior art keywords
- sentences
- dialogue
- information
- evaluated
- checked
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 34
- 230000004044 response Effects 0.000 claims abstract description 43
- 238000011156 evaluation Methods 0.000 claims description 32
- 238000000605 extraction Methods 0.000 claims description 31
- 238000013210 evaluation model Methods 0.000 claims description 26
- 238000005516 engineering process Methods 0.000 claims description 14
- 238000007781 pre-processing Methods 0.000 claims description 13
- 238000012795 verification Methods 0.000 claims description 12
- 238000012545 processing Methods 0.000 claims description 8
- 238000004140 cleaning Methods 0.000 claims description 5
- 238000010276 construction Methods 0.000 claims description 5
- 230000011218 segmentation Effects 0.000 claims description 4
- 238000012216 screening Methods 0.000 claims description 2
- 230000000694 effects Effects 0.000 abstract description 7
- 230000003993 interaction Effects 0.000 abstract description 5
- 230000006870 function Effects 0.000 description 25
- 238000013473 artificial intelligence Methods 0.000 description 23
- 230000008569 process Effects 0.000 description 9
- 241000282414 Homo sapiens Species 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 230000018109 developmental process Effects 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000004801 process automation Methods 0.000 description 2
- 230000006978 adaptation Effects 0.000 description 1
- 230000002411 adverse Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 238000011835 investigation Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 230000003252 repetitive effect Effects 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 238000012549 training Methods 0.000 description 1
- 239000013598 vector Substances 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/332—Query formulation
- G06F16/3329—Natural language query formulation or dialogue systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/02—Knowledge representation; Symbolic representation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/04—Inference or reasoning models
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Mathematical Physics (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Software Systems (AREA)
- Computing Systems (AREA)
- Databases & Information Systems (AREA)
- General Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Health & Medical Sciences (AREA)
- Human Computer Interaction (AREA)
- Machine Translation (AREA)
Abstract
本发明属于人机智能对话技术领域,具体涉及一种基于RPA和AI结合的智能对话方法、装置及电子设备。本发明以提取的关键词为基础,进行构建相应领域的知识图谱和推理规则,并确定知识图谱中的实体关系,再根据这些实体关系生成相应的推理规则,这些推理规则可以用于指导机器人如何根据知识图谱生成应答语句,从而为用户提供一个准确的应答信息,在对话结束后,收集用户反馈信息,进一步改进和优化智能对话的性能和效果,提高机器人与用户的交互效率和准确性,为用户提供更好的服务和体验。
Description
技术领域
本发明属于人机智能对话技术领域,具体涉及一种基于RPA和AI结合的智能对话方法、装置及电子设备。
背景技术
随着科技的不断发展,人工智能(AI)和机器人流程自动化(RPA)已经成为了当今企业和个人关注的焦点,这两种技术的结合为企业提供了更高效、智能的解决方案,以应对日益复杂的业务需求,在这个背景下,基于RPA和AI结合的智能对话系统应运而生,其旨在通过模拟人类对话的方式,实现机器与用户之间的自然、流畅的交流,从而提高用户体验和企业运营效率。
目前,市场上已经有一些基于RPA和AI结合的智能对话系统,但大多数仍存在一定的局限性,例如,这些系统在处理复杂问题时可能表现出较低的准确率,仅能够按照固定的模板进行回答问题,缺乏相应的推理功能,在面对多样化的用户表达方式时,可能无法准确理解用户意图,同时给出的应答也不能够满足用户的需求,基于此,本方案提供了一种基于RPA和AI结合的智能对话方法。
发明内容
本发明的目的是提供一种基于RPA和AI结合的智能对话方法、装置及电子设备,能够提高机器人与用户的交互效率和准确性,为用户提供更好的服务和体验。
本发明采取的技术方案具体如下:
一种基于RPA和AI结合的智能对话方法,包括:
采集真实场景中的对话信息,其中,所述对话信息包括询问信息和应答信息;
对采集的所述对话信息进行预处理,再将所述询问信息和应答信息中的所有语句一同输入至特征提取模型中,得到所述对话信息中的关键词;
根据预处理后的对话信息,利用RPA和AI技术构建知识图谱,并根据关键词确定知识图谱中的实体关系,再根据所述实体关系生成相应的推理规则,并依据知识图谱和推理规则构建机器人的应答数据库以及延展数据库;
获取用户的询问语句,并依据所述知识图谱和推理规则输出应答语句,实现机器人与用户的智能对话,并在对话结束后收集用户反馈信息;
汇总所述用户反馈信息,并输入至评价模型中,得到各个所述智能对话的对话状态,其中,所述对话状态包括准确状态和错误状态,且将所述错误状态下的询问语句汇总为问卷文本,再依据所述问卷文本执行问卷调查,得到与该询问语句对应的应答语句。
在一种优选方案中,所述对采集的所述对话信息进行预处理的步骤,包括:
获取对话信息,并进行数据清洗,去除特殊字符、HTML标签以及URL,得到清洗后语句;
获取过滤词汇,并将所述过滤词汇与清洗后语句进行比较,其中,所述过滤词汇为敏感词汇;
若所述清洗后语句中存在过滤词汇,则将其标定为敏感语句,并从清洗后语句中筛除;
若所述清洗后语句中不存在过滤词汇,则将其标定为正常语句,并汇总为基准数据集。
在一种优选方案中,所述基准数据集确定后,获取其中的所有询问语句,并将标定为基准语句;
获取同一所述基准语句下的所有应答语句,并标定为待评估语句,再将所有所述待评估语句输入至评估模型中,得到各个所述待评估语句的占比率,并标定为待校验参数;
将所述待校验参数按照由大至小的顺序进行排列,并输入至校验模型中,得到与基准语句对应的标准应答语句。
在一种优选方案中,所述将所有所述待评估语句输入至评估模型中,得到各个所述待评估语句的占比率,并标定为待校验参数的步骤,包括:
获取同一所述基准语句下的所有待评估语句;
从所述评估模型中调用评估函数;
将所述待评估语句输入至评估函数中,得到所述待评估语句之间的文本相似度;
获取评估阈值,并与所述文本相似度进行比较,且将大于所述文本相似度的待评估语句归类为多组同类型语句;
测算各组所述同类型语句的占比率,并将其标定为待校验参数。
在一种优选方案中,所述将所述待校验参数按照由大至小的顺序进行排列,并输入至校验模型中,得到与基准语句对应的标准应答语句的步骤,包括:
获取所述待校验参数;
从所述校验模型中调用校验函数,并将前两个所述待校验参数逐一输入至校验函数中,再将其输出结果标定为待校验差量;
从所述校验模型中调用校验阈值,并将其与所述待校验差量进行比较;
若所述待校验差量大于校验阈值,则将首位所述待校验参数对应的待评估语句标定为基准应答语句;
若所述待校验差量小于或等于校验阈值,则继续采集其对应的真实场景中的对话信息。
在一种优选方案中,所述将所述询问信息和应答信息中的所有语句一同输入至特征提取模型中,得到所述对话信息中的关键词的步骤,包括:
获取同一对话信息下所述询问信息和应答信息中的所有语句,并进行分词处理,得到多个独立词汇;
统计每个所述独立词汇的出现次数,得到词汇词频,再统计所有所述独立词汇的出现总次数,得到样本频率;
从所述特征提取模型中调用测算函数;
将所述词汇词频和样本频率一同输入至测算函数中,并将其输出结果标定为词汇权重;
获取特征提取阈值,并与所述词汇权重进行比较,且将所有大于所述特征提取阈值的独立词汇标定为关键词。
在一种优选方案中,所述根据所述实体关系生成相应的推理规则的步骤,包括:
从所述真实场景的对话信息中提取命名实体,且将所述命名实体作为知识图谱中的知识节点;
获取所述关键词之间的语义关联性,以及其对应的实体关系;
根据实体关系确定所述关键词之间的从属关系,并生成对应的推理规则。
在一种优选方案中,所述汇总所述用户反馈信息,并输入至评价模型中,得到各个所述智能对话的对话状态的步骤,包括:
获取所述用户反馈信息,其中,所述用户反馈信息包括正确反馈和错误反馈;
测算所述错误反馈在所有用户反馈信息中的占比,并标定为待评价参数;
从所述评价模型中调用评价阈值,并将所述评价阈值与待评价参数进行比较;
若所述待评价参数大于或等于评价阈值,则表明所述机器人输出的应答语句不符合用户需求,并将其对应的询问语句汇总为问卷文本;
若所述待评价参数小于评价阈值,则直接将其对应的对话状态标定为准确状态。
本发明还提供了,一种基于RPA和AI结合的智能对话装置,应用于上述的基于RPA和AI结合的智能对话方法,包括:
数据采集模块,所述数据采集模块用于采集真实场景中的对话信息,其中,所述对话信息包括询问信息和应答信息;
特征提取模块,所述特征提取模块用于对采集的所述对话信息进行预处理,再将所述询问信息和应答信息中的所有语句一同输入至特征提取模型中,得到所述对话信息中的关键词;
知识构建模块,所述知识构建模块用于根据预处理后的对话信息,利用RPA和AI技术构建知识图谱,并根据关键词确定知识图谱中的实体关系,再根据所述实体关系生成相应的推理规则,并依据知识图谱和推理规则构建机器人的应答数据库以及延展数据库;
智能对话模块,所述智能对话模块用于获取用户的询问语句,并依据所述知识图谱和推理规则输出应答语句,实现机器人与用户的智能对话,并在对话结束后收集用户反馈信息;
反馈模块,所述反馈模块用于汇总所述用户反馈信息,并输入至评价模型中,得到各个所述智能对话的对话状态,其中,所述对话状态包括准确状态和错误状态,且将所述错误状态下的询问语句汇总为问卷文本,再依据所述问卷文本执行问卷调查,得到与该询问语句对应的应答语句。
以及,一种电子设备,包括如上述的基于RPA和AI结合的智能对话装置。
本发明取得的技术效果为:
本发明以提取的关键词为基础,进行构建相应领域的知识图谱和推理规则,并确定知识图谱中的实体关系,再根据这些实体关系生成相应的推理规则,这些推理规则可以用于指导机器人如何根据知识图谱生成应答语句,从而为用户提供一个准确的应答信息,在对话结束后,收集用户反馈信息,进一步改进和优化智能对话的性能和效果,提高机器人与用户的交互效率和准确性,为用户提供更好的服务和体验。
附图说明
图1是本发明实施例1所提供的方法流程图;
图2是本发明实施例2所提供的方法流程图;
图3是本发明实施例3所提供的方法流程图;
图4是本发明实施例4所提供的方法流程图;
图5是本发明实施例5所提供的装置模块图;
图6是本发明实施例6所提供的设备结构图。
具体实施方式
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合说明书附图对本发明的具体实施方式做详细的说明。
在下面的描述中阐述了很多具体细节以便于充分理解本发明,但是本发明还可以采用其他不同于在此描述的其它方式来实施,本领域技术人员可以在不违背本发明内涵的情况下做类似推广,因此本发明不受下面公开的具体实施例的限制。
其次,此处所称的“一个实施例”或“实施例”是指可包含于本发明至少一个实现方式中的特定特征、结构或特性。在本说明书中不同地方出现的“在一个较佳的实施方式中”并非均指同一个实施例,也不是单独的或选择性的与其他实施例互相排斥的实施例。
实施例1:
请参阅图1所示,为本发明的第一个实施例,该实施例提供了一种基于RPA和AI结合的智能对话方法,包括:
S1、采集真实场景中的对话信息,其中,对话信息包括询问信息和应答信息;
S2、对采集的对话信息进行预处理,再将询问信息和应答信息中的所有语句一同输入至特征提取模型中,得到对话信息中的关键词;
S3、根据预处理后的对话信息,利用RPA和AI技术构建知识图谱,并根据关键词确定知识图谱中的实体关系,再根据实体关系生成相应的推理规则,并依据知识图谱和推理规则构建机器人的应答数据库以及延展数据库;
S4、获取用户的询问语句,并依据知识图谱和推理规则输出应答语句,实现机器人与用户的智能对话,并在对话结束后收集用户反馈信息;
S5、汇总用户反馈信息,并输入至评价模型中,得到各个智能对话的对话状态,其中,对话状态包括准确状态和错误状态,且将错误状态下的询问语句汇总为问卷文本,再依据问卷文本执行问卷调查,得到与该询问语句对应的应答语句。
如上述步骤S1-S5所述,随着科技的不断发展,人工智能(AI)和机器人流程自动化(RPA)技术在各个领域得到了广泛的应用,AI技术可以帮助机器理解和处理自然语言,从而实现与人类的智能对话,而RPA技术则可以让机器自动执行一系列重复性的任务,提高工作效率。然而,目前市场上的智能对话系统往往只具备单一功能,无法满足用户多样化的需求,因此,将RPA和AI技术相结合,开发出一种基于RPA和AI结合的智能对话方法,具有重要的现实意义和应用价值,本实施例中,首先采集真实场景中的对话信息,这些对话信息可能来自于各种来源,如客户服务聊天记录、社交媒体互动等,这些对话信息通常包括询问信息和应答信息,其中询问信息是用户提出的问题或请求,而应答信息则是相应的回复或解决方案,之后再对采集的对话信息进行预处理,预处理包括数据清洗和过滤等操作,以便更好地处理和理解这些数据,在预处理之后,将询问信息和应答信息中的所有语句一同输入至特征提取模型中,以识别和提取对话信息中的关键词,然后利用RPA和AI技术构建知识图谱,知识图谱是一种用于表示知识和信息的数据结构,可以用于帮助机器人更好地理解和回答用户的问题,根据预处理后的对话信息和关键词,可以确定知识图谱中的实体关系,并进一步根据这些实体关系生成相应的推理规则,这些推理规则可以用于指导机器人如何根据知识图谱生成应答语句,同时,依据知识图谱和推理规则构建机器人的应答数据库以及延展数据库,以便在需要时快速查找和获取相关答案,之后进行推广或者测试,此过程中首先需要采集用户的询问语句,机器人根据预定的推理规则和知识图谱便可以输出相应的应答语句,通过这种方式,可以实现机器人与用户的智能对话,从而为用户提供准确、及时的回答和解决方案,在对话结束后,收集用户反馈信息,以便进一步改进和优化智能对话的性能和效果,用户反馈信息收集到之后,会进行汇总处理,并会将汇总后的用户反馈信息输入至评价模型,评价模型可以对智能对话的性能和效果进行评估和打分,从而帮助我们了解哪些对话状态是准确的,哪些是错误的,同时,将错误状态下的询问语句汇总为问卷文本,并通过问卷调查的方式获取与该询问语句对应的应答语句,以便于提高机器人与用户的交互效率和准确性,为用户提供更好的服务和体验。
实施例2:
请参阅图2,为本发明的第二个实施例,该实施例基于上一个实施例。
对采集的对话信息进行预处理的步骤,包括:
S201、获取对话信息,并进行数据清洗,去除特殊字符、HTML标签以及URL,得到清洗后语句;
S202、获取过滤词汇,并将过滤词汇与清洗后语句进行比较,其中,过滤词汇为敏感词汇;
若清洗后语句中存在过滤词汇,则将其标定为敏感语句,并从清洗后语句中筛除;
若清洗后语句中不存在过滤词汇,则将其标定为正常语句,并汇总为基准数据集。
如上述步骤S201-S202所述,在进行对话信息预处理时,首先需要采集对话信息并对其进行数据清洗,数据清洗的目的是去除对话中的特殊字符、HTML标签以及URL等无关信息,确保得到的对话语句是干净和准确的,经过清洗后的语句可以作为后续处理的基础,其次,还需要确定一个过滤词汇列表,这些过滤词汇通常是敏感词汇或限制性词汇,用于识别可能含有不良内容或敏感信息的语句,将过滤词汇与清洗后的语句进行比较,如果某个语句中包含过滤词汇,则将其标定为敏感语句,对于敏感语句,通常会将其从清洗后的语句中筛除,以避免对后续处理造成干扰或产生不良影响,对于未包含过滤词汇的语句,可以将其标定为正常语句,并汇总到基准数据集中,基准数据集是经过预处理后得到的用于进一步分析的数据集,它包含了大量经过筛选的正常语句,可以为后续的任务提供可靠的训练和测试数据,此外,在预处理过程中,还需要注意对不同领域和语境的对话信息进行适当的调整和处理,例如,某些行业或话题可能存在特定的敏感词汇或表达方式,需要有针对性地进行处理和过滤,这需要根据具体的使用环境进行设置,文中就不加以过多的限制和赘述。
在一个较佳的实施方式中,基准数据集确定后,获取其中的所有询问语句,并将标定为基准语句;
获取同一基准语句下的所有应答语句,并标定为待评估语句,再将所有待评估语句输入至评估模型中,得到各个待评估语句的占比率,并标定为待校验参数;
将待校验参数按照由大至小的顺序进行排列,并输入至校验模型中,得到与基准语句对应的标准应答语句。
在该实施方式中,在确定基准数据集后,首先需要从数据集中提取所有的询问语句,并将其标记为基准语句,接下来,需要找到与每个基准语句相对应的所有应答语句,并将它们标记为待评估语句,一旦获得了所有的待评估语句,就可以将它们输入到评估模型中,以此计算每个待评估语句的占比率,这些占比率将被标记为待校验参数,最后将按照占比率的大小,对待校验参数进行排序,并将它们输入到校验模型中,校验模型会根据这些参数,生成与基准语句相对应的标准应答语句,这些标准应答语句将作为模型表现的参考标准。
进一步的,将所有待评估语句输入至评估模型中,得到各个待评估语句的占比率,并标定为待校验参数的步骤,包括:
Step1、获取同一基准语句下的所有待评估语句;
Step2、从评估模型中调用评估函数;
Step3、将待评估语句输入至评估函数中,得到待评估语句之间的文本相似度;
Step4、获取评估阈值,并与文本相似度进行比较,且将大于文本相似度的待评估语句归类为多组同类型语句;
Step5、测算各组同类型语句的占比率,并将其标定为待校验参数。
如上述步骤Step1-Step5所述,在评估模型执行时,首先采集统一基准语句下的待评估句,而后再输入至评估函数中即可,其中,评估函数的表达式为:,式中,/>表示待评估语句之间的文本相似度,/>表示待评估语句中的词语数量,/>和/>均表示待评估语句中词语对应的特征向量,且在获取了文本相似度之后,我们需要获取评估阈值。评估阈值是一个关键参数,它用于比较待评估语句的相似度,当待评估语句的文本相似度超过阈值时,它们被归类为多组同类型语句,这一步确保了我们能够准确地识别出相似的语句组,从而更精确地测算占比率。
更进一步的,将待校验参数按照由大至小的顺序进行排列,并输入至校验模型中,得到与基准语句对应的标准应答语句的步骤,包括:
Step6、获取待校验参数;
Step7、从校验模型中调用校验函数,并将前两个待校验参数逐一输入至校验函数中,再将其输出结果标定为待校验差量;
Step8、从校验模型中调用校验阈值,并将其与待校验差量进行比较;
若待校验差量大于校验阈值,则将首位待校验参数对应的待评估语句标定为基准应答语句;
若待校验差量小于或等于校验阈值,则继续采集其对应的真实场景中的对话信息。
如上述步骤Step1-Step8所述,为了确保机器在自然语言处理中的表现,我们需要对机器生成的语句进行校验,校验过程包括获取待校验参数、调用校验函数和比较校验阈值等步骤,首先采集已经得到的待校验参数,并提供给校验模型,接下来,从校验模型中调用校验函数,并将前两个位次下的待校验参数逐一输入至校验函数中,校验函数的作用是计算待校验参数之间的差异,本实施方式将该差异输出为待校验差量,其中,校验函数的表达式为:,式中,/>表示待校验差量,/>表示首位待校验参数,/>表示第二位次下的待校验参数,然后从校验模型中调用校验阈值,并将其与待校验差量进行比较,校验阈值是一个预先设定的值,用于首位待校验参数对应的同类型语句是否能直接作为应答语句,如果待校验差量大于校验阈值,将首位待校验参数对应的待评估语句标定为基准应答语句,反之,则就意味着同义基准语句下的应答语句无法确定准确性,这时可以继续采集其对应的真实场景中的对话信息,并重复上述过程进行进一步的验证。
其次,将询问信息和应答信息中的所有语句一同输入至特征提取模型中,得到对话信息中的关键词的步骤,包括:
S203、获取同一对话信息下询问信息和应答信息中的所有语句,并进行分词处理,得到多个独立词汇;
S204、统计每个独立词汇的出现次数,得到词汇词频,再统计所有独立词汇的出现总次数,得到样本频率;
S205、从特征提取模型中调用测算函数;
S206、将词汇词频和样本频率一同输入至测算函数中,并将其输出结果标定为词汇权重;
S207、获取特征提取阈值,并与词汇权重进行比较,且将所有大于特征提取阈值的独立词汇标定为关键词。
如上述步骤S203-S207所述,在确定询问信息和应答信息中的关键词时,首先需要获取同一对话信息下询问信息和应答信息中的所有语句,之后需要进行分词处理,将每个句子分解成多个独立词汇,以便后续处理,然后需要统计每个独立词汇的出现次数,得到词汇词频。同时,我们还需要统计所有独立词汇的出现总次数,得到样本频率,这些统计数据可以帮助我们了解对话信息中词汇的分布情况,再从特征提取模型中调用测算函数,这个测算函数可以根据我们的需求,对词汇词频和样本频率进行计算,得到每个独立词汇的权重,这个权重可以反映该词汇在对话信息中的重要程度,其中,测算函数的表达式为:,式中,/>表示词汇权重,/>表示所有独立词汇的出现总次数,表示样本频率,1表示词汇词频,再之后,获取特征提取阈值,这个阈值可以根据我们的实际需求进行调整,以得到更好的关键词提取效果,再将特征提取阈值与词汇权重进行比较,并将所有大于特征提取阈值的独立词汇标定为关键词,这种关键词提取方法可以应用于智能客服、语音助手等场景,提高机器对人类语言的识别和理解能力。
实施例3:
请参阅图3,为本发明的第三个实施例,该实施例基于前两个实施例。
根据实体关系生成相应的推理规则的步骤,包括:
S301、从真实场景的对话信息中提取命名实体,且将命名实体作为知识图谱中的知识节点;
S302、获取关键词之间的语义关联性,以及其对应的实体关系;
S303、根据实体关系确定关键词之间的从属关系,并生成对应的推理规则。
如上述步骤S301-S303所述,从真实场景的对话信息中,我们需要准确地提取出命名实体。这些命名实体可以作为知识图谱中的知识节点,为后续的推理规则生成提供基础,例如,在一段关于电影的对话中,可以提取出电影名称、演员姓名等命名实体,在提取出命名实体后,需要进一步分析这些实体之间的语义关联性,以及它们所对应的实体关系,例如,如果在一部电影的对话中出现了“导演”和“演员”这两个实体,那么它们之间的关系可以定义为“导演”指导了“演员”的表演,从而形成了对应的实体关系,在确定了关键词之间的实体关系后,需要根据这些关系来确定关键词之间的从属关系,例如,如果“导演”指导了“演员”的表演,那么“导演”就是从属于“演员”的关系,通过这种方式,可以生成对应的推理规则,如“导演指导演员”,这些推力规则可以帮助机器更好地理解对话中的语义关联性和实体关系,从而为后续的智能问答、对话生成等任务提供有力支持。
实施例4:
请参阅图4,为本发明的第四个实施例,该实施例基于前三个实施例。
汇总用户反馈信息,并输入至评价模型中,得到各个智能对话的对话状态的步骤,包括:
S501、获取用户反馈信息,其中,用户反馈信息包括正确反馈和错误反馈;
S502、测算错误反馈在所有用户反馈信息中的占比,并标定为待评价参数;
S503、从评价模型中调用评价阈值,并将评价阈值与待评价参数进行比较;
若待评价参数大于或等于评价阈值,则表明机器人输出的应答语句不符合用户需求,并将其对应的询问语句汇总为问卷文本;
若待评价参数小于评价阈值,则直接将其对应的对话状态标定为准确状态。
如上述步骤S501-S503所述,首先通过各种渠道获取用户的反馈信息,这包括他们在使用智能对话过程中根据机器的应答语句给出的正确反馈和错误反馈,接下来测算错误反馈在所有用户反馈信息中的占比,并将这个占比标定为待评价参数,这一步是为了更好地了解用户对智能对话的不满意程度,然后从评价模型中调用评价阈值,并将评价阈值与待评价参数进行比较,如果待评价参数大于或等于评价阈值,这就意味着机器人输出的应答语句不符合用户需求,在这种情况下,会将对应的询问语句汇总为问卷文本,再依据问卷文本执行问卷调查,得到与该询问语句对应的应答语句,如果待评价参数小于评价阈值,那么这就说明机器人输出的应答语句是符合用户需求的,此时就会直接将其对应的对话状态标定为准确状态,通过这些步骤不断优化智能对话的性能,为用户提供更加智能、高效的服务。
实施例5:
如图5所示,为本发明的第五个实施例,该实施例基于前四个实施例,还提供了一种基于RPA和AI结合的智能对话装置,应用于上述的基于RPA和AI结合的智能对话方法,包括:
数据采集模块,数据采集模块用于采集真实场景中的对话信息,其中,对话信息包括询问信息和应答信息;
特征提取模块,特征提取模块用于对采集的对话信息进行预处理,再将询问信息和应答信息中的所有语句一同输入至特征提取模型中,得到对话信息中的关键词;
知识构建模块,知识构建模块用于根据预处理后的对话信息,利用RPA和AI技术构建知识图谱,并根据关键词确定知识图谱中的实体关系,再根据实体关系生成相应的推理规则,并依据知识图谱和推理规则构建机器人的应答数据库以及延展数据库;
智能对话模块,智能对话模块用于获取用户的询问语句,并依据知识图谱和推理规则输出应答语句,实现机器人与用户的智能对话,并在对话结束后收集用户反馈信息;
反馈模块,反馈模块用于汇总用户反馈信息,并输入至评价模型中,得到各个智能对话的对话状态,其中,对话状态包括准确状态和错误状态,且将错误状态下的询问语句汇总为问卷文本,再依据问卷文本执行问卷调查,得到与该询问语句对应的应答语句。
如上述,在该智能对话装置执行时,首先从真实场景中采集对话信息,这些信息包括询问信息和应答信息,然后,对这些采集的对话信息进行预处理,以确保数据的质量和准确性,将这些预处理后的语句一同输入至特征提取模型中,该模型能够识别对话信息中的关键词,为后续的知识图谱构建提供关键信息,利用RPA和AI技术,构建一个庞大的知识图谱,这个知识图谱涵盖了各种实体关系,这些关系是根据关键词确定的,通过实体关系,我们可以生成相应的推理规则,从而构建机器人的应答数据库以及延展数据库,当用户发起询问时,机器人会迅速获取用户的询问语句,基于知识图谱和推理规则,机器人会从应答数据库中检索出最合适的应答语句,并输出给用户,这样,机器人就可以与用户进行智能对话,提供准确、及时的回答,对话结束后,会收集用户的反馈信息,这些反馈信息对于改进机器人性能和提高服务质量至关重要,汇总用户反馈后,我们将这些信息输入至评价模型中,该模型能够评估各个智能对话的对话状态,包括准确状态和错误状态,对于错误状态下的询问语句,会将其汇总为问卷文本,接着依据这些问卷文本执行问卷调查,以获取与该询问语句对应的应答语句,这样就可以不断优化知识图谱和推理规则,提高机器人的智能水平和服务质量。
实施例6:
如图6所述,为本发明的第六个实施例,该实施例基于前五个实施例,且提供了一种电子设备,包括如上述的基于RPA和AI结合的智能对话装置。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其它变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、装置、物品或者方法不仅包括那些要素,而且还包括没有明确列出的其它要素,或者是还包括为这种过程、装置、物品或者方法所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、装置、物品或者方法中还存在另外的相同要素。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以作出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。本发明中未具体描述和解释说明的结构、装置以及操作方法,如无特别说明和限定,均按照本领域的常规手段进行实施。
Claims (6)
1.一种基于RPA和AI结合的智能对话方法,其特征在于:包括:
采集真实场景中的对话信息,其中,所述对话信息包括询问信息和应答信息;
对采集的所述对话信息进行预处理,再将所述询问信息和应答信息中的所有语句一同输入至特征提取模型中,得到所述对话信息中的关键词;
根据预处理后的对话信息,利用RPA和AI技术构建知识图谱,并根据关键词确定知识图谱中的实体关系,再根据所述实体关系生成相应的推理规则,并依据知识图谱和推理规则构建机器人的应答数据库以及延展数据库;
获取用户的询问语句,并依据所述知识图谱和推理规则输出应答语句,实现机器人与用户的智能对话,并在对话结束后收集用户反馈信息;
汇总所述用户反馈信息,并输入至评价模型中,得到各个所述智能对话的对话状态,其中,所述对话状态包括准确状态和错误状态,且将所述错误状态下的询问语句汇总为问卷文本,再依据所述问卷文本执行问卷调查,得到与该询问语句对应的应答语句;
所述对采集的所述对话信息进行预处理的步骤,包括:
获取对话信息,并进行数据清洗,去除特殊字符、HTML标签以及URL,得到清洗后语句;
获取过滤词汇,并将所述过滤词汇与清洗后语句进行比较,其中,所述过滤词汇为敏感词汇;
若所述清洗后语句中存在过滤词汇,则将其标定为敏感语句,并从清洗后语句中筛除;
若所述清洗后语句中不存在过滤词汇,则将其标定为正常语句,并汇总为基准数据集;
其中,所述基准数据集确定后,获取其中的所有询问语句,并将标定为基准语句;
获取同一所述基准语句下的所有应答语句,并标定为待评估语句,再将所有所述待评估语句输入至评估模型中,得到各个所述待评估语句的占比率,并标定为待校验参数;
将所述待校验参数按照由大至小的顺序进行排列,并输入至校验模型中,得到与基准语句对应的标准应答语句;
所述将所有所述待评估语句输入至评估模型中,得到各个所述待评估语句的占比率,并标定为待校验参数的步骤,包括:
获取同一所述基准语句下的所有待评估语句;
从所述评估模型中调用评估函数;
将所述待评估语句输入至评估函数中,得到所述待评估语句之间的文本相似度;
获取评估阈值,并与所述文本相似度进行比较,且将大于所述文本相似度的待评估语句归类为多组同类型语句;
测算各组所述同类型语句的占比率,并将其标定为待校验参数;
所述将所述待校验参数按照由大至小的顺序进行排列,并输入至校验模型中,得到与基准语句对应的标准应答语句的步骤,包括:
获取所述待校验参数;
从所述校验模型中调用校验函数,并将前两个所述待校验参数逐一输入至校验函数中,再将其输出结果标定为待校验差量;
从所述校验模型中调用校验阈值,并将其与所述待校验差量进行比较;
若所述待校验差量大于校验阈值,则将首位所述待校验参数对应的待评估语句标定为基准应答语句;
若所述待校验差量小于或等于校验阈值,则继续采集其对应的真实场景中的对话信息。
2.根据权利要求1所述的一种基于RPA和AI结合的智能对话方法,其特征在于:所述将所述询问信息和应答信息中的所有语句一同输入至特征提取模型中,得到所述对话信息中的关键词的步骤,包括:
获取同一对话信息下所述询问信息和应答信息中的所有语句,并进行分词处理,得到多个独立词汇;
统计每个所述独立词汇的出现次数,得到词汇词频,再统计所有所述独立词汇的出现总次数,得到样本频率;
从所述特征提取模型中调用测算函数;
将所述词汇词频和样本频率一同输入至测算函数中,并将其输出结果标定为词汇权重;
获取特征提取阈值,并与所述词汇权重进行比较,且将所有大于所述特征提取阈值的独立词汇标定为关键词。
3.根据权利要求1所述的一种基于RPA和AI结合的智能对话方法,其特征在于:所述根据所述实体关系生成相应的推理规则的步骤,包括:
从所述真实场景的对话信息中提取命名实体,且将所述命名实体作为知识图谱中的知识节点;
获取所述关键词之间的语义关联性,以及其对应的实体关系;
根据实体关系确定所述关键词之间的从属关系,并生成对应的推理规则。
4.根据权利要求1所述的一种基于RPA和AI结合的智能对话方法,其特征在于:所述汇总所述用户反馈信息,并输入至评价模型中,得到各个所述智能对话的对话状态的步骤,包括:
获取所述用户反馈信息,其中,所述用户反馈信息包括正确反馈和错误反馈;
测算所述错误反馈在所有用户反馈信息中的占比,并标定为待评价参数;
从所述评价模型中调用评价阈值,并将所述评价阈值与待评价参数进行比较;
若所述待评价参数大于或等于评价阈值,则表明所述机器人输出的应答语句不符合用户需求,并将其对应的询问语句汇总为问卷文本;
若所述待评价参数小于评价阈值,则直接将其对应的对话状态标定为准确状态。
5.一种基于RPA和AI结合的智能对话装置,应用于权利要求1至4中任意一项所述的基于RPA和AI结合的智能对话方法,其特征在于:包括:
数据采集模块,所述数据采集模块用于采集真实场景中的对话信息,其中,所述对话信息包括询问信息和应答信息;
特征提取模块,所述特征提取模块用于对采集的所述对话信息进行预处理,再将所述询问信息和应答信息中的所有语句一同输入至特征提取模型中,得到所述对话信息中的关键词;
知识构建模块,所述知识构建模块用于根据预处理后的对话信息,利用RPA和AI技术构建知识图谱,并根据关键词确定知识图谱中的实体关系,再根据所述实体关系生成相应的推理规则,并依据知识图谱和推理规则构建机器人的应答数据库以及延展数据库;
智能对话模块,所述智能对话模块用于获取用户的询问语句,并依据所述知识图谱和推理规则输出应答语句,实现机器人与用户的智能对话,并在对话结束后收集用户反馈信息;
反馈模块,所述反馈模块用于汇总所述用户反馈信息,并输入至评价模型中,得到各个所述智能对话的对话状态,其中,所述对话状态包括准确状态和错误状态,且将所述错误状态下的询问语句汇总为问卷文本,再依据所述问卷文本执行问卷调查,得到与该询问语句对应的应答语句。
6.一种电子设备,其特征在于:包括如权利要求5所述的基于RPA和AI结合的智能对话装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311843969.0A CN117520522B (zh) | 2023-12-29 | 2023-12-29 | 一种基于rpa和ai结合的智能对话方法、装置及电子设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311843969.0A CN117520522B (zh) | 2023-12-29 | 2023-12-29 | 一种基于rpa和ai结合的智能对话方法、装置及电子设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN117520522A CN117520522A (zh) | 2024-02-06 |
CN117520522B true CN117520522B (zh) | 2024-03-22 |
Family
ID=89744154
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311843969.0A Active CN117520522B (zh) | 2023-12-29 | 2023-12-29 | 一种基于rpa和ai结合的智能对话方法、装置及电子设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117520522B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117972231B (zh) * | 2024-04-01 | 2024-06-11 | 安徽思高智能科技有限公司 | 一种rpa项目推荐方法及存储介质、电子设备 |
Citations (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20120130962A (ko) * | 2011-05-24 | 2012-12-04 | 성도헌 | 유사 성향 분석 방법 및 시스템 |
CN107273350A (zh) * | 2017-05-16 | 2017-10-20 | 广东电网有限责任公司江门供电局 | 一种实现智能问答的信息处理方法及其装置 |
CN108363687A (zh) * | 2018-01-16 | 2018-08-03 | 深圳市脑洞科技有限公司 | 主观题评分及其模型的构建方法、电子设备及存储介质 |
CN109829051A (zh) * | 2019-01-30 | 2019-05-31 | 科大讯飞股份有限公司 | 一种数据库相似语句筛选的方法和装置 |
CN110008322A (zh) * | 2019-03-25 | 2019-07-12 | 阿里巴巴集团控股有限公司 | 多轮对话场景下的话术推荐方法和装置 |
CN110377715A (zh) * | 2019-07-23 | 2019-10-25 | 天津汇智星源信息技术有限公司 | 基于法律知识图谱的推理式精准智能问答方法 |
CN110471936A (zh) * | 2019-08-19 | 2019-11-19 | 福建工程学院 | 一种混合式sql自动评分方法 |
CN110489533A (zh) * | 2019-07-09 | 2019-11-22 | 深圳追一科技有限公司 | 人机对话方法及相关设备 |
CN112100351A (zh) * | 2020-09-11 | 2020-12-18 | 陕西师范大学 | 一种通过问题生成数据集构建智能问答系统的方法及设备 |
CN115730047A (zh) * | 2021-08-27 | 2023-03-03 | 青岛海信网络科技股份有限公司 | 一种智能问答方法、设备、装置及存储介质 |
CN115982346A (zh) * | 2021-10-14 | 2023-04-18 | 厦门快商通科技股份有限公司 | 一种问答库构建方法、终端设备及存储介质 |
CN116910213A (zh) * | 2023-07-17 | 2023-10-20 | 上海墅字科技有限公司 | 一种基于深度强化学习的自动问答系统 |
CN117056475A (zh) * | 2023-07-25 | 2023-11-14 | 东华大学 | 一种基于知识图谱的智能制造问答方法、装置及存储介质 |
-
2023
- 2023-12-29 CN CN202311843969.0A patent/CN117520522B/zh active Active
Patent Citations (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20120130962A (ko) * | 2011-05-24 | 2012-12-04 | 성도헌 | 유사 성향 분석 방법 및 시스템 |
CN107273350A (zh) * | 2017-05-16 | 2017-10-20 | 广东电网有限责任公司江门供电局 | 一种实现智能问答的信息处理方法及其装置 |
CN108363687A (zh) * | 2018-01-16 | 2018-08-03 | 深圳市脑洞科技有限公司 | 主观题评分及其模型的构建方法、电子设备及存储介质 |
CN109829051A (zh) * | 2019-01-30 | 2019-05-31 | 科大讯飞股份有限公司 | 一种数据库相似语句筛选的方法和装置 |
CN110008322A (zh) * | 2019-03-25 | 2019-07-12 | 阿里巴巴集团控股有限公司 | 多轮对话场景下的话术推荐方法和装置 |
CN110489533A (zh) * | 2019-07-09 | 2019-11-22 | 深圳追一科技有限公司 | 人机对话方法及相关设备 |
CN110377715A (zh) * | 2019-07-23 | 2019-10-25 | 天津汇智星源信息技术有限公司 | 基于法律知识图谱的推理式精准智能问答方法 |
CN110471936A (zh) * | 2019-08-19 | 2019-11-19 | 福建工程学院 | 一种混合式sql自动评分方法 |
CN112100351A (zh) * | 2020-09-11 | 2020-12-18 | 陕西师范大学 | 一种通过问题生成数据集构建智能问答系统的方法及设备 |
CN115730047A (zh) * | 2021-08-27 | 2023-03-03 | 青岛海信网络科技股份有限公司 | 一种智能问答方法、设备、装置及存储介质 |
CN115982346A (zh) * | 2021-10-14 | 2023-04-18 | 厦门快商通科技股份有限公司 | 一种问答库构建方法、终端设备及存储介质 |
CN116910213A (zh) * | 2023-07-17 | 2023-10-20 | 上海墅字科技有限公司 | 一种基于深度强化学习的自动问答系统 |
CN117056475A (zh) * | 2023-07-25 | 2023-11-14 | 东华大学 | 一种基于知识图谱的智能制造问答方法、装置及存储介质 |
Non-Patent Citations (2)
Title |
---|
Learning English and Arabic question similarity with Siamese Neural Networks in community question answering services;Nouha Othman 等;《Data & Knowledge Engineering》;20220331;1-14 * |
基于机器阅读理解的交互式中医问答系统研究;赵方曼;《中国优秀硕士学位论文全文数据库医药卫生科技辑》;20220415;E056-6 * |
Also Published As
Publication number | Publication date |
---|---|
CN117520522A (zh) | 2024-02-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108804521B (zh) | 一种基于知识图谱的问答方法及农业百科问答系统 | |
CN105740228B (zh) | 一种互联网舆情分析方法及系统 | |
CN109299271B (zh) | 训练样本生成、文本数据、舆情事件分类方法及相关设备 | |
CN111182162B (zh) | 基于人工智能的电话质检方法、装置、设备和存储介质 | |
CN117520522B (zh) | 一种基于rpa和ai结合的智能对话方法、装置及电子设备 | |
CN113641833B (zh) | 服务需求匹配方法及装置 | |
CN110287292A (zh) | 一种裁判量刑偏离度预测方法及装置 | |
CN107766234A (zh) | 一种基于移动设备的网页健康度的测评方法、装置及系统 | |
CN117056479A (zh) | 基于语义解析引擎的智能问答交互系统 | |
CN113076735A (zh) | 目标信息的获取方法、装置和服务器 | |
CN117668205A (zh) | 智慧物流客服处理方法、系统、设备及存储介质 | |
CN114742071A (zh) | 基于图神经网络的汉越跨语言观点对象识别分析方法 | |
CN114186040A (zh) | 一种智能机器人客服的运作方法 | |
CN117972208A (zh) | 一种基于互联网的营销信息采集方法及装置 | |
CN113378024A (zh) | 一种基于深度学习面向公检法领域的相关事件识别方法 | |
CN111753540B (zh) | 一种对于文本数据进行收集以进行自然语言处理nlp的方法及系统 | |
CN112148983B (zh) | 一种用于税务行业的内容更新推荐方法 | |
CN112668284B (zh) | 一种法律文书分段方法及系统 | |
CN114417010A (zh) | 面向实时工作流的知识图谱构建方法、装置和存储介质 | |
JP2019153013A (ja) | ユーザに対するコンテンツの共感影響力を推定するプログラム、装置及び方法 | |
US11636269B2 (en) | Content creation and prioritization | |
CN114443930A (zh) | 一种新闻舆情智能监测分析方法、系统及计算机存储介质 | |
CN113177164A (zh) | 基于大数据的多平台协同新媒体内容监控管理系统 | |
CN114154513B (zh) | 一种领域语义网自动构建方法及系统 | |
CN116975447B (zh) | 一种便携式学习机及其资源检索方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |