CN116737887A - 一种基于服务事项要素的智能问答方法 - Google Patents
一种基于服务事项要素的智能问答方法 Download PDFInfo
- Publication number
- CN116737887A CN116737887A CN202310040363.7A CN202310040363A CN116737887A CN 116737887 A CN116737887 A CN 116737887A CN 202310040363 A CN202310040363 A CN 202310040363A CN 116737887 A CN116737887 A CN 116737887A
- Authority
- CN
- China
- Prior art keywords
- question
- answering
- user
- service item
- intention
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 28
- 238000010801 machine learning Methods 0.000 claims abstract description 4
- 230000011218 segmentation Effects 0.000 claims description 12
- 238000004590 computer program Methods 0.000 claims description 9
- 239000000463 material Substances 0.000 claims description 8
- 238000012512 characterization method Methods 0.000 claims description 6
- 238000012545 processing Methods 0.000 claims description 6
- 238000013135 deep learning Methods 0.000 claims description 3
- 238000012216 screening Methods 0.000 claims description 3
- 238000012549 training Methods 0.000 claims description 3
- 238000000605 extraction Methods 0.000 abstract 1
- 238000013473 artificial intelligence Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000009960 carding Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 239000002699 waste material Substances 0.000 description 1
Classifications
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明特别涉及一种基于服务事项要素的智能问答方法。该基于服务事项要素的智能问答方法,先基于历史语料的<问题,答案>对模型提炼,再基于问题模型的意图识别机器学习,基于用户意图的数据检索,最后基于问答模型生成答案。该基于服务事项要素的智能问答方法,可以利用生成模型自动、实时生成政务服务事项问答知识,避免了政务服务事项数据带来的不便,降低了人力、时间成本,保证了知识有效性及问答精准度。
Description
技术领域
本发明涉及智能问答技术领域,特别涉及一种基于服务事项要素的智能问答方法。
背景技术
近年来,大力推进的互联网+政务服务,取得显著成效,对便利企业和群众办事发挥了重要作用。由于政务领域办事比较依赖人工,不仅工作量大,而且重复性高。因此如何准确定位具体办事事项返回给用户相关信息,减轻人工问答压力,提高办事效率,方便用户快速了解政务办事事项是非常必要的。
随着大数据和人工智能的快速发展,政务服务的治理变革迎来了重大机遇和全新途径。智能问答系统作为人工智能中的一个典型应用,因其实时对话、高效便捷、突破时空限制等优势,在实际应用中已取得一定成效,并且具有巨大的应用前景。
但是,在已开通的问答机器人中,除少数地区的政务服务网站问答机器人的答复质量较高外,绝大多数问答机器人的答复内容质量较低,往往“答非所问”,后台缺乏全面系统的信息资源梳理,没有将信息资源转化为知识,难以满足用户需求。
基于上述情况,本发明提出了一种基于服务事项要素的智能问答方法。
发明内容
本发明为了弥补现有技术的缺陷,提供了一种简单高效的基于服务事项要素的智能问答方法。
本发明是通过如下技术方案实现的:
一种基于服务事项要素的智能问答方法,其特征在于:包括以下步骤:
步骤S1、基于历史语料的<问题,答案>对模型提炼;
筛选出政务服务中的高频使用字段,并对包含高频使用字段的历史问答语料进行分析和总结,获取问答模型;
步骤S2、基于问题模型的意图识别机器学习;
从历史问答语料中提炼出问答模型后,通过深度学习的方式对意图识别算法进行训练;先对问答模型进行分词和特征化处理,以便计算机理解;再抽取实体,最后对用户输入的问题类型进行分类;
步骤S3、基于用户意图的数据检索;
对意图识别得出的问题类型进行判断,若问题属于政务服务事项类问题,则选择政务服务事项库作为答案数据来源,获取事项要素值;否则,确定并输出关联表;
步骤S4、基于问答模型的答案生成;
将获取的事项要素值导入答案模型,按照问答模型中对应的要素位置进行排列组合,形成便于用户理解的口语化表达;
最后,将得到的包含事项要素信息的句子作为答案发送给用户,用于对用户问题进行解答。
所述步骤S1中,高频使用字段是指政务服务事项要素中在用户问题中使用频率高于自定义阈值的字段,包括但不限于事项名称、设定依据、实施主体、法定办结时限、受理条件、办理流程、办理进程查询途径、办理时间、办理地点、是否收费、收费依据以及材料名称。
所述步骤S1中,对包含高频使用字段的政务服务领域历史问答语料进行分析,结合智能问答意图识别算法所需要的语料特征,总结问题及问答模型。
所述步骤S2中,利用自然语言理解NLU的分词器Tokenizer对问答模型中语话逐一进行分词处理,将得到的分词标志Tokens进行特征化,并将词语特征化转换成数字编码,以便计算机理解用户输入的问题语句。
所述步骤S2中,利用实体抽取器抽取特定类型的实体,利用意图分类器Classifier理解用户输入的整个问题语句的意图,并对用户意图进行分类,得到问题类型。
所述步骤S2中,实体抽取器包括但不限于Mitie实体抽取器、Spacy实体抽取器和CRF实体抽取器,综合利用上述实体抽取器抽取特定类型的实体。
所述步骤S3中,首先根据用户意图中的政务服务事项名称实体在基本信息表中确定对应的政务服务事项,获取其关联信息项的值;
再根据用户意图中包含的事项要素(如申请材料、是否收费、办理地点、办理流程等)确定对应的关联表;
最后,利用从基本信息表中获取的关联信息定位到事项在关联表中的值,作为答案生成的素材。
一种基于服务事项要素的智能问答设备,其特征在于:包括存储器和处理器;所述存储器用于存储计算机程序,所述处理器用于执行所述计算机程序时实现上述的方法步骤。
一种可读存储介质,其特征在于:所述可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现上述的方法步骤。
本发明的有益效果是:该基于服务事项要素的智能问答方法,可以利用生成模型自动、实时生成政务服务事项问答知识,避免了政务服务事项数据带来的不便,降低了人力、时间成本,保证了知识有效性及问答精准度。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
附图1为本发明基于服务事项要素的智能问答方法实现方法示意图。
具体实施方式
为了使本技术领域的人员更好的理解本发明中的技术方案,下面将结合本发明实施例,对本发明实施例中的技术方案进行清楚,完整的描述。显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
政务服务领域的智能问答核心是政务服务事项,政务服务事项数以千、万计,每个事项的要素信息多达数十甚至百余个,办事群众和企业在办事咨询时涉及的信息覆盖面较广,通过人工梳理根据政务服务事项要素生成<问题,答案>对用户问题进行解答的方式,一方面工作量巨大造成资源的浪费且效率低下,一方面由于政务服务事项的更新频率较高问答对的更新存在困难不够灵活。
该基于服务事项要素的智能问答方法,包括以下步骤:
步骤S1、基于历史语料的<问题,答案>对模型提炼;
筛选出政务服务中的高频使用字段,并对包含高频使用字段的历史问答语料进行分析和总结,获取问答模型;
所述步骤S1中,高频使用字段是指政务服务事项要素中在用户问题中使用频率高于自定义阈值的字段,包括但不限于事项名称、设定依据、实施主体、法定办结时限、受理条件、办理流程、办理进程查询途径、办理时间、办理地点、是否收费、收费依据以及材料名称。
所述步骤S1中,对包含高频使用字段的政务服务领域历史问答语料进行分析,结合智能问答意图识别算法所需要的语料特征,总结问题及问答模型。
示例如下:
表1历史问答语料分析与总结示例
步骤S2、基于问题模型的意图识别机器学习;
从历史问答语料中提炼出问答模型后,通过深度学习的方式对意图识别算法进行训练;先对问答模型进行分词和特征化处理,以便计算机理解;再抽取实体,最后对用户输入的问题类型进行分类;
所述步骤S2中,利用自然语言理解NLU的分词器Tokenizer对问答模型中语话逐一进行分词处理,将得到的分词标志Tokens进行特征化,并将词语特征化转换成数字编码,以便计算机理解用户输入的问题语句。
所述步骤S2中,利用实体抽取器抽取特定类型的实体,利用意图分类器Classifier理解用户输入的整个问题语句的意图,并对用户意图进行分类,得到问题类型。
所述步骤S2中,实体抽取器包括但不限于Mitie实体抽取器、Spacy实体抽取器和CRF实体抽取器,综合利用上述实体抽取器抽取特定类型的实体。
步骤S3、基于用户意图的数据检索;
对意图识别得出的问题类型进行判断,若问题属于政务服务事项类问题,则选择政务服务事项库作为答案数据来源,获取事项要素值;否则,确定并输出关联表;
所述步骤S3中,首先根据用户意图中的政务服务事项名称实体在基本信息表中确定对应的政务服务事项,获取其关联信息项的值;
再根据用户意图中包含的事项要素(如申请材料、是否收费、办理地点、办理流程等)确定对应的关联表;
最后,利用从基本信息表中获取的关联信息定位到事项在关联表中的值,作为答案生成的素材。
步骤S4、基于问答模型的答案生成;
将获取的事项要素值导入答案模型,按照问答模型中对应的要素位置进行排列组合,形成便于用户理解的口语化表达;
最后,将得到的包含事项要素信息的句子作为答案发送给用户,用于对用户问题进行解答。
该基于服务事项要素的智能问答设备,包括存储器和处理器;所述存储器用于存储计算机程序,所述处理器用于执行所述计算机程序时实现上述的方法步骤。
该可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现上述的方法步骤。
以上所述的实施例,只是本发明具体实施方式的一种,本领域的技术人员在本发明技术方案范围内进行的通常变化和替换都应包含在本发明的保护范围内。
Claims (9)
1.一种基于服务事项要素的智能问答方法,其特征在于:包括以下步骤:
步骤S1、基于历史语料的<问题,答案>对模型提炼;
筛选出政务服务中的高频使用字段,并对包含高频使用字段的历史问答语料进行分析和总结,获取问答模型;
步骤S2、基于问题模型的意图识别机器学习;
从历史问答语料中提炼出问答模型后,通过深度学习的方式对意图识别算法进行训练;先对问答模型进行分词和特征化处理,以便计算机理解;再抽取实体,最后对用户输入的问题类型进行分类;
步骤S3、基于用户意图的数据检索;
对意图识别得出的问题类型进行判断,若问题属于政务服务事项类问题,则选择政务服务事项库作为答案数据来源,获取事项要素值;否则,确定并输出关联表;
步骤S4、基于问答模型的答案生成;
将获取的事项要素值导入答案模型,按照问答模型中对应的要素位置进行排列组合,形成便于用户理解的口语化表达;
最后,将得到的包含事项要素信息的句子作为答案发送给用户,用于对用户问题进行解答。
2.根据权利要求1所述的基于服务事项要素的智能问答方法,其特征在于:所述步骤S1中,高频使用字段是指政务服务事项要素中在用户问题中使用频率高于自定义阈值的字段,包括但不限于事项名称、设定依据、实施主体、法定办结时限、受理条件、办理流程、办理进程查询途径、办理时间、办理地点、是否收费、收费依据以及材料名称。
3.根据权利要求2所述的基于服务事项要素的智能问答方法,其特征在于:所述步骤S1中,对包含高频使用字段的政务服务领域历史问答语料进行分析,结合智能问答意图识别算法所需要的语料特征,总结问题及问答模型。
4.根据权利要求1所述的基于服务事项要素的智能问答方法,其特征在于:所述步骤S2中,利用自然语言理解NLU的分词器Tokenizer对问答模型中语话逐一进行分词处理,将得到的分词标志Tokens进行特征化,并将词语特征化转换成数字编码,以便计算机理解用户输入的问题语句。
5.根据权利要求1所述的基于服务事项要素的智能问答方法,其特征在于:所述步骤S2中,利用实体抽取器抽取特定类型的实体,利用意图分类器Classifier理解用户输入的整个问题语句的意图,并对用户意图进行分类,得到问题类型。
6.根据权利要求5所述的基于服务事项要素的智能问答方法,其特征在于:所述步骤S2中,实体抽取器包括但不限于Mitie实体抽取器、Spacy实体抽取器和CRF实体抽取器,综合利用上述实体抽取器抽取特定类型的实体。
7.根据权利要求1所述的基于服务事项要素的智能问答方法,其特征在于:所述步骤S3中,首先根据用户意图中的政务服务事项名称实体在基本信息表中确定对应的政务服务事项,获取其关联信息项的值;
再根据用户意图中包含的事项要素确定对应的关联表;
最后,利用从基本信息表中获取的关联信息定位到事项在关联表中的值,作为答案生成的素材。
8.一种基于服务事项要素的智能问答设备,其特征在于:包括存储器和处理器;所述存储器用于存储计算机程序,所述处理器用于执行所述计算机程序时实现如权利要求1至7任意一项所述的方法步骤。
9.一种可读存储介质,其特征在于:所述可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至7任意一项所述的方法步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310040363.7A CN116737887A (zh) | 2023-01-13 | 2023-01-13 | 一种基于服务事项要素的智能问答方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310040363.7A CN116737887A (zh) | 2023-01-13 | 2023-01-13 | 一种基于服务事项要素的智能问答方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116737887A true CN116737887A (zh) | 2023-09-12 |
Family
ID=87917466
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310040363.7A Pending CN116737887A (zh) | 2023-01-13 | 2023-01-13 | 一种基于服务事项要素的智能问答方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116737887A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117851577A (zh) * | 2024-03-06 | 2024-04-09 | 海乂知信息科技(南京)有限公司 | 基于知识图谱增强大语言模型的政府服务问答方法 |
-
2023
- 2023-01-13 CN CN202310040363.7A patent/CN116737887A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117851577A (zh) * | 2024-03-06 | 2024-04-09 | 海乂知信息科技(南京)有限公司 | 基于知识图谱增强大语言模型的政府服务问答方法 |
CN117851577B (zh) * | 2024-03-06 | 2024-05-14 | 海乂知信息科技(南京)有限公司 | 基于知识图谱增强大语言模型的政府服务问答方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108052583B (zh) | 电商本体构建方法 | |
CN112035653B (zh) | 一种政策关键信息提取方法和装置、存储介质、电子设备 | |
CN108563783B (zh) | 一种基于大数据的财务分析管理系统及方法 | |
CN110795932B (zh) | 基于地质本体的地质报告文本信息提取方法 | |
CN108287911A (zh) | 一种基于约束化远程监督的关系抽取方法 | |
CN110334343B (zh) | 一种合同中个人隐私信息抽取的方法和系统 | |
US10210251B2 (en) | System and method for creating labels for clusters | |
CN111859969A (zh) | 数据分析方法及装置、电子设备、存储介质 | |
CN105786971B (zh) | 一种面向国际汉语教学的语法点识别方法 | |
CN110910175A (zh) | 一种旅游门票产品画像生成方法 | |
CN111782793A (zh) | 智能客服处理方法和系统及设备 | |
CN116737887A (zh) | 一种基于服务事项要素的智能问答方法 | |
CN111522948A (zh) | 一种智能处理公文的方法及其系统 | |
Brenskelle et al. | Maximizing human effort for analyzing scientific images: A case study using digitized herbarium sheets | |
CN109409529A (zh) | 一种事件认知分析方法、系统及存储介质 | |
CN115017271B (zh) | 用于智能生成rpa流程组件块的方法及系统 | |
CN112488593B (zh) | 一种用于招标的辅助评标系统及方法 | |
CN114969347A (zh) | 缺陷查重实现方法、装置、终端设备及存储介质 | |
CN111341404B (zh) | 一种基于ernie模型的电子病历数据组解析方法及系统 | |
CN114417010A (zh) | 面向实时工作流的知识图谱构建方法、装置和存储介质 | |
CN113656579A (zh) | 文本分类方法、装置、设备及介质 | |
CN112597761A (zh) | 临时报告语义信息挖掘方法、装置、存储介质和电子设备 | |
CN111597775A (zh) | 基于html的信息智能提取技术的方法 | |
CN116028620B (zh) | 一种基于多任务特征协同的生成专利摘要的方法及系统 | |
CN113807429B (zh) | 企业的分类方法、装置、计算机设备和存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |