CN111737412A - 基于自然语言处理和知识图谱的公民来访引导方法 - Google Patents

基于自然语言处理和知识图谱的公民来访引导方法 Download PDF

Info

Publication number
CN111737412A
CN111737412A CN202010433685.4A CN202010433685A CN111737412A CN 111737412 A CN111737412 A CN 111737412A CN 202010433685 A CN202010433685 A CN 202010433685A CN 111737412 A CN111737412 A CN 111737412A
Authority
CN
China
Prior art keywords
citizen
visiting
template
information
event
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010433685.4A
Other languages
English (en)
Inventor
郭磊
张克乐
王秋然
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
University of Electronic Science and Technology of China
Original Assignee
University of Electronic Science and Technology of China
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by University of Electronic Science and Technology of China filed Critical University of Electronic Science and Technology of China
Priority to CN202010433685.4A priority Critical patent/CN111737412A/zh
Publication of CN111737412A publication Critical patent/CN111737412A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/3332Query translation
    • G06F16/3334Selection or weighting of terms from queries, including natural language queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/31Indexing; Data structures therefor; Storage structures
    • G06F16/313Selection or weighting of terms for indexing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/166Editing, e.g. inserting or deleting
    • G06F40/186Templates
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/18Legal services

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Computational Linguistics (AREA)
  • Artificial Intelligence (AREA)
  • Software Systems (AREA)
  • Business, Economics & Management (AREA)
  • General Health & Medical Sciences (AREA)
  • Tourism & Hospitality (AREA)
  • Health & Medical Sciences (AREA)
  • Economics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Human Resources & Organizations (AREA)
  • Marketing (AREA)
  • Primary Health Care (AREA)
  • Strategic Management (AREA)
  • General Business, Economics & Management (AREA)
  • Technology Law (AREA)
  • Animal Behavior & Ethology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Computation (AREA)
  • Medical Informatics (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

公民来访是公民表达自己诉求的一种方式。针对各级法院大厅中缺少公民来访智能引导系统,公民来访流程需要人工指导进而造成工作效率低的问题,本发明提供一种基于知识图谱的公民来访智能辅助引导系统。该系统分为两部分:软件与硬件系统,其中硬件系统包括公民来访大厅客户引导机、工作人员服务机、通信系统和后端服务器系统;软件由主题提取、知识图谱、引导模板、交互、系统管理五个模块组成。本发明可以引导公民来访人员更加方便、有效地进入到法律规定的公民来访流程,提高公民来访工作效率,利于维护社会的稳定与团结。

Description

基于自然语言处理和知识图谱的公民来访引导方法
技术领域
本发明涉及公民来访的智能辅助引导方法,用于智能辅助引导公民来访人员,更准确、完整地提供处理事件所需的关键信息,提升公民来访事件处理效率。
背景技术
公民来访是群众反映诉求的一种方式,而公民来访是一种较为复杂的事件。随着近年来社会治理的现代化要求,需要更加妥当地处理公民来访事件,有助于提高群众生活的幸福感,保证社会的稳定发展。
目前我国公民来访的方式主要有四种渠道:到法院公民来访大厅的现场公民来访、互联网公民来访、电话公民来访和邮件公民来访,公民来访部门建议尽量通过互联网公民来访或电话公民来访。但公民来访人员中存在部分人员年龄偏大、受教育水平低,认为到法院公民来访大厅现场公民来访才可信。
公民来访反映的案件通常形式多样,人员身份复杂,事件中的活动关系较为复杂。使得其在公民来访大厅进行现场公民来访时提供的公民来访材料难以完整、准确地反映出事件处理人员所需要的信息。存在阻碍公民来访人员和事件处理人员之间的沟通、降低处理效率、并且存在激化情绪的可能性的问题。
因此针对上述问题,研究利用自然语言处理和知识图谱等人工智能技术,引导在公民来访大厅公民来访的人员利用网络和电话进行资料录入,帮助公民来访人员完整、准确地将公民来访案件的关键信息进行处理。本发明能够减轻公民来访接待人员的工作压力,同时消除到访人员情绪不稳定风险,有效缓解公民来访人员带来的社会矛盾。
发明内容
为解决现有技术中存在的技术问题,本发明实施例提供一种基于自然语言处理和知识图谱的公民来访智能辅助引导方法,能为公民来访人员提供智能辅助引导,引导其完整、准确提供事件关键信息。
本发明提供一种智能辅助引导方法,所述智能辅助引导方法的特征在于:应用于对公民来访人员提交公民来访材料时的辅助引导,该方法包括三个部分;初始信息录入、模板匹配和模板信息录入,该方法首先接收公民来访人员的初始信息录入,再利用自然语言处理和知识图谱,模板匹配,得到针对公民来访事件的信息模板,最后依据该模板,引导公民来访人员填入相关信息;
所述初始信息录入,引导通过网络和电话公民来访的人员,将公民来访内容简要说明,并将公民来访内容以文本形式保存;
所述模板匹配,通过机器学习算法和知识图谱,在模板库中,寻找匹配针对公民来访事件内容设计的公民来访信息填写模板;
所述模板信息录入,依据公民来访信息填写模板,引导公民来访人员提供相关信息。
所述初始信息录入,对于通过网络公民来访的公民来访人员,通过网页录入文字内容的方式,提交并保存公民来访信息;对于通过电话公民来访的公民来访人员,先将语音转为文字信息,再将文字信息保存。
所述模板匹配,利用自然语言处理算法,先将公民来访文档分词,并从分词后的词库中,抽取关键词,再利用关键词进行主题提取,最后依据公民来访事件的主题,在模板库进行匹配,选择对应的公民来访信息填写模板。
在进行模板匹配时,利用公民来访的历史文档,训练模型,再进行关键词抽取和主题提取;同时依据公民来访处理人员的意见,建立公民来访事件的知识图谱,再依据知识图谱、公民来访事件的主题,完成最终模板匹配。
所述模板信息录入,对于通过网络公民来访的公民来访人员,以网页形式呈现模板格式,并引导公民来访者录入公民来访内容,再提交保存公民来访信息;对于通过电话公民来访的公民来访人员,通过语音方式,逐条引导公民来访人员说明公民来访事件内容,并将语音转为文字信息,再将文字信息保存。
综上,本发明提供了一种基于知识图谱的公民来访智能辅助引导方法,为公民来访人员提供智能辅助引导,引导其完整、准确提供事件关键信息。
有益效果是,本发明所述技术方案能够智能辅助引导公民来访人员,使其完整、准确提供,事件处理人员所关注的事件关键信息,从而提升处理效率,减轻处理人员工作压力,缓解潜在情绪激化风险。降低了公民来访大厅的不稳定因素。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例描述所需的附图做简单介绍。
图1为本发明方法实施例流程;
图2是示出图1所示初始信息录入的实施例流程;
图3是示出图1所示的模板匹配的实施例流程;
图4是示出图3所示的关键词抽取的实施例流程;
图5是示出图3所示的主题提取的实施例流程;
图6是示出图3所示的主题模板匹配的实施例流程。
图7是示出图1所示的模板信息录入的实施例流程;
具体实施方案
为了使本领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚的描述,所述的实施例仅是本发明一部分实施例,而不是全部实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本发明的保护范围。
本发明主要应用于对公民来访人员的智能辅助引导,帮助其准确、完整反映事件问题,提高公民来访处理人员的办理效率。
基于自然语言处理和知识图谱的公民来访智能辅助引导方法,如图1所示,该方法包括三个部分;初始信息录入S101、模板匹配S102和模板信息录入S103。
通过大厅引导台,引导来大厅公民来访的人员使用网络公民来访和电话公民来访。通过本发明提出的方法能够减轻处理人员工作压力,缓解潜在情绪激化风险。降低了公民来访大厅的不稳定因素。
方法首先接收公民来访人员的初始信息录入,再利用机器学习和知识图谱,模板匹配,得到针对公民来访事件的信息模板,最后依据该模板,引导公民来访人员填入相关信息,下面将进一步说明各个部分的详细情况。
所述初始信息录入S101,引导通过网络和电话公民来访的人员,将公民来访内容简要说明,并将公民来访内容以文本形式保存。
一种实施例流程,如图2所示,对于通过网络公民来访的公民来访人员,通过网页录入文字内容的方式,提交并保存公民来访信息S10202;对于通过电话公民来访的公民来访人员,先将语音转文字S10201,再将文字信息保存S10202。
所述模板匹配S102,通过自然语言处理算法和知识图谱,在模板库中,寻找匹配针对公民来访事件内容设计的公民来访信息填写模板;
一种实施例流程,如图3所示,先将公民来访文档分词S10201,并从分词后的词库中,抽取关键词S10202,再利用关键词进行主题提取S10203,最后依据公民来访事件的主题,在模板库中进行主题模板匹配S10204,选择对应的公民来访信息填写模板,并返回模板S10205。
在进行模板匹配S102时,一种实施例是,
分词S10201使用结巴分词工具,对中文分词,将文档变为词袋,再进行关键词抽取S10202。
关键词抽取S10202,如图4所示,利用基于词频统计的TF-IDF方法,提取关键词,
在算法部署前,利用公民来访的历史文档,统计不同主题下,公民来访文书分别包含不同词汇的概率P,以及所有公民来访文书材料包含不同词汇的概率Q,作为词汇的重要性,存入公民来访历史事件库101中。
算法部署后,先对公民来访文书进行词汇统计S1020201;然后依据公民来访历史事件库 101中词汇重要性,利用贝叶斯公式,计算不同主题下的条件概率K,并将概率K与概率Q的商K/Q作为词频重要性S1020202;最后选择重要性靠前的词汇作为关键词S1020203。
主题提取S10203,如图5所示,利用LDA主题提取算法,建立两个狄利克雷分布,狄利克雷α分布用于取样生成文档分布θ,狄利克雷β分布用于取样生成主题对应的词语分布ζ。文档分布θ取样生成主题概率,词语分布ζ取样生成词语概率。
在模型部署前,先利用Gibbs采样方法,在历史文档训练模型,直至模型收敛;
在模型部署后,公民来访事件文档,每个关键词随机赋予一个主题编号S1020301,然后根据Gibbs采样,更新主题编号S1020302,如果收敛则输出公民来访文档主题S1020304,如果不收敛则继续Gibbs采样S1020303;
主题模板匹配S10204,如图6所示,利用公民来访处理人员建立的知识图谱规则,进行判断;
算法部署前,依据公民来访处理人员的意见,建立公民来访事件的知识图谱102;
算法部署后,依据知识图谱102进行主题匹配S1020401,然后再依据知识图谱102,进行关键词匹配S1020402,完成最终模板匹配。
所述知识谱图102,包含各个主题和模板的属性、多个主题和模板的关系,多个关键词和模板的关系,其中模板属性包括主题重要性、更新时间。
知识图谱可以使用关系型数据库存储,也可以选择图数据库存储,
优选地,当公民来访处理人员提供的规则简单时,选择关系型数据库,当提供的规则较为复杂时,选择图数据库。
所述模板信息录入S103,依据公民来访信息填写模板,引导公民来访人员提供相关信息。
一种实施例流程,如图7所示,判断模板是否已经录入完毕,如果是则结束;否则继续引导录入下一个问题S10301,然后录入信息S10302;判断信息是否为语音信息,如果是,则语音转文字S10303,否则直接判断是否录入完毕。
对于通过网络公民来访的公民来访人员,以网页形式呈现模板格式,并引导公民来访者录入公民来访内容,再提交保存公民来访信息;对于通过电话公民来访的公民来访人员,通过语音方式,逐条引导公民来访人员说明公民来访事件内容,并将语音转为文字信息,再将文字信息保存。
以上实例用以说明而非限制本发明的技术方案。不脱离本发明精神和范围的任何修改和替换,均应涵盖在本发明的权利要求范围中。

Claims (5)

1.一种智能辅助引导方法,所述智能辅助引导方法的特征在于:应用于对公民来访人员提交公民来访材料时的辅助引导,引导在公民来访大厅进行现场公民来访的人员改为网络公民来访和电话公民来访。该方法包括三个部分;初始信息录入、模板匹配和模板信息录入;
所述初始信息录入,引导通过网络和电话公民来访的人员,将公民来访内容简要说明,并将公民来访内容以文本形式保存;
所述模板匹配,通过自然语言处理算法和知识图谱,在模板库中,寻找匹配针对公民来访事件内容设计的公民来访信息填写模板;
所述模板信息录入,依据公民来访信息填写模板,引导公民来访人员提供相关信息。
2.根据权利要求1所述的智能辅助引导方法,其特征在于,
所述初始信息录入,对于通过网络公民来访的公民来访人员,通过网页录入文字内容的方式,提交并保存公民来访信息;对于通过电话公民来访的公民来访人员,先将语音转为文字信息,再将文字信息保存。
3.根据权利要求1所述的智能辅助引导方法,其特征在于,
所述模板匹配,利用自然语言处理算法,先将公民来访文档分词,并从分词后的词库中,抽取关键词,再利用关键词进行主题提取,最后依据公民来访事件的主题,在模板库进行匹配,选择对应的公民来访信息填写模板。
4.根据权利要求1所述的智能辅助引导方法,其特征在于,
所述模板信息录入,对于通过网络公民来访的公民来访人员,以网页形式呈现模板格式,并引导公民来访者录入公民来访内容,再提交保存公民来访信息;对于通过电话公民来访的公民来访人员,通过语音方式,逐条引导公民来访人员说明公民来访事件内容,并将语音转为文字信息,再将文字信息保存。
5.根据权利要求1和3所述的智能辅助引导方法,其特征在于,
所述模板库匹配,先建立公民来访事件的知识图谱,依据知识图谱、公民来访事件的主题进行模板匹配。
CN202010433685.4A 2020-05-21 2020-05-21 基于自然语言处理和知识图谱的公民来访引导方法 Pending CN111737412A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010433685.4A CN111737412A (zh) 2020-05-21 2020-05-21 基于自然语言处理和知识图谱的公民来访引导方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010433685.4A CN111737412A (zh) 2020-05-21 2020-05-21 基于自然语言处理和知识图谱的公民来访引导方法

Publications (1)

Publication Number Publication Date
CN111737412A true CN111737412A (zh) 2020-10-02

Family

ID=72647543

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010433685.4A Pending CN111737412A (zh) 2020-05-21 2020-05-21 基于自然语言处理和知识图谱的公民来访引导方法

Country Status (1)

Country Link
CN (1) CN111737412A (zh)

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101833561A (zh) * 2010-02-12 2010-09-15 西安电子科技大学 面向自然语言处理的语义Web服务智能代理
CN108427722A (zh) * 2018-02-09 2018-08-21 卫盈联信息技术(深圳)有限公司 智能交互方法、电子装置及存储介质
CN109614476A (zh) * 2018-12-11 2019-04-12 平安科技(深圳)有限公司 客服系统问答方法、装置、计算机设备及存储介质
CN110110585A (zh) * 2019-03-15 2019-08-09 西安电子科技大学 基于深度学习的智能阅卷实现方法及系统、计算机程序
CN110321538A (zh) * 2019-06-20 2019-10-11 北京小笨鸟信息技术有限公司 一种智能离线数据填报系统
CN110543574A (zh) * 2019-08-30 2019-12-06 北京百度网讯科技有限公司 一种知识图谱的构建方法、装置、设备及介质
CN110837564A (zh) * 2019-09-25 2020-02-25 中央民族大学 多语言刑事判决书知识图谱的构建方法
CN110929007A (zh) * 2019-11-08 2020-03-27 国网江苏省电力有限公司电力科学研究院 一种电力营销知识体系平台及应用方法

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101833561A (zh) * 2010-02-12 2010-09-15 西安电子科技大学 面向自然语言处理的语义Web服务智能代理
CN108427722A (zh) * 2018-02-09 2018-08-21 卫盈联信息技术(深圳)有限公司 智能交互方法、电子装置及存储介质
CN109614476A (zh) * 2018-12-11 2019-04-12 平安科技(深圳)有限公司 客服系统问答方法、装置、计算机设备及存储介质
CN110110585A (zh) * 2019-03-15 2019-08-09 西安电子科技大学 基于深度学习的智能阅卷实现方法及系统、计算机程序
CN110321538A (zh) * 2019-06-20 2019-10-11 北京小笨鸟信息技术有限公司 一种智能离线数据填报系统
CN110543574A (zh) * 2019-08-30 2019-12-06 北京百度网讯科技有限公司 一种知识图谱的构建方法、装置、设备及介质
CN110837564A (zh) * 2019-09-25 2020-02-25 中央民族大学 多语言刑事判决书知识图谱的构建方法
CN110929007A (zh) * 2019-11-08 2020-03-27 国网江苏省电力有限公司电力科学研究院 一种电力营销知识体系平台及应用方法

Similar Documents

Publication Publication Date Title
CN107315766A (zh) 一种集合智能与人工问答的语音问答方法及其装置
CN111708869B (zh) 人机对话的处理方法及装置
CN107818164A (zh) 一种智能问答方法及其系统
CN107273350A (zh) 一种实现智能问答的信息处理方法及其装置
CN114116994A (zh) 一种迎宾机器人对话方法
CN110717018A (zh) 一种基于知识图谱的工业设备故障维修问答系统
CN110808032B (zh) 一种语音识别方法、装置、计算机设备及存储介质
CN102165518A (zh) 用于在对话系统中从用户话语产生自然语言短语的系统和方法
CN108763529A (zh) 一种智能检索方法、装置和计算机可读存储介质
CN106502979A (zh) 一种自然语言信息的数据处理方法和装置
CN111858913A (zh) 一种自动生成文本摘要的方法和系统
CN111523328B (zh) 一种智能客服语义处理方法
CN111597349B (zh) 一种基于人工智能的轨道交通规范实体关系自动补全方法
CN110265019B (zh) 一种语音识别的方法及语音机器人系统
CN116628173B (zh) 一种基于关键字提取的智能客服信息生成系统及生成方法
CN110633468B (zh) 一种关于对象特征提取的信息处理方法及装置
KR102240910B1 (ko) 머신 러닝 기반 한국 고객 서비스 어시스턴트 보조 시스템
CN111061886B (zh) 一种基于nlp的多媒体作业在线管理系统及方法
Chowanda et al. Generative Indonesian conversation model using recurrent neural network with attention mechanism
CN111737412A (zh) 基于自然语言处理和知识图谱的公民来访引导方法
CN115357697A (zh) 数据处理方法、装置、终端设备以及存储介质
CN107818078B (zh) 汉语自然语言对话的语义关联与匹配方法
CN111783465B (zh) 一种命名实体归一化方法、系统及相关装置
CN111243351B (zh) 一种基于分词技术的外语口语训练系统、客户端和服务器
CN112836517A (zh) 一种基于自然语言处理挖掘风险信号的方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20201002