CN114138930B - 一种基于知识图谱的意图表征系统及方法 - Google Patents
一种基于知识图谱的意图表征系统及方法 Download PDFInfo
- Publication number
- CN114138930B CN114138930B CN202111236842.3A CN202111236842A CN114138930B CN 114138930 B CN114138930 B CN 114138930B CN 202111236842 A CN202111236842 A CN 202111236842A CN 114138930 B CN114138930 B CN 114138930B
- Authority
- CN
- China
- Prior art keywords
- intention
- knowledge graph
- intent
- information
- knowledge
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000012512 characterization method Methods 0.000 title claims abstract description 51
- 238000000034 method Methods 0.000 title abstract description 16
- 238000013507 mapping Methods 0.000 claims abstract description 19
- 238000007781 pre-processing Methods 0.000 claims abstract description 19
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 9
- 238000013461 design Methods 0.000 claims abstract description 9
- 238000000605 extraction Methods 0.000 claims description 21
- 238000012545 processing Methods 0.000 claims description 14
- 238000005065 mining Methods 0.000 claims description 9
- 238000005516 engineering process Methods 0.000 claims description 8
- 238000004590 computer program Methods 0.000 claims description 6
- 238000004364 calculation method Methods 0.000 claims description 5
- 238000004140 cleaning Methods 0.000 claims description 3
- 238000013519 translation Methods 0.000 description 7
- 238000010586 diagram Methods 0.000 description 5
- 230000006399 behavior Effects 0.000 description 4
- 238000004891 communication Methods 0.000 description 4
- 230000009471 action Effects 0.000 description 3
- 230000007547 defect Effects 0.000 description 3
- 230000004927 fusion Effects 0.000 description 3
- 239000003607 modifier Substances 0.000 description 3
- 238000011161 development Methods 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 238000012423 maintenance Methods 0.000 description 2
- 238000007726 management method Methods 0.000 description 2
- 238000005457 optimization Methods 0.000 description 2
- 239000007787 solid Substances 0.000 description 2
- 230000002159 abnormal effect Effects 0.000 description 1
- 230000006978 adaptation Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000007418 data mining Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 238000005538 encapsulation Methods 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000008447 perception Effects 0.000 description 1
- 230000008092 positive effect Effects 0.000 description 1
- 238000003908 quality control method Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/332—Query formulation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
- G06F16/3344—Query execution using natural language analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/36—Creation of semantic tools, e.g. ontology or thesauri
- G06F16/367—Ontology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
- G06F40/295—Named entity recognition
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Artificial Intelligence (AREA)
- Mathematical Physics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Animal Behavior & Ethology (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- General Health & Medical Sciences (AREA)
- Machine Translation (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明属于计算机技术领域,公开了一种基于知识图谱的意图表征系统及方法,所述基于知识图谱的意图表征方法包括:用户通过前端页面或系统提供的接口输入意图,将意图信息发送至后端进行数据预处理;提取意图关键信息,构建意图知识图谱,以结构化形式刻画意图;基于设计的意图语法规则以规范意图知识图谱,基于参数映射模块以输出含有网络参数的意图知识图谱。本发明通过设计基于EBNF的意图语法规则,以标准范式的意图语言规范解决信息有歧义、用词不标准等问题,将结构化表征的意图规范化,形成通用意图表征模型,解决异构或多类意图输入问题,借助知识图谱的特点准确完备的表示用户意图,基于知识推理算法挖掘用户潜在意图,优化意图表征。
Description
技术领域
本发明属于计算机技术领域,尤其涉及一种基于知识图谱的意图表征系统及方法。
背景技术
目前,随着软件定义网络、人工智能等技术的蓬勃发展,针对传统网络的局限性,为了实现“服务随心所想、网络随需而变、资源随愿共享”的愿景,意图驱动的网络应运而生。意图驱动网络是一种集应用意图深度挖掘能力、网络状态全局感知能力、网络配置实时优化能力为一身的,可编程可定制的自动化网络。意图是系统状态的声明性描述。它从需求的角度抽象出网络的对象和能力,并可以转化为高级策略。在意图驱动网络中,可以根据运营商的意图自动转译、验证、部署、配置和优化,实现目标网络状态。同时,依托网络全息感知和反馈优化闭环实现自动解决异常事件,保证网络的可靠性。
意图表征是实现意图驱动网络的关键技术之一,为后续的意图转译、策略映射奠定基础。意图表征方法旨在以标准统一的形式表征由用户输入的异构或多类意图,使系统具备对网络资源、运维业务、操作行为的描述能力,为意图转译的准确率和有效性提供前提保障,从而提高系统可移植性与通用性。
知识图谱是一种基于图的数据结构,由节点和边组成,节点表示一个“实体”,边表示实体与实体之间的“关系”。知识图谱用于表达更加规范的高质量数据。一方面,知识图谱采用更加规范而标准的概念模型、语法格式来建模和描述数据;另一方面,知识图谱通过语义链接增强数据之间的关联。知识图谱方法论涉及知识表示与推理、信息抽取、自然语言处理、数据挖掘与机器学习等多种技术,一般的构建流程为:首先确定知识表示模型,然后获取数据并对数据进行预处理,接着对处理后的数据进行实体抽取和关系抽取,最后对抽取到的知识进行知识融合、质量控制等操作形成知识图谱。
随着意图驱动网络的发展,在网络业务中,意图数据类别多样、结构不同的问题日益突出,需要设计标准范式的通用意图表征模型和意图语言规范,来解决异构或多类意图规范化表征的问题。
现有技术一设计了一套类似于自然语言的语法规则。该语法规则主要包括{Nouns,Actions,ConnectionPoints,Selector,Constraint}。其中,Nouns是指网络中处于用户网络边缘的网络连接点;Actions表示一个或多个出口Nouns之间的连接请求;ConnectionPoints是指一个或多个与协调器相关的网络端点;Selector通过指定Action所引用的流量来区分应用程序在ConnectionPoint上的流量;Constraint表示应用程序对请求的连接性的最低要求。
现有技术二以语言学中使用的verb-object-subject的句子结构为基础,并以修饰语作为附加的一组词加以补充。使用这些句子表达的基本意图然后使用递归封装来构成完整意图,组成意图的基本元素使用<verb、object、modifiers、subject>元组表示。其中verb是基于本体描述意图的操作;object标识作为verb目标的服务、流程或项;modifiers用于专门化或参数化,表示优先级的选择;subject是要链接到对象的另一个服务/流程/项的标识符。
所述现有技术虽然在意图表征方面提出一些解决方法,但它们存在共性的问题是,难以全面的提取出用户意图信息,而且只能在所设计的模型中发挥作用,提出的意图表征方法不具备通用性且可迁移性较差,难以弥合因意图形式多样所造成预期行为和网络配置之间的差距。因此,亟需一种新的意图表征系统、方法,以弥补现有技术存在的缺陷。
通过上述分析,现有技术存在的问题及缺陷为:现有意图表征方法难以全面的提取出用户意图信息,而且只能在所设计的模型中发挥作用,提出的意图表征方法不具备通用性且可迁移性较差,难以弥合因意图形式多样所造成预期行为和网络配置之间的差距。
解决以上问题及缺陷的难度为:在网络信息体系中,信息获取手段逐渐丰富、人机交互形式渐趋多样、业务应用意图日益繁杂,针对复杂的网络管理亟需一种通用的意图表征模型,来弥合原始输入意图与网络意图之间正确适配的鸿沟。此外,如何保障原始输入意图能够完备的转化为网络意图,也一直是需要解决的难点问题。
解决以上问题及缺陷的意义为:意图表征是实现意图驱动网络的第一步,为后续的意图转译、策略映射奠定基础。针对意图数据类别多样、结构不同的问题,基于知识图谱的意图表征方法以标准统一的形式表征由用户输入的异构或多类意图,使系统具备对网络资源、运维业务、操作行为的描述能力,为意图转译的准确率和有效性提供前提保障,从而提高系统可移植性与通用性。同时,也为实现由用户意图到网络意图再到网络策略的智能自主转译,逐步实现网络的自规划、自适应、自管理、资源按需调度打下坚实的基础。
发明内容
针对现有技术存在的问题,本发明提供了一种基于知识图谱的意图表征系统及方法,尤其涉及一种基于知识图谱的基于知识图谱的意图表征系统及方法。
本发明是这样实现的,一种基于知识图谱的意图表征方法,所述基于知识图谱的意图表征方法包括以下步骤:
步骤一,用户通过前端页面或系统提供的接口输入意图,并将意图信息发送至后端进行数据预处理;支持不同类别、不同结构的意图的输入
步骤二,提取意图关键信息,构建意图知识图谱,以结构化形式刻画意图;基于知识图谱,采用更加规范而标准的概念模型、语法格式来建模和描述数据,表达更加规范的高质量数据,为后续的意图规范模块做基础。
步骤三,基于设计的意图语法规则以规范意图知识图谱,基于参数映射模块以输出含有网络参数的意图知识图谱。为意图转译的准确率和有效性提供前提保障,从而提高系统可移植性与通用性。
进一步,步骤一中,所述前端页面包括输入示例和输入意图文本框,用户根据示例在文本框中输入意图,用户输入的意图文本以HTTP请求的形式发送至系统后端,同时为用户提供其他形式意图输入的接口;其中,所述其他形式意图输入的接口包括通过语音助手输入意图。
进一步,所述基于知识图谱的意图表征方法,还包括:
通过命名实体识别技术识别意图实体信息,通过关系抽取模型抽取意图实体对之间的关系,形成以CSV格式保存的“实体-关系-实体”三元组数据,并形成初始的意图知识图谱。
进一步,所述基于知识图谱的意图表征方法,还包括:
基于设计的扩展巴科斯范式EBNF意图语法规则,对意图知识图谱中实体、关系的名称进行规范化处理。
进一步,所述基于知识图谱的意图表征方法,还包括:
基于参数映射模块,对规范化处理后的意图知识图谱进行解析,根据解析出的实体、关系等关键信息,在存储有网络状态信息的关系型数据库中查询与这些关键信息对应的网络参数信息,网络参数信息以属性的形式添加到意图知识图谱中。
本发明的另一目的在于提供一种应用所述的基于知识图谱的意图表征方法的意图表征系统,所述意图表征系统包括:
意图输入模块,面向用户,用于实现异构或多类意图通过前端页面输入或通过系统预留的接口输入,并将用户意图信息发送至数据预处理模块;
数据预处理模块,用于针对非结构化的文本数据,对输入的原始意图信息进行数据清洗及整合,确保数据质量;
知识抽取模块,用于利用命名实体识别相关的算法模型和关系抽取相关的算法模型对预处理后的意图信息进行实体识别和关系抽取,最终形成“实体-关系-实体”三元组数据,构造一个简单的表征用户意图的意图知识图谱;
意图规范模块,用于对构造的意图知识图谱进行规范化处理,基于设计的意图语法规则,对意图知识图谱中实体、关系的名称进行规范化处理;
参数映射模块,用于为规范化处理后的意图知识图谱添加详细的网络参数,以使系统能够完备准确的表征用户意图;
意图挖掘模块,用于对意图知识图谱进行推理计算,以丰富知识图谱信息,增强知识图谱对用户意图的表征能力;
图数据库,用于储存意图知识图谱;
关系型数据库,用于储存网络参数信息。
本发明的另一目的在于提供一种计算机设备,所述计算机设备包括存储器和处理器,所述存储器存储有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行如下步骤:
用户通过前端页面或系统提供的接口输入意图,并将意图信息发送至后端进行数据预处理;提取意图关键信息,构建意图知识图谱,以结构化形式刻画意图;基于设计的意图语法规则以规范意图知识图谱,基于参数映射模块以输出含有网络参数的意图知识图谱。
本发明的另一目的在于提供一种计算机可读存储介质,存储有计算机程序,所述计算机程序被处理器执行时,使得所述处理器执行如下步骤:
用户通过前端页面或系统提供的接口输入意图,并将意图信息发送至后端进行数据预处理;提取意图关键信息,构建意图知识图谱,以结构化形式刻画意图;基于设计的意图语法规则以规范意图知识图谱,基于参数映射模块以输出含有网络参数的意图知识图谱。
本发明的另一目的在于提供一种信息数据处理终端,所述信息数据处理终端用于实现所述的意图表征系统。
结合上述的所有技术方案,本发明所具备的优点及积极效果为:本发明提供的意图表征系统,利用知识图谱具有多源信息融合、语义关系丰富、知识可推理的特点,提出基于知识图谱刻画用户意图的方法,实现异构或多类意图的结构化表征。同时,本发明通过设计基于EBNF的意图语法规则,以标准范式的意图语言规范解决信息有歧义、用词不标准等问题,将结构化表征的意图规范化,由此形成一种通用意图表征模型,既可以解决异构或多类意图输入的问题,又可以借助知识图谱的特点准确完备的表示用户意图,同时还可以基于知识推理算法挖掘用户潜在意图,进一步优化意图表征。
本发明中,用户通过前端页面输入意图,基于构建知识图谱的相关技术,对输入意图进行实体识别和关系抽取,提取出意图关键信息,并以知识图谱的形式刻画用户意图;基于设计的意图语法规则以规范意图知识图谱,进而利用参数映射模块以输出含有网络参数的意图知识图谱,保障意图的准确表征,同时为后续的意图转译奠定基础。本发明不关注底层网络细节,面向普通用户,旨在为用户提供一种通用意图表征模型,实现异构或多类意图的规范化表征。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对本发明实施例中所需要使用的附图做简单的介绍,显而易见地,下面所描述的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下还可以根据这些附图获得其他的附图。
图1是本发明实施例提供的基于知识图谱的意图表征方法流程图。
图2是本发明实施例提供的意图表征系统结构框图;
图中:1、意图输入模块;2、数据预处理模块;3、知识抽取模块;4、意图规范模块;5、参数映射模块;6、意图挖掘模块;7、图数据库;8、关系型数据库。
图3是本发明实施例提供的信息通信网络的意图表征系统的框架示意图。
图4是本发明实施例提供的在经过知识抽取模块处理后由三元组数据形成的意图知识图谱示意图。
图5是本发明实施例提供的在经过意图挖掘模块处理后形成的意图知识图谱示意图。
图6是本发明实施例提供的在经过网络参数映射模块处理后形成的意图知识图谱示意图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
针对现有技术存在的问题,本发明提供了一种基于知识图谱的意图表征系统及方法,下面结合附图对本发明作详细的描述。
如图1所示,本发明实施例提供的基于知识图谱的意图表征方法包括以下步骤:
S101,用户通过前端页面或系统提供的接口输入意图,并将意图信息发送至后端进行数据预处理;
S102,提取意图关键信息,构建意图知识图谱,以结构化形式刻画意图;
S103,基于设计的意图语法规则以规范意图知识图谱,基于有限状态机以输出含有网络参数的意图知识图谱。
本发明提供的信息通信网络的基于知识图谱的意图表征方法业内的普通技术人员还可以采用其他的步骤实施,图1的本发明提供的信息通信网络的基于知识图谱的意图表征方法仅仅是一个具体实施例而已。
如图2所示,本发明实施例提供的意图表征系统包括:
意图输入模块1,面向用户,用于实现异构或多类意图通过前端页面输入或通过系统预留的接口输入,并将用户意图信息发送至数据预处理模块;
数据预处理模块2,用于针对非结构化的文本数据,对输入的原始意图信息进行数据清洗及整合,确保数据质量;
知识抽取模块3,用于利用命名实体识别相关的算法模型和关系抽取相关的算法模型对预处理后的意图信息进行实体识别和关系抽取,最终形成“实体-关系-实体”三元组数据,构造一个简单的表征用户意图的意图知识图谱;
意图规范模块4,用于对构造的意图知识图谱进行规范化处理,基于设计的意图语法规则,对意图知识图谱中实体、关系的名称进行规范化处理,以便系统能够更准确的解析用户意图;
参数映射模块5,用于对规范化处理后的意图知识图谱添加详细的网络参数,以使系统能够完备准确的表征用户意图;
意图挖掘模块6,用于对意图知识图谱进行推理计算,以丰富知识图谱信息,增强知识图谱对用户意图的表征能力;
图数据库7,用于储存意图知识图谱;
关系型数据库8,用于储存网络参数信息。
下面结合具体实施例对本发明的技术方案作进一步描述。
实施例1
本发明是这样实现的,一种意图驱动网络的基于知识图谱的意图表征方法包括:
用户通过前端页面或系统提供的接口输入意图,系统将意图信息发送至后端进行数据预处理;
基于命名实体识别技术识别输入意图中的实体信息,基于关系抽取技术,抽取输入意图中实体之间的关系信息,之后形成“实体-关系-实体”三元组数据,构造意图知识图谱;
基于设计的扩展巴科斯范式(EBNF)意图语法规则,对构造的意图知识图谱进行规范化处理;
基于参数映射模块,对规范化处理后的意图知识图谱进行解析,对意图知识图谱中的实体、关系进行网络参数映射;
最后,形成具有详细网络参数的意图知识图谱,另外,系统能够在所构造的意图知识图谱基础上进行知识推理计算,推理出隐含信息。最终形成的意图知识图谱具有完备表征意图、挖掘潜在意图的能力。
进一步,前端页面包含输入示例和输入意图文本框,用户可根据示例在文本框中输入意图,用户输入的意图文本以HTTP请求的形式发送至系统后端。另外,系统为用户提供其他形式意图输入的接口,如通过语音助手输入意图。
进一步,经过数据预处理后的意图信息由事先训练好的命名实体识别模型进行实体识别,准确提取意图实体信息;经过数据预处理后的意图信息由事先训练好的关系抽取模型进行关系抽取,结合提取的实体信息,形成“实体-关系-实体”三元组数据,三元组数据以CSV格式导入图数据库,即构造的意图知识图谱信息最终保存在图数据库中以便系统查询、调用。
进一步,在EBNF的基础上,设计意图语法规则,对构造的意图知识图谱中实体、关系的名称进行规范化处理,解决因用户输入的意图信息有歧义、用词不标准而导致系统无法对实体、关系进行网络参数映射的问题。
进一步,基于参数映射模块,并对基于知识图谱存储的结构化意图进行识别和解析,为意图知识图谱中的实体、关系添加网络参数。
本发明提出一种新的基于知识图谱的意图表征方法及系统,利用知识图谱具有多源信息融合、语义关系丰富、知识可推理的特点,提出基于知识图谱刻画用户意图的方法,实现异构或多类意图的结构化表征。同时,设计基于EBNF的意图语法规则,以标准范式的意图语言规范解决信息有歧义、用词不标准等问题,将结构化表征的意图规范化。由此形成一种通用意图表征模型,既可以解决异构或多类意图输入的问题,又可以借助知识图谱的特点准确完备的表示用户意图,同时还可以基于知识推理算法挖掘用户潜在意图,进一步优化意图表征。
实施例2
如图4所示,本发明实施例提供的信息通信网络的意图表征系统包括以下步骤:
步骤一,意图输入
用户可以通过前端页面在意图输入框输入自然语言形式表述的意图,例如,“会议在13:00开始,到15:00结束,需要从A到B建立一条重保等级话音业务的链路”“从A到B建立一条重保等级话音业务链路”类似输入实例还有很多,总之,不论是结构化的还是非结构化的数据亦或是不同类型的数据,用户都可以自由输入意图。另外,通过所设计的接口,系统允许用户输入语音形式的意图,语音助手将人机交互的语音信息转为文本信息再发送至系统后端。借助Django框架将前端输入的用户意图以HTTP请求的方式发送至系统后端,交由数据预处理模块处理。
步骤二,数据预处理
主要针对非结构化的文本数据,基于正则表达式将输入的原始意图信息中的特殊符号去掉,同时对数据进行整合,确保数据的质量。
步骤三,形成三元组数据
通过命名实体识别技术,提取自然语言描述的意图中的实体信息,通过关系抽取技术,抽取自然语言描述的意图中的关系信息,为实体对匹配对应的关系,形成“实体-关系-实体”三元组数据,并构造一个简单的意图知识图谱存储在图数据库中。基于所述的实例——“从A到B建立一条重保等级话音业务链路”,经过步骤三的处理后,形成如图4所示的意图知识图谱。
需要说明的是,图4是基于RDF的数据格式展示所述的意图知识图谱,但在本发明中存储知识图谱的数据格式不局限于RDF。
步骤四,规范意图知识图谱
基于设计的EBNF意图语法规则,对网络中涉及到的时间、源地址、目的地址、端点、时延、带宽、带宽限制、优先级等属性进行定义,对用户意图中的信息进行规范化处理。例如,对所有用户意图中跟“开始时间”有关的关键词,统一规范为“<Start-Time>”,基于EBNF表示为“<Start-Time>::=*start*<Qualifierl><Point-in-Time>”。同样的,对端点、源地址、目的地址、路由的规范定义有如下表示:
<Endpoint>::=<At_Where>|<Route-Where>
<Source>::=“from"<Location>
<Destination>::=“t0”<Location>
<Route-Where>::=(<Source><Destination><Path>)
经过规范化处理后的意图知识图谱同样存储在图数据库中。
步骤五,挖掘潜在意图
为挖掘用户的潜在意图信息,采用基于表示学习的推理模型对意图知识图谱进行推理计算,以丰富意图知识图谱信息,增强知识图谱对用户意图的表征能力,从而增强系统准确完备表征用户意图的能力。经过步骤五的处理后,形成如图5所示的意图知识图谱。
需要说明的是,图5是基于RDF的数据格式展示所述的意图知识图谱,但在本发明中存储知识图谱的数据格式不局限于RDF。
步骤六,为意图知识图谱添加网络参数
基于参数映射模块,并对基于知识图谱存储的结构化意图进行识别和解析,识别解析出的实体、关系信息通过词表匹配从储存网络参数信息的关系型数据库中获得相应的网络参数,并为规范化处理后的意图知识图谱添加此网络参数。最终形成如图6所示的意图知识图谱。
需要说明的是,图6是基于RDF的数据格式展示所述的意图知识图谱,但在本发明中存储知识图谱的数据格式不局限于RDF。
在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用全部或部分地以计算机程序产品的形式实现,所述计算机程序产品包括一个或多个计算机指令。在计算机上加载或执行所述计算机程序指令时,全部或部分地产生按照本发明实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(DSL)或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输)。所述计算机可读取存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质(例如软盘、硬盘、磁带)、光介质(例如DVD)、或者半导体介质(例如固态硬盘Solid StateDisk(SSD))等。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,都应涵盖在本发明的保护范围之内。
Claims (6)
1.一种基于知识图谱的意图表征方法,其特征在于,所述意图表征方法包括以下步骤:
步骤一,用户通过前端页面或系统提供的接口输入意图,并将意图信息发送至后端进行数据预处理;
步骤二,提取意图关键信息,构建意图知识图谱,以结构化形式刻画意图;
步骤三,基于设计的意图语法规则以规范意图知识图谱,基于参数映射模块以输出含有网络参数的意图知识图谱;
所述基于知识图谱的意图表征方法,还包括:
通过命名实体识别技术识别意图实体信息,通过关系抽取模型抽取意图实体对之间的关系,形成以CSV格式保存的“实体-关系-实体”三元组数据,形成一个初始的意图知识图谱;
所述基于知识图谱的意图表征方法,还包括:
基于设计的扩展巴科斯范式EBNF意图语法规则,对意图知识图谱中实体、关系的名称进行规范化处理;
所述基于知识图谱的意图表征方法,还包括:
基于参数映射模块,对规范化处理后的意图知识图谱进行解析,根据解析出的实体、关系等关键信息,在存储有网络状态信息的关系型数据库中查询与这些关键信息对应的网络参数信息,网络参数信息以属性的形式添加到意图知识图谱中。
2.如权利要求1所述的基于知识图谱的意图表征方法,其特征在于,步骤一中,所述前端页面包括输入示例和输入意图文本框,用户根据示例在文本框中输入意图,用户输入的意图文本以HTTP请求的形式发送至系统后端,同时为用户提供其他形式意图输入的接口;其中,所述其他形式意图输入的接口包括通过语音助手输入意图。
3.一种实施权利要求1~2任意一项所述的基于知识图谱的意图表征方法的意图表征系统,其特征在于,所述意图表征系统包括:
意图输入模块,面向用户,用于实现异构或多类意图通过前端页面输入或通过系统预留的接口输入,并将用户意图信息发送至数据预处理模块;
数据预处理模块,用于针对非结构化的文本数据,对输入的原始意图信息进行数据清洗及整合,确保数据质量;
知识抽取模块,用于利用命名实体识别相关的算法模型和关系抽取相关的算法模型对预处理后的意图信息进行实体识别和关系抽取,最终形成“实体-关系-实体”三元组数据,构造一个简单的表征用户意图的意图知识图谱;
意图规范模块,用于对构造的意图知识图谱进行规范化处理,基于设计的意图语法规则,对意图知识图谱中实体、关系的名称进行规范化处理;
参数映射模块,用于为规范化处理后的意图知识图谱添加详细的网络参数,以使系统能够完备准确的表征用户意图;
意图挖掘模块,用于对意图知识图谱进行推理计算,以丰富知识图谱信息,增强知识图谱对用户意图的表征能力;
图数据库,用于储存意图知识图谱;
关系型数据库,用于储存网络参数信息。
4.一种计算机设备,其特征在于,所述计算机设备包括存储器和处理器,所述存储器存储有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行权利要求1~2任意一项所述的基于知识图谱的意图表征方法。
5.一种计算机可读存储介质,存储有计算机程序,所述计算机程序被处理器执行时,使得所述处理器执行权利要求1~2任意一项所述的基于知识图谱的意图表征方法。
6.一种信息数据处理终端,其特征在于,所述信息数据处理终端用于实现如权利要求3所述的意图表征系统。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111236842.3A CN114138930B (zh) | 2021-10-23 | 2021-10-23 | 一种基于知识图谱的意图表征系统及方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111236842.3A CN114138930B (zh) | 2021-10-23 | 2021-10-23 | 一种基于知识图谱的意图表征系统及方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114138930A CN114138930A (zh) | 2022-03-04 |
CN114138930B true CN114138930B (zh) | 2024-02-02 |
Family
ID=80394800
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111236842.3A Active CN114138930B (zh) | 2021-10-23 | 2021-10-23 | 一种基于知识图谱的意图表征系统及方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114138930B (zh) |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112214611A (zh) * | 2020-09-24 | 2021-01-12 | 远光软件股份有限公司 | 一种企业知识图谱的构建系统和方法 |
WO2021073298A1 (zh) * | 2019-10-18 | 2021-04-22 | 珠海格力电器股份有限公司 | 一种语音信息的处理方法、装置、智能终端以及存储介质 |
-
2021
- 2021-10-23 CN CN202111236842.3A patent/CN114138930B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2021073298A1 (zh) * | 2019-10-18 | 2021-04-22 | 珠海格力电器股份有限公司 | 一种语音信息的处理方法、装置、智能终端以及存储介质 |
CN112214611A (zh) * | 2020-09-24 | 2021-01-12 | 远光软件股份有限公司 | 一种企业知识图谱的构建系统和方法 |
Non-Patent Citations (1)
Title |
---|
林崇 ; 张立军 ; 张美玉 ; .面向设计意图的STEP知识图谱关键技术研究.小型微型计算机系统.2020,(03),全文. * |
Also Published As
Publication number | Publication date |
---|---|
CN114138930A (zh) | 2022-03-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7170779B2 (ja) | 自動的な意図のマイニング、分類、及び配置のための方法及びシステム | |
US20220058343A1 (en) | Written-modality prosody subsystem in a natural language understanding (nlu) framework | |
US10725836B2 (en) | Intent-based organisation of APIs | |
JP6922538B2 (ja) | Api学習 | |
CN111737471B (zh) | 一种基于知识图谱的档案管理模型构建方法及系统 | |
WO2020001373A1 (zh) | 一种本体构建方法及装置 | |
KR20190067193A (ko) | 서비스 계층에 대한 액세스 제어 정책 동기화 | |
CN111581983A (zh) | 基于群体分析的网络舆论事件中社会关注热点的预测方法 | |
TW202020691A (zh) | 特徵詞的確定方法、裝置和伺服器 | |
WO2023045417A1 (zh) | 一种故障知识图谱构建方法及装置 | |
US20190156256A1 (en) | Generating risk assessment software | |
EP3333731A1 (en) | Method and system for creating an instance model | |
US11604626B1 (en) | Analyzing code according to natural language descriptions of coding practices | |
CN112287114A (zh) | 一种知识图谱服务处理方法和装置 | |
US11922209B2 (en) | Invoking functions of agents via digital assistant applications using address templates | |
Kamalabalan et al. | Tool support for traceability of software artefacts | |
CN110347401B (zh) | 一种基于语义相似度的API Framework服务发现方法 | |
CN114531334A (zh) | 意图处理方法、装置、电子设备和可读存储介质 | |
CN113326381A (zh) | 基于动态本体的语义和知识图谱分析方法、平台及设备 | |
CN113434123A (zh) | 一种业务处理方法、装置及电子设备 | |
CN117667973A (zh) | 数据查询方法、装置、电子设备及存储介质 | |
CN114138930B (zh) | 一种基于知识图谱的意图表征系统及方法 | |
KR20220074574A (ko) | 지식 그래프 기반 라이브스트림 실시간 채팅 내용 분석 방법 및 그 장치 | |
US20140280008A1 (en) | Axiomatic Approach for Entity Attribution in Unstructured Data | |
KR20210063875A (ko) | 마케팅 정보 분석 서비스 제공을 위한 프로그램 및 기록매체 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |