CN110008351A - 一种面向隐式冲突检测的结构化功能知识补全方法 - Google Patents

一种面向隐式冲突检测的结构化功能知识补全方法 Download PDF

Info

Publication number
CN110008351A
CN110008351A CN201910175561.8A CN201910175561A CN110008351A CN 110008351 A CN110008351 A CN 110008351A CN 201910175561 A CN201910175561 A CN 201910175561A CN 110008351 A CN110008351 A CN 110008351A
Authority
CN
China
Prior art keywords
word
implicit
attribute
attribute word
collision detection
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910175561.8A
Other languages
English (en)
Other versions
CN110008351B (zh
Inventor
朱朝晖
蔡铭
王乾宇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang University ZJU
Original Assignee
Zhejiang University ZJU
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang University ZJU filed Critical Zhejiang University ZJU
Priority to CN201910175561.8A priority Critical patent/CN110008351B/zh
Publication of CN110008351A publication Critical patent/CN110008351A/zh
Application granted granted Critical
Publication of CN110008351B publication Critical patent/CN110008351B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Machine Translation (AREA)

Abstract

本发明公开了一种面向隐式冲突检测的结构化功能知识补全方法。该方法首先根据给出的一组隐含属性词,获取在线词典中的释义;对每一个隐含属性词Ii∈I,通过词法解析器获取在线词典中释义句子的词性标签,所有的名词都作为Ii的候选属性词Ci;将候选属性词中的所有单词cij∈Ci分为两类,一类为隐含属性词的属性,另一类为非属性词,利用WordNet中的词间关系通过迭代分类算法得到准确的分类结果,最终补全结构化功能知识中缺失的属性。本发明抽取的结构化功能知识可以用于智能家居系统中的隐式冲突判断,不但提高了隐式冲突检测系统的自动化程度,而且使检测准确度大大提升。

Description

一种面向隐式冲突检测的结构化功能知识补全方法
技术领域
本发明涉及一种从半结构化的知识图谱数据中抽取结构化数据的补全方法,尤其涉及一种面向隐式冲突检测的结构化功能知识补全方法。
背景技术
如今的智能家居已经发展成支持多设备之间互联、互通的集成系统。但与此同时,也极易出现设备之间的竞争、干扰和矛盾等控制冲突现象,因此有必要开展对设备控制冲突检测技术的研究。当前,在智能家居冲突检测领域,冲突检测多针对多条规则以不同方式作用于同一作动器时发生的显式冲突。例如,当一条作动器规则要求开灯而同时另一条规则要求关灯,这会引起明显的冲突。但当多个作动器的两条或多条规则同时针对共享环境属性具有相反影响或影响相关物理变量时产生的隐式冲突,例如一条作动器规则命令要求打开窗户,而另一条规则要求开启空调,这会产生对温度影响的隐式冲突。现有方法通过人工引入设备知识来进行隐式冲突检测,这不但耗费人力且极易发生遗漏。为了自动地进行隐式冲突检测,需要从知识图谱中抽取结构化的设备功能知识进行隐式冲突检测,但知识图谱中设备的功能描述大量缺少属性词(比如“A bulb is used for illuminating anarea”,其中“illuminating an area”是VP结构的功能描述,功能描述中并未包含类似“light”的属性词,但通过动词illuminate可以推断隐含的属性是light,我们将这样的动词称为“隐含属性词”),因此抽取出的结构化功能知识也大量缺少属性词。
发明内容
本发明的目的在于针对从知识图谱中抽取的结构化功能知识大量缺少属性词的问题,提供一种基于迭代分类算法的补全方法。
本发明的目的是通过以下技术方案来实现的:一种面向隐式冲突检测的结构化功能知识补全方法,该方法包括以下步骤:
(1)根据给出的一组“隐含属性词”,记为I={I1,I2,…,Ir},这里的“隐含属性词”为动词或形容词,然后从在线词典中获取其释义。
(2)对每一个“隐含属性词”Ii∈I,通过词法解析器获取在线词典中释义句子的词性标签,所有的名词都作为Ii的候选属性词Ci
(3)将候选属性词中的所有单词cij∈Ci分为两类,一类为“隐含属性词”的“属性”,另一类为“非属性词”,这一步将利用WordNet中的词间关系通过“迭代分类算法”得到准确的分类结果,最终用获得的结果补全缺失属性。
进一步地,所述步骤(1)具体为:从5种在线词典获取“隐式属性词”的解释数据。
进一步地,所述步骤(2)具体为:利用词性标注工具得到解释中的名词,这些名词作为“隐式属性词”对应的“候选属性词”,与“隐式属性词”组成词对。
进一步地,所述步骤(3)中的迭代分类算法具体为:算法样本由“隐含属性词”Ii和它的一个候选属性词cij组成的词对i,cij)。用图来表示所有数据,图的节点由“隐含属性词”和属性组成的词对构成V(Iiij)|cij∈Ci,Ii∈I},定义邻接函数V中的每一个节点(Ii,cij)都用一个向量Xij表示,该向量由多个特征f1,f2…f1构成,同时每个节点都有对应的标签yij∈{0,1,标签为1表示词对中的属性词是“隐式属性词”对应的属性,0则不是。节点集合U是未被标记的节点,算法预测所有未被标记的节点uij∈U。算法的训练过程与普通的监督学习算法一致,关键步骤在于分类或者说测试部分。测试时,在初始化部分通过训练学习到的分类器h给所有没有标签的测试数据uij∈U打上标签。初始化完成后,分类器迭代地运行直到所有的分类标签不变。
本发明的有益效果是:本发明运用迭代分类算法补全了从知识图谱中抽取的智能家居设备的结构化功能知识。抽取的结构化功能知识可以用于智能家居系统中的隐式冲突判断,不但提高了隐式冲突检测系统的自动化程度,而且使检测准确度大大提升。
附图说明
图1是本发明的使用“迭代分类算法”时的词间关系示意图。
具体实施方式
本发明面向隐式冲突检测的结构化功能知识补全方法,包括如下步骤:
1、根据给出的一组“隐含属性词”(动词,也包含部分形容词),记为I={I1,I2,…,Ir},获取在线词典中的释义。
2、对每一个“隐含属性词”Ii∈I,通过词法解析器获取在线词典中释义句子的词性(POS)标签,所有的名词都作为Ii的候选属性词Ci
3、将候选属性词中的所有单词cij∈Ci分为两类,一类为“隐含属性词”的“属性”,另一类为“非属性词”,这一步将利用WordNet中的词间关系通过“迭代分类算法”得到准确的分类结果,最终用获得的结果补全缺失属性。
以下通过实施例对本发明做进一步解释。
1、从5个在线词典(The Free Dictionary、Your Dictionary、The Free Merriam-Webster Dictionary、Dictionary.com、Longman Dictionary of Contemporary English)获取“隐式属性词”:cool、hot和warm的解释数据。
2、利用词性标注工具(如Stanford CoreNLP)得到解释中的名词,这些名词作为“隐式属性词”对应的“候选属性词”,与“隐式属性词”组成词对,其中有(cold,coldness)、(hot,hotness)、(warm,heat)和(warm,temperature)等。
3、算法样本由“隐式属性词”Ii和它的一个候选属性词cij组成的词对,如(Ii,cij)。用图来表示所有数据,图的节点由“隐含属性词”和属性组成的词对构成V={(Iiij)|cij∈Ci,Ii∈I},定义邻接函数V中的每一个节点(Ii,cij)都用一个向量Xij表示,该向量由多个特征f1,f2…f1构成,同时每个节点都有对应的标签yij∈{0,1|,标签为1表示词对中的属性词是“隐式属性词”对应的属性,0则不是。节点集合U是未被标记的节点,算法预测所有未被标记的节点uij∈U。算法的训练过程与普通的监督学习算法一致,关键步骤在于分类或者说测试部分。测试时,在初始化部分通过训练学习到的分类器h给所有没有标签的测试数据uij∈U打上标签。初始化完成后,分类器迭代地运行直到所有的分类标签不变。(需要迭代运行是因为节点的特征Xij依赖于相邻节点的标签类型,而每一轮迭代之后节点的标签又可能发生变化。)图1是依据词间关系画出的一张示意图,也是“迭代分类算法”步骤的演示图。其中椭圆形表示由“隐式属性词”和属性词组成的一组词对,是图中的一个节点,也是分类器h分类时的一个实例。同一虚线框中的词对拥有相同的“隐式属性词”I,虚线框之间的连线表示两个“隐式属性词”存在关系,椭圆形词对之间的连线表示属性词C之间存在关系。浅色的连线代表两端的词是同义词,深色连线代表它们是反义词。其中有的椭圆形表示的词对带有标签,有的椭圆形表示的词对还未被预测标签。图中,“隐式属性词”Ij(hot)和Ik(warm)互为同义词,带有标签的属性词ck2(temperature)和还未被预测的属性词cj2(heat)是同义词,还有Ij的候选属性词cj1(coldness)和cj2(heat)是反义词关系。算法在之前的步骤中已经给词对(Ij,cj1)预测了标签,cj2又与cj1和ck2有相互关系,因此在本轮迭代中,词对(Ij,cj2)的预测标签将受到(Ij,cj1)和(Ik,ck2)的标签的影响。

Claims (4)

1.一种面向隐式冲突检测的结构化功能知识补全方法,其特征在于,该方法包括以下步骤:
(1)根据给出的一组“隐含属性词”,记为I={I1,I2,...,Ir},这里的“隐含属性词”为动词或形容词,然后从在线词典中获取其释义。
(2)对每一个“隐含属性词”Ii∈I,通过词法解析器获取在线词典中释义句子的词性标签,所有的名词都作为Ii的候选属性词Ci
(3)将候选属性词中的所有单词cij∈Ci分为两类,一类为“隐含属性词”的“属性”,另一类为“非属性词”,这一步将利用WordNet中的词间关系通过“迭代分类算法”得到准确的分类结果,最终用获得的结果补全缺失属性。
2.根据权利要求1所述的面向隐式冲突检测的结构化功能知识补全方法,其特征是,所述步骤(1)具体为:从5种在线词典获取“隐式属性词”的解释数据。
3.根据权利要求1所述的面向隐式冲突检测的结构化功能知识补全方法,其特征是,所述步骤(2)具体为:利用词性标注工具得到解释中的名词,这些名词作为“隐式属性词”对应的“候选属性词”,与“隐式属性词”组成词对。
4.根据权利要求1所述的面向隐式冲突检测的结构化功能知识补全方法,其特征是,所述步骤(3)中的迭代分类算法具体为:算法样本由“隐含属性词”Ii和它的一个候选属性词cij组成的词对(Ii,cij)。用图来表示所有数据,图的节点由“隐含属性词”和属性组成的词对构成V={(Ii,cij)|cij∈Ci,Ii∈I},定义邻接函数V中的每一个节点(Ii,cij)都用一个向量Xij表示,该向量由多个特征f1,f2...f1构成,同时每个节点都有对应的标签yij∈{0,1},标签为1表示词对中的属性词是“隐式属性词”对应的属性,0则不是。节点集合U是未被标记的节点,算法预测所有未被标记的节点uij∈U。算法的训练过程与普通的监督学习算法一致,关键步骤在于分类或者说测试部分。测试时,在初始化部分通过训练学习到的分类器h给所有没有标签的测试数据uij∈U打上标签。初始化完成后,分类器迭代地运行直到所有的分类标签不变。
CN201910175561.8A 2019-03-08 2019-03-08 一种面向隐式冲突检测的结构化功能知识补全方法 Expired - Fee Related CN110008351B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910175561.8A CN110008351B (zh) 2019-03-08 2019-03-08 一种面向隐式冲突检测的结构化功能知识补全方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910175561.8A CN110008351B (zh) 2019-03-08 2019-03-08 一种面向隐式冲突检测的结构化功能知识补全方法

Publications (2)

Publication Number Publication Date
CN110008351A true CN110008351A (zh) 2019-07-12
CN110008351B CN110008351B (zh) 2021-05-18

Family

ID=67166631

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910175561.8A Expired - Fee Related CN110008351B (zh) 2019-03-08 2019-03-08 一种面向隐式冲突检测的结构化功能知识补全方法

Country Status (1)

Country Link
CN (1) CN110008351B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110398947A (zh) * 2019-08-23 2019-11-01 珠海格力电器股份有限公司 智能家居设备的控制方法及装置
CN110597075A (zh) * 2019-09-09 2019-12-20 珠海格力电器股份有限公司 一种检测控制冲突的方法、装置、电子设备及存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104573009A (zh) * 2015-01-08 2015-04-29 南通大学 一种领域知识库属性扩展的方法
CN106777274A (zh) * 2016-06-16 2017-05-31 北京理工大学 一种中文旅游领域知识图谱构建方法及系统
CN106919689A (zh) * 2017-03-03 2017-07-04 中国科学技术信息研究所 基于术语释义知识单元的专业领域知识图谱动态构建方法
US20180053096A1 (en) * 2016-08-22 2018-02-22 International Business Machines Corporation Linkage Prediction Through Similarity Analysis
CN108304933A (zh) * 2018-01-29 2018-07-20 北京师范大学 一种知识库的补全方法及补全装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104573009A (zh) * 2015-01-08 2015-04-29 南通大学 一种领域知识库属性扩展的方法
CN106777274A (zh) * 2016-06-16 2017-05-31 北京理工大学 一种中文旅游领域知识图谱构建方法及系统
US20180053096A1 (en) * 2016-08-22 2018-02-22 International Business Machines Corporation Linkage Prediction Through Similarity Analysis
CN106919689A (zh) * 2017-03-03 2017-07-04 中国科学技术信息研究所 基于术语释义知识单元的专业领域知识图谱动态构建方法
CN108304933A (zh) * 2018-01-29 2018-07-20 北京师范大学 一种知识库的补全方法及补全装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110398947A (zh) * 2019-08-23 2019-11-01 珠海格力电器股份有限公司 智能家居设备的控制方法及装置
CN110597075A (zh) * 2019-09-09 2019-12-20 珠海格力电器股份有限公司 一种检测控制冲突的方法、装置、电子设备及存储介质

Also Published As

Publication number Publication date
CN110008351B (zh) 2021-05-18

Similar Documents

Publication Publication Date Title
CN107992597B (zh) 一种面向电网故障案例的文本结构化方法
White et al. Inference is everything: Recasting semantic resources into a unified evaluation framework
US8244730B2 (en) Learning syntactic patterns for automatic discovery of causal relations from text
Brants TnT-a statistical part-of-speech tagger
CN104794169B (zh) 一种基于序列标注模型的学科术语抽取方法及系统
CN109726745B (zh) 一种融入描述知识的基于目标的情感分类方法
Singh et al. A decision tree based word sense disambiguation system in Manipuri language
KR101508070B1 (ko) 어휘지도를 이용한 용언의 다의어 의미 분석 방법
CN111666766A (zh) 数据处理方法、装置和设备
CN111177402A (zh) 基于分词处理的评价方法、装置、计算机设备及存储介质
CN113157859A (zh) 一种基于上位概念信息的事件检测方法
CN112182145A (zh) 文本相似度确定方法、装置、设备和存储介质
CN110008351A (zh) 一种面向隐式冲突检测的结构化功能知识补全方法
Sadr et al. Presentation of an efficient automatic short answer grading model based on combination of pseudo relevance feedback and semantic relatedness measures
Marín Pérez Measuring the degree of specialisation of sub-technical legal terms through corpus comparison.
Atoum et al. A comprehensive comparative study of word and sentence similarity measures
Olaleye et al. Attention-based keyword localisation in speech using visual grounding
De Melo et al. UWN: A large multilingual lexical knowledge base
CN112862569B (zh) 基于图像和文本多模态数据的产品外观风格评价方法和系统
CN111191029B (zh) 基于监督学习和文本分类的ac构建方法
Jayasuriya et al. Learning a stochastic part of speech tagger for sinhala
Ahmad et al. Machine and Deep Learning Methods with Manual and Automatic Labelling for News Classification in Bangla Language
Shah et al. Legal clause extraction from contract using machine learning with heuristics improvement
CN110705306A (zh) 一种作文文题一致性的测评方法
CN113468890B (zh) 基于nlp信息萃取与词性规则的沉积学文献挖掘方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20210518

CF01 Termination of patent right due to non-payment of annual fee