CN110008351A - 一种面向隐式冲突检测的结构化功能知识补全方法 - Google Patents
一种面向隐式冲突检测的结构化功能知识补全方法 Download PDFInfo
- Publication number
- CN110008351A CN110008351A CN201910175561.8A CN201910175561A CN110008351A CN 110008351 A CN110008351 A CN 110008351A CN 201910175561 A CN201910175561 A CN 201910175561A CN 110008351 A CN110008351 A CN 110008351A
- Authority
- CN
- China
- Prior art keywords
- word
- implicit
- attribute
- attribute word
- collision detection
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Machine Translation (AREA)
Abstract
本发明公开了一种面向隐式冲突检测的结构化功能知识补全方法。该方法首先根据给出的一组隐含属性词,获取在线词典中的释义;对每一个隐含属性词Ii∈I,通过词法解析器获取在线词典中释义句子的词性标签,所有的名词都作为Ii的候选属性词Ci;将候选属性词中的所有单词cij∈Ci分为两类,一类为隐含属性词的属性,另一类为非属性词,利用WordNet中的词间关系通过迭代分类算法得到准确的分类结果,最终补全结构化功能知识中缺失的属性。本发明抽取的结构化功能知识可以用于智能家居系统中的隐式冲突判断,不但提高了隐式冲突检测系统的自动化程度,而且使检测准确度大大提升。
Description
技术领域
本发明涉及一种从半结构化的知识图谱数据中抽取结构化数据的补全方法,尤其涉及一种面向隐式冲突检测的结构化功能知识补全方法。
背景技术
如今的智能家居已经发展成支持多设备之间互联、互通的集成系统。但与此同时,也极易出现设备之间的竞争、干扰和矛盾等控制冲突现象,因此有必要开展对设备控制冲突检测技术的研究。当前,在智能家居冲突检测领域,冲突检测多针对多条规则以不同方式作用于同一作动器时发生的显式冲突。例如,当一条作动器规则要求开灯而同时另一条规则要求关灯,这会引起明显的冲突。但当多个作动器的两条或多条规则同时针对共享环境属性具有相反影响或影响相关物理变量时产生的隐式冲突,例如一条作动器规则命令要求打开窗户,而另一条规则要求开启空调,这会产生对温度影响的隐式冲突。现有方法通过人工引入设备知识来进行隐式冲突检测,这不但耗费人力且极易发生遗漏。为了自动地进行隐式冲突检测,需要从知识图谱中抽取结构化的设备功能知识进行隐式冲突检测,但知识图谱中设备的功能描述大量缺少属性词(比如“A bulb is used for illuminating anarea”,其中“illuminating an area”是VP结构的功能描述,功能描述中并未包含类似“light”的属性词,但通过动词illuminate可以推断隐含的属性是light,我们将这样的动词称为“隐含属性词”),因此抽取出的结构化功能知识也大量缺少属性词。
发明内容
本发明的目的在于针对从知识图谱中抽取的结构化功能知识大量缺少属性词的问题,提供一种基于迭代分类算法的补全方法。
本发明的目的是通过以下技术方案来实现的:一种面向隐式冲突检测的结构化功能知识补全方法,该方法包括以下步骤:
(1)根据给出的一组“隐含属性词”,记为I={I1,I2,…,Ir},这里的“隐含属性词”为动词或形容词,然后从在线词典中获取其释义。
(2)对每一个“隐含属性词”Ii∈I,通过词法解析器获取在线词典中释义句子的词性标签,所有的名词都作为Ii的候选属性词Ci。
(3)将候选属性词中的所有单词cij∈Ci分为两类,一类为“隐含属性词”的“属性”,另一类为“非属性词”,这一步将利用WordNet中的词间关系通过“迭代分类算法”得到准确的分类结果,最终用获得的结果补全缺失属性。
进一步地,所述步骤(1)具体为:从5种在线词典获取“隐式属性词”的解释数据。
进一步地,所述步骤(2)具体为:利用词性标注工具得到解释中的名词,这些名词作为“隐式属性词”对应的“候选属性词”,与“隐式属性词”组成词对。
进一步地,所述步骤(3)中的迭代分类算法具体为:算法样本由“隐含属性词”Ii和它的一个候选属性词cij组成的词对i,cij)。用图来表示所有数据,图的节点由“隐含属性词”和属性组成的词对构成V(Ii,ij)|cij∈Ci,Ii∈I},定义邻接函数V中的每一个节点(Ii,cij)都用一个向量Xij表示,该向量由多个特征f1,f2…f1构成,同时每个节点都有对应的标签yij∈{0,1,标签为1表示词对中的属性词是“隐式属性词”对应的属性,0则不是。节点集合U是未被标记的节点,算法预测所有未被标记的节点uij∈U。算法的训练过程与普通的监督学习算法一致,关键步骤在于分类或者说测试部分。测试时,在初始化部分通过训练学习到的分类器h给所有没有标签的测试数据uij∈U打上标签。初始化完成后,分类器迭代地运行直到所有的分类标签不变。
本发明的有益效果是:本发明运用迭代分类算法补全了从知识图谱中抽取的智能家居设备的结构化功能知识。抽取的结构化功能知识可以用于智能家居系统中的隐式冲突判断,不但提高了隐式冲突检测系统的自动化程度,而且使检测准确度大大提升。
附图说明
图1是本发明的使用“迭代分类算法”时的词间关系示意图。
具体实施方式
本发明面向隐式冲突检测的结构化功能知识补全方法,包括如下步骤:
1、根据给出的一组“隐含属性词”(动词,也包含部分形容词),记为I={I1,I2,…,Ir},获取在线词典中的释义。
2、对每一个“隐含属性词”Ii∈I,通过词法解析器获取在线词典中释义句子的词性(POS)标签,所有的名词都作为Ii的候选属性词Ci。
3、将候选属性词中的所有单词cij∈Ci分为两类,一类为“隐含属性词”的“属性”,另一类为“非属性词”,这一步将利用WordNet中的词间关系通过“迭代分类算法”得到准确的分类结果,最终用获得的结果补全缺失属性。
以下通过实施例对本发明做进一步解释。
1、从5个在线词典(The Free Dictionary、Your Dictionary、The Free Merriam-Webster Dictionary、Dictionary.com、Longman Dictionary of Contemporary English)获取“隐式属性词”:cool、hot和warm的解释数据。
2、利用词性标注工具(如Stanford CoreNLP)得到解释中的名词,这些名词作为“隐式属性词”对应的“候选属性词”,与“隐式属性词”组成词对,其中有(cold,coldness)、(hot,hotness)、(warm,heat)和(warm,temperature)等。
3、算法样本由“隐式属性词”Ii和它的一个候选属性词cij组成的词对,如(Ii,cij)。用图来表示所有数据,图的节点由“隐含属性词”和属性组成的词对构成V={(Ii,ij)|cij∈Ci,Ii∈I},定义邻接函数V中的每一个节点(Ii,cij)都用一个向量Xij表示,该向量由多个特征f1,f2…f1构成,同时每个节点都有对应的标签yij∈{0,1|,标签为1表示词对中的属性词是“隐式属性词”对应的属性,0则不是。节点集合U是未被标记的节点,算法预测所有未被标记的节点uij∈U。算法的训练过程与普通的监督学习算法一致,关键步骤在于分类或者说测试部分。测试时,在初始化部分通过训练学习到的分类器h给所有没有标签的测试数据uij∈U打上标签。初始化完成后,分类器迭代地运行直到所有的分类标签不变。(需要迭代运行是因为节点的特征Xij依赖于相邻节点的标签类型,而每一轮迭代之后节点的标签又可能发生变化。)图1是依据词间关系画出的一张示意图,也是“迭代分类算法”步骤的演示图。其中椭圆形表示由“隐式属性词”和属性词组成的一组词对,是图中的一个节点,也是分类器h分类时的一个实例。同一虚线框中的词对拥有相同的“隐式属性词”I,虚线框之间的连线表示两个“隐式属性词”存在关系,椭圆形词对之间的连线表示属性词C之间存在关系。浅色的连线代表两端的词是同义词,深色连线代表它们是反义词。其中有的椭圆形表示的词对带有标签,有的椭圆形表示的词对还未被预测标签。图中,“隐式属性词”Ij(hot)和Ik(warm)互为同义词,带有标签的属性词ck2(temperature)和还未被预测的属性词cj2(heat)是同义词,还有Ij的候选属性词cj1(coldness)和cj2(heat)是反义词关系。算法在之前的步骤中已经给词对(Ij,cj1)预测了标签,cj2又与cj1和ck2有相互关系,因此在本轮迭代中,词对(Ij,cj2)的预测标签将受到(Ij,cj1)和(Ik,ck2)的标签的影响。
Claims (4)
1.一种面向隐式冲突检测的结构化功能知识补全方法,其特征在于,该方法包括以下步骤:
(1)根据给出的一组“隐含属性词”,记为I={I1,I2,...,Ir},这里的“隐含属性词”为动词或形容词,然后从在线词典中获取其释义。
(2)对每一个“隐含属性词”Ii∈I,通过词法解析器获取在线词典中释义句子的词性标签,所有的名词都作为Ii的候选属性词Ci。
(3)将候选属性词中的所有单词cij∈Ci分为两类,一类为“隐含属性词”的“属性”,另一类为“非属性词”,这一步将利用WordNet中的词间关系通过“迭代分类算法”得到准确的分类结果,最终用获得的结果补全缺失属性。
2.根据权利要求1所述的面向隐式冲突检测的结构化功能知识补全方法,其特征是,所述步骤(1)具体为:从5种在线词典获取“隐式属性词”的解释数据。
3.根据权利要求1所述的面向隐式冲突检测的结构化功能知识补全方法,其特征是,所述步骤(2)具体为:利用词性标注工具得到解释中的名词,这些名词作为“隐式属性词”对应的“候选属性词”,与“隐式属性词”组成词对。
4.根据权利要求1所述的面向隐式冲突检测的结构化功能知识补全方法,其特征是,所述步骤(3)中的迭代分类算法具体为:算法样本由“隐含属性词”Ii和它的一个候选属性词cij组成的词对(Ii,cij)。用图来表示所有数据,图的节点由“隐含属性词”和属性组成的词对构成V={(Ii,cij)|cij∈Ci,Ii∈I},定义邻接函数V中的每一个节点(Ii,cij)都用一个向量Xij表示,该向量由多个特征f1,f2...f1构成,同时每个节点都有对应的标签yij∈{0,1},标签为1表示词对中的属性词是“隐式属性词”对应的属性,0则不是。节点集合U是未被标记的节点,算法预测所有未被标记的节点uij∈U。算法的训练过程与普通的监督学习算法一致,关键步骤在于分类或者说测试部分。测试时,在初始化部分通过训练学习到的分类器h给所有没有标签的测试数据uij∈U打上标签。初始化完成后,分类器迭代地运行直到所有的分类标签不变。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910175561.8A CN110008351B (zh) | 2019-03-08 | 2019-03-08 | 一种面向隐式冲突检测的结构化功能知识补全方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910175561.8A CN110008351B (zh) | 2019-03-08 | 2019-03-08 | 一种面向隐式冲突检测的结构化功能知识补全方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110008351A true CN110008351A (zh) | 2019-07-12 |
CN110008351B CN110008351B (zh) | 2021-05-18 |
Family
ID=67166631
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910175561.8A Expired - Fee Related CN110008351B (zh) | 2019-03-08 | 2019-03-08 | 一种面向隐式冲突检测的结构化功能知识补全方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110008351B (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110398947A (zh) * | 2019-08-23 | 2019-11-01 | 珠海格力电器股份有限公司 | 智能家居设备的控制方法及装置 |
CN110597075A (zh) * | 2019-09-09 | 2019-12-20 | 珠海格力电器股份有限公司 | 一种检测控制冲突的方法、装置、电子设备及存储介质 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104573009A (zh) * | 2015-01-08 | 2015-04-29 | 南通大学 | 一种领域知识库属性扩展的方法 |
CN106777274A (zh) * | 2016-06-16 | 2017-05-31 | 北京理工大学 | 一种中文旅游领域知识图谱构建方法及系统 |
CN106919689A (zh) * | 2017-03-03 | 2017-07-04 | 中国科学技术信息研究所 | 基于术语释义知识单元的专业领域知识图谱动态构建方法 |
US20180053096A1 (en) * | 2016-08-22 | 2018-02-22 | International Business Machines Corporation | Linkage Prediction Through Similarity Analysis |
CN108304933A (zh) * | 2018-01-29 | 2018-07-20 | 北京师范大学 | 一种知识库的补全方法及补全装置 |
-
2019
- 2019-03-08 CN CN201910175561.8A patent/CN110008351B/zh not_active Expired - Fee Related
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104573009A (zh) * | 2015-01-08 | 2015-04-29 | 南通大学 | 一种领域知识库属性扩展的方法 |
CN106777274A (zh) * | 2016-06-16 | 2017-05-31 | 北京理工大学 | 一种中文旅游领域知识图谱构建方法及系统 |
US20180053096A1 (en) * | 2016-08-22 | 2018-02-22 | International Business Machines Corporation | Linkage Prediction Through Similarity Analysis |
CN106919689A (zh) * | 2017-03-03 | 2017-07-04 | 中国科学技术信息研究所 | 基于术语释义知识单元的专业领域知识图谱动态构建方法 |
CN108304933A (zh) * | 2018-01-29 | 2018-07-20 | 北京师范大学 | 一种知识库的补全方法及补全装置 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110398947A (zh) * | 2019-08-23 | 2019-11-01 | 珠海格力电器股份有限公司 | 智能家居设备的控制方法及装置 |
CN110597075A (zh) * | 2019-09-09 | 2019-12-20 | 珠海格力电器股份有限公司 | 一种检测控制冲突的方法、装置、电子设备及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN110008351B (zh) | 2021-05-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107992597B (zh) | 一种面向电网故障案例的文本结构化方法 | |
White et al. | Inference is everything: Recasting semantic resources into a unified evaluation framework | |
US8244730B2 (en) | Learning syntactic patterns for automatic discovery of causal relations from text | |
Brants | TnT-a statistical part-of-speech tagger | |
CN104794169B (zh) | 一种基于序列标注模型的学科术语抽取方法及系统 | |
CN109726745B (zh) | 一种融入描述知识的基于目标的情感分类方法 | |
Singh et al. | A decision tree based word sense disambiguation system in Manipuri language | |
KR101508070B1 (ko) | 어휘지도를 이용한 용언의 다의어 의미 분석 방법 | |
CN111666766A (zh) | 数据处理方法、装置和设备 | |
CN111177402A (zh) | 基于分词处理的评价方法、装置、计算机设备及存储介质 | |
CN113157859A (zh) | 一种基于上位概念信息的事件检测方法 | |
CN112182145A (zh) | 文本相似度确定方法、装置、设备和存储介质 | |
CN110008351A (zh) | 一种面向隐式冲突检测的结构化功能知识补全方法 | |
Sadr et al. | Presentation of an efficient automatic short answer grading model based on combination of pseudo relevance feedback and semantic relatedness measures | |
Marín Pérez | Measuring the degree of specialisation of sub-technical legal terms through corpus comparison. | |
Atoum et al. | A comprehensive comparative study of word and sentence similarity measures | |
Olaleye et al. | Attention-based keyword localisation in speech using visual grounding | |
De Melo et al. | UWN: A large multilingual lexical knowledge base | |
CN112862569B (zh) | 基于图像和文本多模态数据的产品外观风格评价方法和系统 | |
CN111191029B (zh) | 基于监督学习和文本分类的ac构建方法 | |
Jayasuriya et al. | Learning a stochastic part of speech tagger for sinhala | |
Ahmad et al. | Machine and Deep Learning Methods with Manual and Automatic Labelling for News Classification in Bangla Language | |
Shah et al. | Legal clause extraction from contract using machine learning with heuristics improvement | |
CN110705306A (zh) | 一种作文文题一致性的测评方法 | |
CN113468890B (zh) | 基于nlp信息萃取与词性规则的沉积学文献挖掘方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20210518 |
|
CF01 | Termination of patent right due to non-payment of annual fee |