CN106874397A - 一种面向物联网设备的自动语义标注方法 - Google Patents

一种面向物联网设备的自动语义标注方法 Download PDF

Info

Publication number
CN106874397A
CN106874397A CN201710028044.9A CN201710028044A CN106874397A CN 106874397 A CN106874397 A CN 106874397A CN 201710028044 A CN201710028044 A CN 201710028044A CN 106874397 A CN106874397 A CN 106874397A
Authority
CN
China
Prior art keywords
information
internet
equipment
things
automatic
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201710028044.9A
Other languages
English (en)
Other versions
CN106874397B (zh
Inventor
刘发贵
李平
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
South China University of Technology SCUT
Original Assignee
South China University of Technology SCUT
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by South China University of Technology SCUT filed Critical South China University of Technology SCUT
Priority to CN201710028044.9A priority Critical patent/CN106874397B/zh
Publication of CN106874397A publication Critical patent/CN106874397A/zh
Application granted granted Critical
Publication of CN106874397B publication Critical patent/CN106874397B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/12Protocols specially adapted for proprietary or special-purpose networking environments, e.g. medical networks, sensor networks, networks in vehicles or remote metering networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Computing Systems (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Machine Translation (AREA)

Abstract

本发明公开了一种面向物联网设备的自动语义标注方法。本发明采用物联网设备描述框架描述物联网中的设备,设备信息经筛选和过滤后被划分成设备功能信息和设备非功能信息,并采取不同的分类方法,再将两个组成部分的分类结果整合之后从设备本体中基于语义相似度筛选本体概念URI作为语义标签用于标注。考虑到方法的扩展性,提出设备本体扩展用于扩展设备本体,保证语义标签选择的准确性。本发明提出的面向物联网设备的自动语义标注方法,能够提高语义物联网中海量设备的自动语义标注效率,进一步提升服务发现系统的性能。

Description

一种面向物联网设备的自动语义标注方法
技术领域
本发明属于语义物联网中,自动语义标注领域,具体涉及物联网设备描述框架、自动语义标注和设备本体扩展方法。
背景技术
语义技术是解决物联网中海量、异构、分布式实体间信息交互的关键技术,将实体和被感知、存储和处理的信息进行语义标注则是物联网语义化的基础。物联网领域的语义标注是通过对物联网实体和数据进行语义标注,使物联网实体能够利用统一的富含语义的形式进行描述,为服务层的语义服务发现提供支撑。
目前关于语义标注的研究中,出现了一个语义标注平台,包括AeroDAML,SMT,MnM,Armadillo等;大部分研究集中在Web文档语义标注,基于模糊的形式和关系概念分析方法构建本体并用于标注,或使用基于维基百科大语料的词相似度技术或自然语言处理技术和TF-IDF来筛选标签标注,或基于相似规则归纳和基于条件随机场以及它们的改进算法的语义标注方法;物联网环境下的语义标注的研究较少,主要针对的是传感网中的数据,提出一些手动标注框架和语义推理算法。
然而,现有的语义标注工具和平台以及Web文档语义标注,大多以文本标注和Web网页为研究对象,由于物联网设备的实物特性,比如空间、时间、环境等特点,对语义标注提供了新的要求,其标注结果往往不能满足需求;而现有的物联网环境下的语义标注主要面向的是传感器数据,且是手动语义标注方法,但是,面对海量的物联网实体,特别是数量仍在迅猛增长的物联网设备,手动或半自动语义标注显得力不从心,设备作为物联网实体的主要组成部分,针对物联网设备的自动语义标注方法的研究成为亟待解决的问题。因此,已有的语义标注方法,都不能满足对物联网海量设备的语义标注的需求。
发明内容
本发明的目的在于克服现有物联网环境下语义标注方法的不足,提出了一个物联网设备描述框架和一种面向物联网设备的自动语义标注方法,并进一步提供了一种物联网设备本体的扩展方法。本发明的应用对象可推广到一般的物联网实体。如此,提高语义物联网中海量实体的语义标注的效率,进一步提升服务发现系统的性能。
本发明采用的技术方案如下。
一种面向物联网设备的自动语义标注方法,其采用物联网设备描述框架描述物联网中的设备,物联网设备描述框架包括六个组成属性,即标识信息、性能指标、功能属性、设备状态、接口属性和工作环境;在设备描述框架的基础上将自动语义标注方法分为两个阶段即信息抽取阶段和标注阶段,信息抽取阶段从物联网设备信息中抽取出具体的信息,在信息抽取阶段,根据文字的不同特性,将设备的信息划分成两个部分即设备功能信息和设备非功能信息;标注阶段从本体中选取概念来为抽取出来的信息进行标注。
整个自动语义标注分为五个步骤来完成,即信息的筛选和提取,设备功能信息提取,设备功能信息分类,属性信息域的分割和信息整合与语义标签选择。
进一步地,所述信息的筛选和提取具体是,使用小标题训练字典,并使用字典识别新样本中的小标题并提取小标题之间的信息,信息的筛选和提取与设备功能信息提取两个步骤所使用的方法都是信息提取方法,只是所使用的训练集不同。
进一步地,所述设备功能信息分类具体是,将训练集和样本集中的文本转换成向量,借助TF-IDF(term frequency–inverse document frequency)技术,使用TF和IDF生成向量并使用IDF和设定的阈值来降维,再使用向量来训练分类器和对新样本进行分类。
进一步地,所述设备非功能信息分类具体,实现属性信息域的分割,包括标注字典的生成和匹配方法。
进一步地,标注字典的生成方法具体是,人工从设备非功能信息中提取出性能指标,接口属性和工作环境三个属性的内容中出现的单词并构建训练集,学习训练集中的单词并更新对应的词频字典。
进一步地,所述标注字典的匹配方法具体是,对设备非功能信息进行分词得到单词集,并根据标注字典来分类,并根据词频字典解决冲突,最后根据分类结果重新组织设备非功能信息中的内容。
进一步地,所述信息整合和语义标签选择具体是,将设备功能信息和设备非功能信息的分类结果进行整合,并将本体引入语义标注模型,使用语义相似度从本体中筛选出本体概念URI作为语义标签用于标注。
进一步地,还包括物联网设备本体扩展过程,从一个相对小的设备本体逐步扩展成物联网领域设备本体,保证了语义标签选择的准确性。
进一步地,对于设备功能信息,采用文本分类方法,借助TF-IDF(term frequency–inverse document frequency)的技术,使用TF和IDF生成向量并使用IDF和设定的阈值来降维,从而将文字转换成向量,采用Bayes,SVM,KNN,神经网络等方法训练分类器用于分类。
进一步地,所述标注字典匹配,在新样例分类中,将新样例分词后与标注字典中单词进行匹配并确定所属类别,若得到多个类别,可借助词频字典来选择最佳的分类类别。语义标签的选择将设备功能信息和设备非功能信息的分类结果整合在一起,使用语义相似度从设备本体中筛选出本体概念的URI作为语义标签用于标注信息并得到语义标注结果。
考虑到方法的可扩展性,拥有一个设备本体是能够进行语义标签选择的前提条件,然而,事实中不一定有物联网设备领域相关的本体,为了得到正确的语义标签,本发明提出基于语义相似度的设备本体扩展,通过该方法,在使用的过程中不断扩展设备本体,从而使得语义标签的选择更加准确。
与现有技术相比,本发明具有如下优点和技术效果:
1.提出了一个设备描述框架。考虑到物联网设备的实物特性,比如空间、时间、环境等特点,能够系统完整地描述物联网中的设备信息,包含设备的状态信息;
2.提出的自动语义标注方法不但面向传感网数据,而且面向整个物联网中的设备,且可扩展成一般的物联网实体;该方法中的语义标注是自动的,使用者只需要提供少量的训练信息,整个语义标注的过程可以自动完成,提高标注效率;
3.考虑到自动语义标注方法的可扩展性,提出物联网设备本体扩展,逐步扩展设备本体,使得语义标签的选择结果更准确。
附图说明
图1为物联网设备描述框架示意图。
图2为物联网设备信息自动语义标注方法流程示意图。
图3为信息提取方法的过程示意图。
图4为标注字典的结构示意图。
图5为标注字典生成方法的流程示意图。
图6为标注字典匹配方法的流程示意图。
图7为信息整合和语义标签选择方法流程示意图。
图8为物联网设备本体扩展方法中的子树结构示意图。
图9为一个图8中的子树结构示意图。
图10为物联网设备本体扩展方法的流程示意图。
图11为物联网设备本体扩展方法中顶层概念ST匹配成功时的扩展过程示意图。
图12为物联网设备本体扩展方法中顶层概念ST的子概念匹配成功时的扩展过程示意图。
图13为物联网设备本体扩展方法中顶层概念ST及其子概念匹配失败时的扩展过程示意图。
具体实施方式
为了使本发明的技术方案及优点更加清楚明白,以下结合附图,进行进一步的详细说明,但本发明的实施和保护不限于此。
1、设备描述框架
物联网设备描述框架是物联网设备信息的描述方法,是面向物联网设备的自动语义标注的基础。本发明构建了物联网设备描述框架,如图1所示,包括多个组成部分,具体如下:
标识信息(Identification):为物联网设备提供识别作用的描述信息,包括标识、名称等。
性能指标(Preference):指设备的技术规格、运行参数等。
功能属性(Function):对设备功能的描述。作为用户查询服务和发现设备的重要依据。包括输入、输出和附加描述。
设备状态(State):描述设备在物联网中所处的状态,包括所在的地理位置、是否可用等。
接口属性(Interface):描述设备与网络之间的接口和通信,包括访问方式、接入方式等。
工作环境(Working Condition):指物联网设备正常工作时周围的环境,包括温度、湿度、工作电压、工作电流等对设备正常工作产生影响的环境因素。
以上的设备状态(State)中包含了具有移动性等动态特性,工作环境(WorkingCondition)中包含了环境等特性,体现了物联网设备的空间、时间、环境等特点。图1中的箭头表示“拥有”,例如,图1中有箭头从设备指向工作环境,表示设备拥有工作环境属性。
2、物联网设备信息自动语义标注方法
2.1物联网设备信息的自动语义标注的过程
物联网设备信息的自动语义标注,可以理解为从物联网设备信息中抽取出具体的信息,并打上语义标签的过程。将物联网设备信息的自动语义标注分为两个阶段:一是信息抽取阶段,从物联网设备信息中抽取出具体的信息;一是标注阶段,从本体中选取概念来为抽取出来的信息进行标注。在信息抽取阶段,考虑到设备功能信息的内容的文字描述自由而设备的功能类别却有限,设备的其它信息,比如性能指标,设备状态,接口属性和工作环境都具有一定的格式。因此,将设备的信息划分成两个部分,设备功能信息和设备非功能信息,采取不同的处理方式。
物联网设备信息自动语义标注需要解决如下五个问题:物联网设备信息的表示方式和获取,物联网设备信息的描述方式,关键信息的抽取,语义标签的选择,设备本体的生成和扩展。本发明中的物联网设备信息来源于设备说明书。物联网设备信息自动语义标注模型的步骤如图2所示,整个自动语义标注的过程分为五个步骤来完成,具体如下:
步骤1,物联网设备信息文本关键信息的筛选和提取,比如设备说明书,可能拥有一些用户不感兴趣的信息,比如设备的具体内部结构等,图2中①步自动完成物联网设备信息文本关键信息的筛选和提取;
步骤2,设备功能信息提取,由于设备的功能描述部分的内容的描述自由且杂乱无章,而设备的类别有限,因此,图2中②步将设备的信息划分为设备功能信息和设备非功能信息,采取不同的方式进行处理;
步骤3,设备功能信息分类,根据步骤2中的描述,需要根据设备功能信息进行分类,属于自然语言处理的内容,图2③步中采用文本处理的技术对设备功能信息分类;
步骤4,属性信息域的分割,设备描述框架中的六个属性,性能指标属性在设备接入到物联网中时获得,功能属性的信息域在步骤3中完成,设备状态属性与设备具体运行状态相关,其信息并不在设备说明书中,因此,性能指标,接口属性和工作环境属性的信息则分散在设备非功能信息的内容中,图2中④步完成信息域的划分;
步骤5,信息整合和语义标签选择,将步骤3和步骤4得到的信息域进行整合,选择语义标签进行标注,得到最终的标注文档,图2中⑤步完成信息的整合和语义标签选择。
2.2信息提取方法
步骤1和步骤2所采用的方法是一样的,只是这两个步骤所使用的训练集不同,从而所完成的任务不同。采用信息提取方法,物联网设备文本信息,如设备说明书,用户感兴趣的信息或者需要提取的功能描述信息,通常多个小标题之间,具体过程如图3所示。在训练阶段,信息提取方法通过训练集的训练,学习小标题中出现的词以及词频,筛选之后加入到字典中;在信息提取阶段,新样本跟字典进行匹配,识别小标题,抽取小标题之间的文本内容,重新组建成文档,得到信息提取结果。
2.3设备功能信息分类方法
步骤3中,设备功能信息一般描述比较自由,没有固定的描述规则,而物联网设备的功能类别却有限。不同类型的设备,其功能是不同的,因此可以使用文本分类算法,常用文本分类算法包括SVM,Bayes,决策树,人工神经网络,KNN等。其中,最常用且简单的算法是Bayes;而其他算法则需要将训练集和样本集中的文本转换成向量,借助TF-IDF的技术来完成,设备功能的类别和训练集的构建需要人工构建。具体步骤如下:
步骤3.1训练集中共有N条记录,针对每条记录Si,包括两部分,文本内容Ti以及它所属的类别Ci,对Ti进行分词,得到单词集合Twi
步骤3.2统计Twi中出现过的所有单词,得到有序序列Aw;
步骤3.3统计在Aw中出现了单词Awi的记录数Cwi,则
步骤3.3设定阈值δ,从Aw中筛选出idfi>δ的单词,组成Ca;
步骤3.4构造与Ca等长的向量Rj,针对每条记录Sj中的Tj,按照Ca中每个单词Cai出现的顺序统计出现的次数与idfi的乘积,若Cai未在Tj中出现,则令Rji=0,从而得到向量R;
步骤3.5通过步骤3.1-3.4,训练集中的每条记录Sj被转换成向量Rj以及其所属的类别Cj,可用于SVM,决策树,人工神经网络,KNN等方法训练分类器,并调节阈值δ的取值来优化分类器;
步骤3.6中将样本集中的待分类文本,采用步骤3.1-3.4相同的方法转换成向量,再使用步骤3.5中已训练的分类器分类。
2.4设备非功能信息字典分类方法
由于物联网设备的六个属性中,标识信息用于标识设备,设备在接入物联网时,将获得唯一的标识信息,因此,标识信息并不出现在设备说明书中;而设备状态属于设备的动态信息,与设备的运行状态相关,也不出现在设备说明书中。因此,设备非功能信息包括三个部分内容,包括性能指标,接口属性和工作环境。
步骤4完成属性信息域的分割,将设备非功能信息中的关于性能指标,接口属性和工作环境三个属性的信息相分离。本发明提出字典分类方法,包括标注字典的生成和匹配方法。首先提出标注字典的概念,用于描述每个设备属性中常出现的单词,并统计每个单词的词频(TF),标注字典包括三个子标注字典,分别表示性能指标,接口属性和工作环境三大属性对应的标注字典。标注字典保存了三大属性的信息中常出现的单词,结构如图4所示。标注字典包含三个子字典,对应三个不同的属性。与标注字典相对应的词频字典,保存了标注字典中每个单词在训练集中出现的词频,用于解决字典分类中的冲突问题,即一个单词出现在多个子字典中,此时,将根据词频字典中的词频来筛选更大可能属于的类别。标注字典的生成和匹配方法的具体过程如下:
1)标注字典生成方法。具体过程如图5所示。方法的输入包括训练集TN,标注字典D和词频字典TF。其中TN中每条记录N的结构为三元组(Pref,Inter,workCond),分别对应性能指标,接口属性和工作环境三个属性的内容。TN需要人工构建,构建的方法为人工从设备非功能信息中提取出三个属性的内容中出现的单词,并组合成三元组加入到TN中;方法的输出为标注字典D和词频字典TF。方法的具体步骤如下:
步骤4.1.1 TN中的每条记录N,包括三个组成部分Ni(i=1,2,3),对每个Ni进行分词得到单词集合Wsi
步骤4.1.2针对Wsi中的每个单词Wsij,判断Wsij是否在di中,如果在,转步骤4.1.3,否则,转4.1.4;
步骤4.1.3找到单词Wsij在di中的位置pos,并令TF中的pos位置的取值加1;
步骤4.1.4将Wsij加入到di中,并在TF中的相同位置上加入1。
2)标注字典匹配方法。将新的设备非功能信息N中的每条信息划分到性能指标,接口属性和工作环境三个属性中的过程。具体过程如图6所示。方法的输入包括标注字典D,词频字典TF和新的设备非功能信息N。方法的输出为分类结果Nnf,Nnf具有与1)中的TN相同的结构,是一个三元组。方法的具体步骤如下:
步骤4.2.1对N进行分词,得到单词集合Nw,针对Nw中的每个单词Nwi,定义一个用于表示其分类的类别;
步骤4.2.2判断Nwi是否在dj中,如果不在,转步骤4.2.3,否则转步骤4.2.4;
步骤4.2.3令Li=0,转步骤4.2.5;
步骤4.2.4令Li=j,判断是否存在多个j,如果不是,则使用词频字典TF筛选出最可能的j,转步骤4.2.5;
步骤4.2.5得到分类序列L,针对Nw中的每个单词Nwi,如果Li=1,则将Nwi加入到Nnf.pref;如果Li=2,则将Nwi加入到Nnf.Inter;如果Li=3,则将Nwi加入到Nnf.workCond;如果Li=0,则将Nwi加入到Li-1所属的部分。
2.5信息整合和语义标签选择方法
步骤5中完成信息整合和语义标签选择。包括信息整合和语义标签选择两个部分。信息整合将步骤3和步骤4的分类结果重新组织在一起。接着是语义标签的选择,每一条关键信息,本身都具有标签,但这些标签没有语义信息,需要将无语义标签映射为语义标签。为了使得机器能够理解标签,将本体引入到语义标注模型,使用语义相似度来度量两个词的语义相似度大小,进行语义标签的匹配和选择。具体过程如图7所示。方法的输入包括一个设备本体Device,一个单词或短语W和阈值δ;方法的输出为选中的本体概念URI。具体步骤如下:
步骤5.1得到本体Device中的所有概念的URI,记为S;
步骤5.2针对S中的每个概念Si,得到概念名Sni,并计算Sni与W的语义相似度Simi
步骤5.3从所有的Simi中找到最大的值Simj,如果Simj>δ,则返回本体概念URISj;否则返回空。
3物联网设备本体扩展方法
第2节的步骤5中的语义标签选择的前提条件是拥有一个设备本体,然而,事实中不一定有物联网设备领域相关的本体,例如,需要匹配“工作温度”,如果本体中没有合适的概念,使用本体概念匹配,匹配的结果可能为“湿度”,将“湿度”概念作为“工作温度”的语义标签,显然是错误的,因此,为了得到正确的语义标签,就需要将“工作温度”作为概念加入到设备本体中。本发明基于语义相似度的设备本体扩展方法,其基本思想是起始时初始化一个很小的设备本体,扩展的过程将一棵两层的小树(如图8所示)加入到设备本体中。在第2节的步骤4中,可以得到性能指标,接口属性和工作环境三个属性的内容,例如,工作环境中可能包含,海拔高度,工作温度,湿度等概念,在创建子树的步骤如下:
1)以工作环境作为根节点;
2)其包含的子概念,如海拔高度,工作温度,湿度等,作为子节点;
3)得到如下的子树结构,如图9所示。
图8和图9中的子树结构表示为C:(P,S,V),表示C为结构的顶层概念,而P,S,V为C的子概念。方法的具体过程如图10所示。方法输入为一个设备本体Device和一棵小树ST:(P,S,V),以及阈值δ,输出为扩展后的本体Device。具体步骤如下:
步骤1,计算Device本体中的每个概念Ci与子树顶层概念ST的语义相似度Si
步骤2,从Si中找出最大值Sm以及相对应的Cm
步骤3,如果Sm大于阈值δ,将ST的子概念P,S,V加入到本体中作为Cm的子概念,如图11所示;否则,转到步骤4;
步骤4,将ST的子概念P,S,V与Device本体中的概念计算语义相似度,如果最大语义相似度是否大于δ,不妨假设P匹配成功,则ST和Device中与P匹配成功的概念的父概念建立TogetherHasP连接,如图12所示,否则转到步骤5;
步骤5,将子树ST加入到本体作为顶层概念Device的子概念,如图13所示。

Claims (8)

1.一种面向物联网设备的自动语义标注方法,其特征在于采用物联网设备描述框架描述物联网中的设备,物联网设备描述框架包括六个组成属性,即标识信息、性能指标、功能属性、设备状态、接口属性和工作环境;在设备描述框架的基础上将自动语义标注方法分为两个阶段即信息抽取阶段和标注阶段,信息抽取阶段从物联网设备信息中抽取出具体的信息,在信息抽取阶段,根据文字的不同特性,将设备的信息划分成两个部分即设备功能信息和设备非功能信息;标注阶段从本体中选取概念来为抽取出来的信息进行标注;整个自动语义标注分为五个步骤来完成,即信息的筛选和提取,设备功能信息提取,设备功能信息分类,属性信息域的分割和信息整合与语义标签选择。
2.根据权利要求1所述的一种面向物联网设备的自动语义标注方法,其特征在于所述信息的筛选和提取具体是,使用小标题训练字典,并使用字典识别新样本中的小标题并提取小标题之间的信息,信息的筛选和提取与设备功能信息提取两个步骤所使用的方法都是信息提取方法,只是所使用的训练集不同。
3. 根据权利要求1所述的一种面向物联网设备的自动语义标注方法,其特征在于所述设备功能信息分类具体是,将训练集和样本集中的文本转换成向量,借助TF-IDF(termfrequency–inverse document frequency)技术,使用TF和IDF生成向量并使用IDF和设定的阈值来降维,再使用向量来训练分类器和对新样本进行分类。
4.根据权利要求1所述的一种面向物联网设备的自动语义标注方法,其特征在于所述设备非功能信息分类具体是,实现属性信息域的分割,包括标注字典的生成和匹配方法。
5.根据权利要求4所述的一种面向物联网设备的自动语义标注方法,其特征在于标注字典的生成方法具体是,从设备非功能信息中提取出性能指标、接口属性和工作环境三个属性的内容中出现的单词并构建训练集,训练集中的每个元素包含单词以及单词所属的类别,根据单词所属的类别归类到标注字典中,并更新词频字典对应的值。
6.根据权利要求4所述的一种面向物联网设备的自动语义标注方法,其特征在于所述标注字典的匹配方法具体是,对设备非功能信息进行分词得到单词集,并根据标注字典来分类,并根据词频字典解决冲突,最后根据分类结果重新组织设备非功能信息中的内容。
7.根据权利要求4所述的一种面向物联网设备的自动语义标注方法,其特征在于所述信息整合和语义标签选择具体是,将设备功能信息和设备非功能信息的分类结果进行整合,并将本体引入语义标注模型,使用语义相似度从本体中筛选出本体概念URI作为语义标签用于标注。
8.根据权利要求1所述的自动语义标注方法,其特征在于还包括物联网设备本体扩展过程,从一个相对小的设备本体逐步扩展成物联网领域设备本体,保证了语义标签选择的准确性。
CN201710028044.9A 2017-01-16 2017-01-16 一种面向物联网设备的自动语义标注方法 Active CN106874397B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710028044.9A CN106874397B (zh) 2017-01-16 2017-01-16 一种面向物联网设备的自动语义标注方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710028044.9A CN106874397B (zh) 2017-01-16 2017-01-16 一种面向物联网设备的自动语义标注方法

Publications (2)

Publication Number Publication Date
CN106874397A true CN106874397A (zh) 2017-06-20
CN106874397B CN106874397B (zh) 2021-03-30

Family

ID=59157331

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710028044.9A Active CN106874397B (zh) 2017-01-16 2017-01-16 一种面向物联网设备的自动语义标注方法

Country Status (1)

Country Link
CN (1) CN106874397B (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108712466A (zh) * 2018-04-18 2018-10-26 山东科技大学 一种基于Gaussian ATM和词嵌入的语义稀疏Web服务发现方法
CN110019809A (zh) * 2018-01-02 2019-07-16 中国移动通信有限公司研究院 一种分类确定方法、装置及网络设备
CN110716974A (zh) * 2019-09-29 2020-01-21 宜通世纪物联网研究院(广州)有限公司 物联网设备与平台的动态交互方法、系统及存储介质
CN112687267A (zh) * 2020-12-22 2021-04-20 同济大学 一种物联网数据语义处理系统
CN112711666A (zh) * 2021-03-26 2021-04-27 武汉优品楚鼎科技有限公司 期货标签抽取方法及装置

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105760397A (zh) * 2014-12-18 2016-07-13 中兴通讯股份有限公司 物联网本体模型处理方法及装置
CN106302680A (zh) * 2016-08-06 2017-01-04 内蒙古大学 一种基于物联网的数据显示后台系统

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105760397A (zh) * 2014-12-18 2016-07-13 中兴通讯股份有限公司 物联网本体模型处理方法及装置
CN106302680A (zh) * 2016-08-06 2017-01-04 内蒙古大学 一种基于物联网的数据显示后台系统

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
彭晨漪: "物联网环境下面向服务的实体语义标注", 《中国优秀硕士学位论文全文数据库 信息科技辑》 *

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110019809A (zh) * 2018-01-02 2019-07-16 中国移动通信有限公司研究院 一种分类确定方法、装置及网络设备
CN110019809B (zh) * 2018-01-02 2021-11-19 中国移动通信有限公司研究院 一种分类确定方法、装置及网络设备
CN108712466A (zh) * 2018-04-18 2018-10-26 山东科技大学 一种基于Gaussian ATM和词嵌入的语义稀疏Web服务发现方法
CN110716974A (zh) * 2019-09-29 2020-01-21 宜通世纪物联网研究院(广州)有限公司 物联网设备与平台的动态交互方法、系统及存储介质
CN112687267A (zh) * 2020-12-22 2021-04-20 同济大学 一种物联网数据语义处理系统
CN112711666A (zh) * 2021-03-26 2021-04-27 武汉优品楚鼎科技有限公司 期货标签抽取方法及装置

Also Published As

Publication number Publication date
CN106874397B (zh) 2021-03-30

Similar Documents

Publication Publication Date Title
CN107291783B (zh) 一种语义匹配方法及智能设备
CN110414683B (zh) 数学题解答方法及装置
CN106874397A (zh) 一种面向物联网设备的自动语义标注方法
CN106201465B (zh) 面向开源社区的软件项目个性化推荐方法
CN107679110A (zh) 结合文本分类与图片属性提取完善知识图谱的方法及装置
CN110851596A (zh) 文本分类方法、装置及计算机可读存储介质
CN107679580A (zh) 一种基于多模态深度潜在关联的异构迁移图像情感极性分析方法
CN108073677A (zh) 一种基于人工智能的多级文本多标签分类方法及系统
CN110598203A (zh) 一种结合词典的军事想定文书实体信息抽取方法及装置
CN106445919A (zh) 一种情感分类方法及装置
CN104517106B (zh) 一种列表识别方法与系统
CN110443571A (zh) 基于知识图谱进行简历评估的方法、装置及设备
Wahid et al. Cricket sentiment analysis from Bangla text using recurrent neural network with long short term memory model
CN109344187B (zh) 一种司法判决书案情信息结构化处理系统
CN109446423B (zh) 一种新闻以及文本的情感判断系统及方法
CN102662923A (zh) 一种基于机器学习的本体实例学习方法
CN102708164B (zh) 电影期望值的计算方法及系统
Al Wazrah et al. Sentiment analysis using stacked gated recurrent unit for arabic tweets
CN110348017B (zh) 一种文本实体检测方法、系统及相关组件
CN105069129B (zh) 自适应多标签预测方法
CN111695358B (zh) 生成词向量的方法、装置、计算机存储介质和电子设备
CN110990670B (zh) 一种成长激励型图书推荐方法及推荐系统
Zheng et al. A deep learning approach for expert identification in question answering communities
CN116150404A (zh) 一种基于联合学习的教育资源多模态知识图谱构建方法
CN109299286A (zh) 非结构化数据的知识挖掘方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant