CN108021592B - 一种用于影视素材领域的非结构化数据管理方法 - Google Patents
一种用于影视素材领域的非结构化数据管理方法 Download PDFInfo
- Publication number
- CN108021592B CN108021592B CN201610972138.7A CN201610972138A CN108021592B CN 108021592 B CN108021592 B CN 108021592B CN 201610972138 A CN201610972138 A CN 201610972138A CN 108021592 B CN108021592 B CN 108021592B
- Authority
- CN
- China
- Prior art keywords
- search
- film
- unstructured data
- television
- field
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/10—File systems; File servers
- G06F16/11—File system administration, e.g. details of archiving or snapshots
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/10—File systems; File servers
- G06F16/18—File system types
- G06F16/182—Distributed file systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/40—Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
- G06F16/43—Querying
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明涉及一种用于影视素材领域的非结构化数据管理方法,用于对影视素材领域的非结构化数据进行分布式存储、查询和可视化管理,分布式存储具体为:建立影视素材领域的知识本体,包括领域知识库KS和标签分类库LS;确定非结构化数据的存储路径,按照存储路径将其存储到HDFS文件系统中,同时将影视素材的非结构化数据的描述信息存储到数据库中;查询和可视化管理具体为:通过计算语义相似相关度拓展用户的搜索条件;根据拓展后的搜索条件,利用ElasticSearch搜索引擎结合Jena推理算法进行搜索,得到搜索结果并反馈给用户;利用可视化工具对搜索数据进行展示。与现有技术相比,本发明具有适用于非结构化数据、搜索条件可扩展、查询灵活以及可视化展示等优点。
Description
技术领域
本发明非结构化数据管理领域,尤其是涉及一种用于影视素材领域的非结构化数据管理方法。
背景技术
影视素材在影视后期制作、教学、研究等多领域被大量应用。能用统一结构表示的数据称为结构化数据;字段长度可变,没有预定义数据模型的数据称为非结构化数据。传统的关系型数据库可以较好管理结构化数据,但在异构数据海量膨胀的背景下,关系型数据库暴露出明显局限性。
影视素材中文本、图像、音频、视频等都属于非结构化数据。相比较结构化数据,其存在存储管理、查询处理和查询优化等问题。因而,在海量的影视素材中,如何有效存储并且查询非结构化的影视数据,是媒资管理中亟需解决的问题。
发明内容
本发明的目的是针对上述问题提供一种用于影视素材领域的非结构化数据管理方法。
本发明的目的可以通过以下技术方案来实现:
一种用于影视素材领域的非结构化数据管理方法,用于对影视素材领域的非结构化数据进行分布式存储、查询和可视化管理,所述分布式存储具体为:
A1)建立影视素材领域的知识本体,包括领域知识库KS和标签分类库LS;
A2)根据建立的影视素材领域的知识本体,确定所接收影视素材的非结构化数据的存储路径,按照存储路径将其存储到HDFS文件系统中,同时将影视素材的非结构化数据的描述信息存储到数据库中;
所述查询和可视化管理具体为:
B1)通过计算语义相似相关度拓展用户的搜索条件;
B2)根据拓展后的用户的搜索条件,利用ElasticSearch搜索引擎结合Jena推理算法进行搜索,得到搜索结果并反馈给用户;
B3)利用可视化工具对搜索数据进行展示。
所述步骤A1)具体为:
A11)对影视素材领域的知识进行分类,得到领域知识库KS;
A12)根据步骤A11)的分类结果建立影视素材领域的知识本体,所述影视素材领域的知识本体为树结构,所述树结构上的结点对应影视素材领域的知识分类;
A13)对步骤A12)中树结构上的结点进行信息描述并设置语义标签,得到标签分类库LS。
所述步骤A2)具体为:
A21)根据领域知识库KS确定接收的影视素材的非结构化数据的相关分类;
A22)根据标签分类库LS确定接收的影视素材的非结构化数据的语义标签;
A23)根据确定的相关分类和语义标签确定影视素材的非结构化数据的存储路径;
A24)按照存储路径将影视素材的非结构化数据存储至HDFS文件系统的主控机器中,主控机器将其分配到其他从属机器进行存储,从属机器同时对影视素材的非结构化数据进行备份;
A25)影视素材的非结构化数据的描述信息存储到数据库中,所述描述信息包括本体结构信息、相关分类、语义标签和存储路径。
所述步骤B1)具体为:
B11)对用户的搜索条件进行自然语言处理;
B12)计算处理后的搜索条件的语义相似相关度,所述语义相似相关度包括字面相似度wordSim(A,B)、语义重合度semCR(A,B)、距离相似度disSim(A,B)和层次深度depH(A,B);
B13)根据计算结果得到拓展后的搜索条件。
所述自然语言处理包括中文分词和过滤预定义的停用词。
所述字面相似度wordSim(A,B)具体为:
所述语义重合度semCR(A,B)具体为:
所述距离相似度disSim(A,B)具体为:
所述层次深度depH(A,B)具体为:
其中,A和B表示影视素材领域的知识本体的两个结点,R表示根节点,wordNum表示汉字数,nodeSet表示结点集合,length表示途经长度。
所述步骤B2)具体为:
B21)利用ElasticSearch搜索引擎,将拓展后的用户的搜索条件与标签分类库LS进行匹配;
B22)根据标签分类库LS的匹配结果得到对应的领域知识库KS中的结点,利用Jena推理算法得到其兄弟结点;
B23)将步骤B22)中得到的结点及其兄弟结点对应的描述信息和影视素材的非结构化数据作为搜索结果;
B24)对步骤B23)得到的搜索结果进行排序并反馈给用户。
所述排序的规则具体为:
B241)对自然语言处理后得到的搜索条件对应的搜索结果优先展示;
B242)对语义相似相关度计算结果高的搜索条件对应的搜索结果次优先展示;
B243)利用ElasticSearch搜索引擎的评分算法对搜索条件进行评分,按照评分的高低将对应的搜索结果进行展示。
所述步骤B3)具体为:
B31)按照日期和IP地址对用户的搜索数据进行分析,所述搜索数据包括关键词数据、词频数据和文档下载数据;
B32)选择需要绘制的可视化图形类型,所述可视化图形类型包括柱形图、折线图、饼状图和集群图;
B33)对用户的搜索习惯和搜索地域进行分析,结合步骤B31)的分析结果,按照选择的可视化图形类型进行可视化展示。
与现有技术相比,本发明具有以下有益效果:
(1)构建影视素材领域的知识本体,并通过分布式存储平台HDFS实现了非结构化数据的分布式存储,同时将非结构化数据的存储路径等描述信息存储到数据库中,通过描述信息与非结构化数据进行关联,与结构化数据库相比,存储更为方便灵活,查询也更为便捷。
(2)通过计算语义相似相关度拓展用户的搜索条件,扩大了搜索结果的覆盖范围,更加便于用户查询到相关数据。
(3)利用搜索引擎结合Jena推理算法进行搜索,适用于非结构化数据的处理和查询,摆脱了现有的适用于结构化数据搜索的工具的限制。
(4)对于搜索结果按照相关度进行排序,便于用户寻找到最为相关的搜索结果,进一步提高了搜索质量。
(5)进利用可视化工具对搜索数据进行了展示,显示直观。
附图说明
图1为影视素材领域的非结构化数据管理系统的架构图;
图2为本发明的方法流程图;
图3为关键词的处理流程图;
图4为非结构化数据的存储流程图;
图5为返回查询结果的流程图;
图6为领域知识库KS与标签分类库LS的关系图。
具体实施方式
下面结合附图和具体实施例对本发明进行详细说明。本实施例以本发明技术方案为前提进行实施,给出了详细的实施方式和具体的操作过程,但本发明的保护范围不限于下述的实施例。
如图2所示,本发明提供了一种用于影视素材领域的非结构化数据管理方法,用于对影视素材领域的非结构化数据进行分布式存储、查询和可视化管理,该方法包括下列步骤:
A1)建立影视素材领域的知识本体,包括领域知识库KS和标签分类库LS:
A11)对影视素材领域的知识进行分类,得到领域知识库KS;
A12)根据步骤A11)的分类结果建立影视素材领域的知识本体,所述影视素材领域的知识本体为树结构,所述树结构上的结点对应影视素材领域的知识分类;
A13)对步骤A12)中树结构上的结点进行信息描述并设置语义标签,得到标签分类库LS;
A2)根据建立的影视素材领域的知识本体,确定所接收影视素材的非结构化数据的存储路径,按照存储路径将其存储到HDFS文件系统中,同时将影视素材的非结构化数据的描述信息存储到数据库中:
A21)根据领域知识库KS确定接收的影视素材的非结构化数据的相关分类;
A22)根据标签分类库LS确定接收的影视素材的非结构化数据的语义标签;
A23)根据确定的相关分类和语义标签确定影视素材的非结构化数据的存储路径;
A24)按照存储路径将影视素材的非结构化数据存储至HDFS文件系统的主控机器中,主控机器将其分配到其他从属机器进行存储,从属机器同时对影视素材的非结构化数据进行备份;
A25)影视素材的非结构化数据的描述信息存储到数据库中,所述描述信息包括本体结构信息、相关分类、语义标签和存储路径;
B1)通过计算语义相似相关度拓展用户的搜索条件:
B11)对用户的搜索条件进行自然语言处理;
B12)计算处理后的搜索条件的语义相似相关度,所述语义相似相关度包括字面相似度wordSim(A,B)、语义重合度semCR(A,B)、距离相似度disSim(A,B)和层次深度depH(A,B);
B13)根据计算结果得到拓展后的搜索条件;
B2)根据拓展后的用户的搜索条件,利用ElasticSearch搜索引擎结合Jena推理算法进行搜索,得到搜索结果并反馈给用户:
B21)利用ElasticSearch搜索引擎,将拓展后的用户的搜索条件与标签分类库LS进行匹配;
B22)根据标签分类库LS的匹配结果得到对应的领域知识库KS中的结点,利用Jena推理算法得到其兄弟结点;
B23)将步骤B22)中得到的结点及其兄弟结点对应的描述信息和影视素材的非结构化数据作为搜索结果;
B24)对步骤B23)得到的搜索结果进行排序并反馈给用户;
B3)利用可视化工具对搜索数据进行展示:
B31)按照日期和IP地址对用户的搜索数据进行分析,所述搜索数据包括关键词数据、词频数据和文档下载数据;
B32)选择需要绘制的可视化图形类型,所述可视化图形类型包括柱形图、折线图、饼状图和集群图;
B33)对用户的搜索习惯和搜索地域进行分析,结合步骤B31)的分析结果,按照选择的可视化图形类型进行可视化展示。
如图1所示为基于影视素材领域的非结构化数据管理系统,该系统按照上述步骤具体进行管理,具体过程为:
根据影视领域专业知识,用Protégé工具建立影视领域本体。设立相关类与实例,为其设置语义标签以及信息描述规范。用户根据所建立的本体,以及不同的标签分类上传影视领域非结构化数据。数据库MongoDB中存非结构化数据的相关描述信息(包括数据分类、语义标签等),分布式文件系统HDFS中存储文件实体。用户搜索界面接受用户的查询条件,通过自然语言处理技术,结合IK Analyzer分词器、语义相关度、语义相似度等方法,得到拓展的用户搜索关键词集合。通过搜索引擎Elasticsearch组件,查找到标签分类库LS中对应的标签属性,进一步得到该属性在领域知识库KS中对应的结点;通过Jena推理机查找到对应结点的兄弟结点信息。按照一定排序规则,将相关搜索结果返回,保证与用户搜索最为密切的搜索结果优先级最高。最后,用D3.js对用户的搜索数据进行可视化分析,增加用户体验。
如图3所示为处理查询关键词的流程,首先,获取用户查询请求后,对查询信息进行自然语言处理,包括用IK分词器进行将用户搜索信息序列切分成单独的词,过滤预定义的停用词等;通过相关文本预处理操作,可得到用户搜索关键词;其次,通过计算语义相似度与语义相关度拓展用户查询条件;
主要通过如下几种相似度对用户查询条件进行拓展:
字面相似度wordSim(A,B):
语义重合度semCR(A,B):
距离相似度disSim(A,B):
层次深度depH(A,B):
其中,A和B表示影视素材领域的知识本体的两个结点,R表示根节点,wordNum表示汉字数,nodeSet表示结点集合,length表示途经长度。
字面相似度wordSim(A,B),是指词语间相同汉字的数量占两个词语汉字综述的比重。wordNum(A∩B)表示A与B共同拥有的汉字数,wordNum(A)+wordNum(B)表示结点A与B中所有的汉字数;
语义重合度semCR(A,B),指结点间具有共同的上位结点(包含其父结点和祖先结点)占两个结点所有上位结点的比例。nodeSet(A,R)、nodeSet(B,R)分别为从A、B向父结点遍历直至根结点,中间经过的结点集合;nodeSet(A,R)∩nodeSet(B,R)代表从A、B分别向父结点出发直至根结点时,经过的公共结点集合;nodeSet(A,R)∪nodeSet(B,R)代表从A、B分别向父结点出发直至根结点,一共经过的结点集合;
距离相似度disSim(A,B),指两个结点在本体中距离的远近,如果两个结点无通路,即不可达,则disSim(A,B)=0;length(A,R),length(B,R)指的是从A、B结点向父结点遍历至根结点途经长度。如果A可遍历到B结点,则结点A与B的距离为|length(A,R)-length(B,R)|。
层次深度depH(A,B),指结点在本体中与根结点的距离程度。距离根结点越近,则结点含义越抽象。length(A,R)、length(B,R)分别为从A、B向父结点遍历直至根结点,中间经过的路径长度;length(R)为本体模型的深度。
通过计算不同的相似度,拓展用户搜索的关键词,保证用户搜索结果更为全面。但在对查询结果进行排序时,未经拓展的关键词查询结果优先级最高。根据查询关键词集合搜索得到标签分类库LS中对应的数据语义标签,再根据标签与领域知识库KS的对应关系找到相关结点
如图4所示为本发明非结构化数据存储流程图,用户在上传影视素材后,首先,根据领域知识库KS为素材绑定分类。其次,根据标签分类库LS中的标签属性为非结构化数据添加语义标签,将LS中描述类属性的标签实例化对象。LS中的语义标签,包括素材标题、摘要、创建时间、作者等。最后,将非结构化数据描述信息,包括由KS确定的分类信息、LS确定的语义标签以及非结构化数据存储路径信息存储到MongoDB数据库中;根据描述信息中由相关分类和语义标签所确定的存储路径,将影视素材领域的非结构化数据实体存储到HDFS文件系统。
如图5所示为本发明返回查询结果流程图,得到用户查询关键词后,通过搜索引擎以及推理算法,在领域知识库KS中查找对应结点以及与该结点相关的其他兄弟结点,并将查询结果返回用户。首先,利用搜索引擎ElasticSearch,找到与用户搜索关键字对应的标签分类库LS中的信息。LS再根据标签属性与分类结点的对应关系,找到对应该属性的KS中的结点;其次,利用Jena推理机,推理得出KS中对应结点的父结点,并搜索该父结点的其他子结点;最后,对查询结果进行排序。通过计算字面相似度、语义重合度等,与查询关键字相似度越大的查询结果具有较高优先级。
如图6所示为本发明领域知识库KS与标签分类库LS的关系图,领域知识库KS为根据领域专家知识,采用树结构本体模型TR(N,E)形式建立的影视领域本体类,选用Protégé本体编辑器,OWL语言描述。标签分类库LS是与领域知识库KS结点一一对应的标签,具有不同属性。属性中可添加实例的描述信息以及影视实体的存储路径。用户上传原始素材时,根据KS对应的分类,找到上传素材所述结点位置。再根据该结点所对应LS中的属性,为非结构化数据添加语义标签。由此生成了具有LS标签属性的KS实例。
Claims (6)
1.一种用于影视素材领域的非结构化数据管理方法,用于对影视素材领域的非结构化数据进行分布式存储、查询和可视化管理,其特征在于,所述分布式存储具体为:
A1)建立影视素材领域的知识本体,包括领域知识库KS和标签分类库LS,所述影视素材领域的知识本体为树结构,所述树结构上的结点对应影视素材领域的知识分类;
A2)根据建立的影视素材领域的知识本体,确定所接收影视素材的非结构化数据的存储路径,按照存储路径将其存储到HDFS文件系统中,同时将影视素材的非结构化数据的描述信息存储到数据库中;
所述查询和可视化管理具体为:
B1)通过计算语义相似相关度拓展用户的搜索条件;
B2)根据拓展后的用户的搜索条件,利用ElasticSearch搜索引擎结合Jena推理算法进行搜索,得到搜索结果并反馈给用户;
B3)利用可视化工具对搜索数据进行展示;
步骤B1)具体为:
B11)对用户的搜索条件进行自然语言处理;
B12)计算处理后的搜索条件的语义相似相关度,所述语义相似相关度包括字面相似度wordSim(A,B)、语义重合度semCR(A,B)、距离相似度disSim(A,B)和层次深度depH(A,B);
B13)根据计算结果得到拓展后的搜索条件;
所述字面相似度wordSim(A,B)具体为:
所述语义重合度semCR(A,B)具体为:
所述距离相似度disSim(A,B)具体为:
所述层次深度depH(A,B)具体为:
其中,A和B表示影视素材领域的知识本体的两个结点,R表示根节点,wordNum表示汉字数,nodeSet表示结点集合,length表示途经长度;
步骤B2)具体为:
B21)利用ElasticSearch搜索引擎,将拓展后的用户的搜索条件与标签分类库LS进行匹配;
B22)根据标签分类库LS的匹配结果得到对应的领域知识库KS中的结点,利用Jena推理算法得到其兄弟结点;
B23)将步骤B22)中得到的结点及其兄弟结点对应的描述信息和影视素材的非结构化数据作为搜索结果;
B24)对步骤B23)得到的搜索结果进行排序并反馈给用户。
2.根据权利要求1所述的用于影视素材领域的非结构化数据管理方法,其特征在于,步骤A1)具体为:
A11)对影视素材领域的知识进行分类,得到领域知识库KS;
A12)根据步骤A11)的分类结果建立影视素材领域的知识本体,所述影视素材领域的知识本体为树结构,所述树结构上的结点对应影视素材领域的知识分类;
A13)对步骤A12)中树结构上的结点进行信息描述并设置语义标签,得到标签分类库LS。
3.根据权利要求1所述的用于影视素材领域的非结构化数据管理方法,其特征在于,步骤A2)具体为:
A21)根据领域知识库KS确定接收的影视素材的非结构化数据的相关分类;
A22)根据标签分类库LS确定接收的影视素材的非结构化数据的语义标签;
A23)根据确定的相关分类和语义标签确定影视素材的非结构化数据的存储路径;
A24)按照存储路径将影视素材的非结构化数据存储至HDFS文件系统的主控机器中,主控机器将其分配到其他从属机器进行存储,从属机器同时对影视素材的非结构化数据进行备份;
A25)影视素材的非结构化数据的描述信息存储到数据库中,所述描述信息包括本体结构信息、相关分类、语义标签和存储路径。
4.根据权利要求1所述的用于影视素材领域的非结构化数据管理方法,其特征在于,所述自然语言处理包括中文分词和过滤预定义的停用词。
5.根据权利要求1所述的用于影视素材领域的非结构化数据管理方法,其特征在于,所述排序的规则具体为:
B241)对自然语言处理后得到的搜索条件对应的搜索结果优先展示;
B242)对语义相似相关度计算结果高的搜索条件对应的搜索结果次优先展示;
B243)利用ElasticSearch搜索引擎的评分算法对搜索条件进行评分,按照评分的高低将对应的搜索结果进行展示。
6.根据权利要求1所述的用于影视素材领域的非结构化数据管理方法,其特征在于,步骤B3)具体为:
B31)按照日期和IP地址对用户的搜索数据进行分析,所述搜索数据包括关键词数据、词频数据和文档下载数据;
B32)选择需要绘制的可视化图形类型,所述可视化图形类型包括柱形图、折线图、饼状图和集群图;
B33)对用户的搜索习惯和搜索地域进行分析,结合步骤B31)的分析结果,按照选择的可视化图形类型进行可视化展示。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610972138.7A CN108021592B (zh) | 2016-11-04 | 2016-11-04 | 一种用于影视素材领域的非结构化数据管理方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610972138.7A CN108021592B (zh) | 2016-11-04 | 2016-11-04 | 一种用于影视素材领域的非结构化数据管理方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN108021592A CN108021592A (zh) | 2018-05-11 |
CN108021592B true CN108021592B (zh) | 2021-11-02 |
Family
ID=62083614
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201610972138.7A Active CN108021592B (zh) | 2016-11-04 | 2016-11-04 | 一种用于影视素材领域的非结构化数据管理方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108021592B (zh) |
Families Citing this family (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109033267A (zh) * | 2018-07-09 | 2018-12-18 | 广州极天信息技术股份有限公司 | 一种智能化的知识灌入系统及方法 |
CN109725898B (zh) * | 2018-11-30 | 2024-05-28 | 平安科技(深圳)有限公司 | 凭证规则的配置方法、装置、计算机设备及存储介质 |
CN110222709B (zh) * | 2019-04-29 | 2022-01-25 | 上海暖哇科技有限公司 | 一种多标签智能打标方法及系统 |
CN110704698B (zh) * | 2019-12-13 | 2020-04-10 | 中国人民解放军国防科技大学 | 一种非结构化海量网络安全数据的关联及查询方法 |
CN112800023B (zh) * | 2020-12-11 | 2023-01-10 | 北京计算机技术及应用研究所 | 基于语义分类的多模型数据分布式存储和分级查询方法 |
CN113268628B (zh) * | 2021-04-14 | 2023-05-23 | 上海大学 | 一种基于模块化的加权融合神经网络的音乐情感识别方法 |
CN113254518A (zh) * | 2021-05-21 | 2021-08-13 | 京软伟业信息技术(北京)有限公司 | 一种基于粒数据的信息资源管理与分析方法 |
CN115630154B (zh) * | 2022-12-19 | 2023-05-05 | 竞速信息技术(廊坊)有限公司 | 一种面向大数据环境的动态摘要信息构建方法及系统 |
Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101123609A (zh) * | 2007-09-10 | 2008-02-13 | 北京航空航天大学 | 资源的级别自适应搜索方法 |
CN101187938A (zh) * | 2007-11-09 | 2008-05-28 | 中国传媒大学 | 一种多媒体元数据统一描述及检索方法 |
CN101763574A (zh) * | 2009-06-03 | 2010-06-30 | 中国科学院自动化研究所 | 一种基于领域知识的古建筑保护技术信息管理系统及方法 |
CN101908048A (zh) * | 2009-06-04 | 2010-12-08 | 深圳市彪骐数码科技有限公司 | 一种互联网影视内容搜索的方法及系统 |
CN102682122A (zh) * | 2012-05-15 | 2012-09-19 | 北京科技大学 | 基于本体构建材料科学领域语义数据模型的方法 |
CN103116643A (zh) * | 2013-02-25 | 2013-05-22 | 江苏物联网研究发展中心 | 基于Hadoop的智慧医疗数据管理方法 |
CN103412933A (zh) * | 2013-08-20 | 2013-11-27 | 南京物联网应用研究院有限公司 | 一种云搜索平台 |
CN103838833A (zh) * | 2014-02-24 | 2014-06-04 | 华中师范大学 | 基于相关词语语义分析的全文检索系统 |
CN103885945A (zh) * | 2012-12-19 | 2014-06-25 | 中国银联股份有限公司 | 海量信息处理方法和系统 |
CN105740335A (zh) * | 2016-01-22 | 2016-07-06 | 山东合天智汇信息技术有限公司 | 一种基于titan的企业信息分析平台及其构建方法 |
-
2016
- 2016-11-04 CN CN201610972138.7A patent/CN108021592B/zh active Active
Patent Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101123609A (zh) * | 2007-09-10 | 2008-02-13 | 北京航空航天大学 | 资源的级别自适应搜索方法 |
CN101187938A (zh) * | 2007-11-09 | 2008-05-28 | 中国传媒大学 | 一种多媒体元数据统一描述及检索方法 |
CN101763574A (zh) * | 2009-06-03 | 2010-06-30 | 中国科学院自动化研究所 | 一种基于领域知识的古建筑保护技术信息管理系统及方法 |
CN101908048A (zh) * | 2009-06-04 | 2010-12-08 | 深圳市彪骐数码科技有限公司 | 一种互联网影视内容搜索的方法及系统 |
CN102682122A (zh) * | 2012-05-15 | 2012-09-19 | 北京科技大学 | 基于本体构建材料科学领域语义数据模型的方法 |
CN103885945A (zh) * | 2012-12-19 | 2014-06-25 | 中国银联股份有限公司 | 海量信息处理方法和系统 |
CN103116643A (zh) * | 2013-02-25 | 2013-05-22 | 江苏物联网研究发展中心 | 基于Hadoop的智慧医疗数据管理方法 |
CN103412933A (zh) * | 2013-08-20 | 2013-11-27 | 南京物联网应用研究院有限公司 | 一种云搜索平台 |
CN103838833A (zh) * | 2014-02-24 | 2014-06-04 | 华中师范大学 | 基于相关词语语义分析的全文检索系统 |
CN105740335A (zh) * | 2016-01-22 | 2016-07-06 | 山东合天智汇信息技术有限公司 | 一种基于titan的企业信息分析平台及其构建方法 |
Also Published As
Publication number | Publication date |
---|---|
CN108021592A (zh) | 2018-05-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108021592B (zh) | 一种用于影视素材领域的非结构化数据管理方法 | |
CN107220365B (zh) | 基于协同过滤与关联规则并行处理的精准推荐系统及方法 | |
Sun et al. | Mining heterogeneous information networks: a structural analysis approach | |
CN106845645B (zh) | 用于产生语义网络和用于媒体合成的方法及系统 | |
US8489650B2 (en) | System, implementation, application, and query language for a tetrahedral data model for unstructured data | |
TW201319842A (zh) | 搜尋方法、搜尋裝置及搜尋引擎系統 | |
Wu et al. | An incremental community detection method for social tagging systems using locality-sensitive hashing | |
Vijayarani et al. | Multimedia mining research-an overview | |
CN107391577B (zh) | 一种基于表示向量的作品标签推荐方法和系统 | |
CN111291191A (zh) | 一种广电知识图谱构建方法及装置 | |
Priyatharshini et al. | Association based image retrieval: a survey | |
KR102258419B1 (ko) | 지능정보기술기반 애니메이션 콘텐츠 리소스 서비스 시스템 | |
CN112052332A (zh) | 检索方法、装置、电子设备及可读存储介质 | |
Chen et al. | Exploiting aesthetic features in visual contents for movie recommendation | |
CN113221000B (zh) | 一种人才数据智能检索及推荐方法 | |
CN111753861B (zh) | 主动学习自动图像标注系统及方法 | |
Yan | Intelligent Multimedia Databases and Information Retrieval: Advancing Applications and Technologies: Advancing Applications and Technologies | |
Ma | A new aggregated search method | |
CN112559758A (zh) | 构建知识图谱的方法、装置、设备和计算机可读存储介质 | |
Bhandari et al. | Ontology based image recognition: A review | |
Bhairnallykar et al. | Content based medical image retrieval with SVM classification and relevance feedback | |
Arumugam et al. | Enhancing the web image search results through direct and indirect relevance model | |
Grošup et al. | On augmenting database schemas by latent visual attributes | |
Chen et al. | A bag-of-semantics model for image clustering | |
Kumar et al. | Semantic web-based recommendation: Experimental results and test cases |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |