CN110851612B - 基于百科知识的移动应用知识图谱复合型补全方法及装置 - Google Patents

基于百科知识的移动应用知识图谱复合型补全方法及装置 Download PDF

Info

Publication number
CN110851612B
CN110851612B CN201910806480.3A CN201910806480A CN110851612B CN 110851612 B CN110851612 B CN 110851612B CN 201910806480 A CN201910806480 A CN 201910806480A CN 110851612 B CN110851612 B CN 110851612B
Authority
CN
China
Prior art keywords
mobile application
attribute
encyclopedia
knowledge
knowledge graph
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910806480.3A
Other languages
English (en)
Other versions
CN110851612A (zh
Inventor
钮艳
赵淳璐
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
National Computer Network and Information Security Management Center
Original Assignee
National Computer Network and Information Security Management Center
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by National Computer Network and Information Security Management Center filed Critical National Computer Network and Information Security Management Center
Priority to CN201910806480.3A priority Critical patent/CN110851612B/zh
Publication of CN110851612A publication Critical patent/CN110851612A/zh
Application granted granted Critical
Publication of CN110851612B publication Critical patent/CN110851612B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/957Browsing optimisation, e.g. caching or content distillation
    • G06F16/9577Optimising the visualization of content, e.g. distillation of HTML documents
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Animal Behavior & Ethology (AREA)
  • Computational Linguistics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种基于百科知识的移动应用知识图谱复合型补全方法及装置,所述方法包括:对于给定的百科站点,读取该百科站点对应的配置文件,并利用配置文件中的信息,筛选出该百科站点中与移动应用相关联的百科页面;利用网络爬虫抓取筛选出的所述百科页面并存储;针对不同的移动应用属性值采取不同的属性识别算法,从所述百科页面中进行结构化知识的抽取,并以预定格式进行存储;根据抽取的所述结构化知识,更新AllegroGraph中移动应用的属性信息,同时返回一个更新文件提示原始的数据库进行移动应用图谱数据的同步更新补全。

Description

基于百科知识的移动应用知识图谱复合型补全方法及装置
技术领域
本发明涉及计算机技术领域,尤其涉及一种基于百科知识的移动应用知识图谱复合型补全方法及装置。
背景技术
在现有技术中,从移动应用市场爬取移动应用数据并构建移动应用知识图谱是最直接的方式,但是仅通过应用市场数据构建的移动应用知识图谱存在较为严重的属性值缺失的问题,影响业务应用效果。
发明内容
本发明实施例提供一种基于百科知识的移动应用知识图谱复合型补全方法及装置,用以解决现有技术中仅通过应用市场数据构建的移动应用知识图谱存在较为严重的属性值缺失,影响业务应用效果的问题。
本发明实施例提供一种基于百科知识的移动应用知识图谱复合型补全方法,包括:
对于给定的百科站点,读取该百科站点对应的配置文件,并利用配置文件中的信息,筛选出该百科站点中与移动应用相关联的百科页面;
利用网络爬虫抓取筛选出的所述百科页面并存储;
针对不同的移动应用属性值采取不同的属性识别算法,从所述百科页面中进行结构化知识的抽取,并以预定格式进行存储;
根据抽取的所述结构化知识,更新AllegroGraph中移动应用的属性信息,同时返回一个更新文件提示原始的数据库进行移动应用图谱数据的同步更新补全。
本发明实施例还提供一种基于百科知识的移动应用知识图谱复合型补全装置,包括:
筛选模块,用于对于给定的百科站点,读取该百科站点对应的配置文件,并利用配置文件中的信息,筛选出该百科站点中与移动应用相关联的百科页面;
抓取模块,用于利用网络爬虫抓取筛选出的所述百科页面并存储;
抽取模块,用于针对不同的移动应用属性值采取不同的属性识别算法,从所述百科页面中进行结构化知识的抽取,并以预定格式进行存储;
更新模块,用于根据抽取的所述结构化知识,更新AllegroGraph中移动应用的属性信息,同时返回一个更新文件提示原始的数据库进行移动应用图谱数据的同步更新补全。
采用本发明实施例,对百科知识进行结构化抽取,并用于更新补全图谱数据,使得移动应用知识图谱更加完整,业务应用效果更佳。
上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。
附图说明
通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
图1是本发明实施例的基于百科知识的移动应用知识图谱复合型补全方法的流程图;
图2是本发明实施例的针对不同的移动应用属性值采取不同的属性识别算法的示意图;
图3是本发明实施例的实例1的示意图;
图4是本发明实施例的实例2的示意图;
图5是本发明实施例的实例2的示意图;
图6是本发明实施例的BiLSTM-CRF模型框架的示意图;
图7是本发明实施例的基于百科知识的移动应用知识图谱复合型补全装置的示意图。
具体实施方式
下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。
方法实施例
根据本发明实施例,提供了一种基于百科知识的移动应用知识图谱复合型补全方法,在使用应用市场数据初步构建的移动应用知识图谱的基础上,引入百科知识,对移动应用知识图谱属性进行补全。图1是本发明实施例的基于百科知识的移动应用知识图谱复合型补全方法的流程图,如图1所示,根据本发明实施例的基于百科知识的移动应用知识图谱复合型补全方法具体包括:
步骤1,对于给定的百科站点,读取该百科站点对应的配置文件,并利用配置文件中的信息,筛选出该百科站点中与移动应用相关联的百科页面;
在步骤1中,读取该站点对应的配置文件之前,需要给定图数据库中的移动应用名称,预先设置爬虫脚本中的所述配置文件,其中,所述配置文件用于驱动读取百科中移动应用的知识挖掘过程,所述配置文件具体包括以下至少之一:百科中移动应用所属的类别集合、移动应用名称词典、移动应用的属性词典。
步骤2,利用网络爬虫抓取筛选出的所述百科页面并存储;
步骤3,针对不同的移动应用属性值采取不同的属性识别算法,从所述百科页面中进行结构化知识的抽取,并以预定格式进行存储;
步骤3具体包括:
1、针对inforbox中结构化的属性特征,采用基于字符串映射的移动应用知识图谱属性补全方法;具体地:对每一个百科知识平台,分别建立百科知识平台中inforbox各属性字符串与移动应用知识图谱后台图数据库中的属性名称的属性字符串映射表;对每个移动应用对应的百科知识页面,首先抽取inforbox中的属性字符串,并与百科平台的属性字符串映射表进行比对,如果该属性字符串存在于映射表中,则从百科知识页面中继续抽取属性值,用于补全至移动应用知识图谱中。
2、针对移动应用功能点的属性特征,采用基于模版触发词的移动应用知识图谱属性补全方法;具体地,针对特定的属性建立有针对性的模板触发词表,根据所述模板触发词表中的模板触发词进行提取,用于补全移动应用知识图谱。
3、针对移动应用属性实体的属性特征,采用基于BiLSTM-CRF的移动应用知识图谱属性补全方法。
具体地,通过CRF模型对属性中每个实词的上下文信息建模,捕捉语义特征;通过BiLSTM根据所述语义特征,积累属性中所有的有用信息,用于补全移动应用知识图谱。
步骤4,根据抽取的所述结构化知识,更新AllegroGraph中移动应用的属性信息,同时返回一个更新文件提示原始的数据库进行移动应用图谱数据的同步更新补全。
以下结合附图,对本发明实施例的技术方案进行详细说明。
百科知识以无结构或半结构的数据为主,本文通过字符串映射、BiLSTM-CRF和模板触发词多种复合技术相结合的方法,对百科知识进行结构化抽取,并用于更新补全图谱数据。
利用百科知识补全移动应用知识图谱的外围步骤如下:
1)给定图数据库中的移动应用名称,预先设置爬虫脚本中的配置文件,用于驱动读取百科中移动应用的知识挖掘过程。爬虫脚本中的配置文件具体包括:百科中移动应用所属的类别集合(categories set)、移动应用名称词典、移动应用的属性词典等。
2)对于给定的百科站点,读取该站点对应的配置文件,并利用配置文件中的信息,筛选出该百科中和移动应用相关联的页面。
3)利用网络爬虫抓取上一步筛选出的百科页面,并存储到本地。
4)如图2所示,采用基于百科知识的移动应用知识图谱复合型补全方法,针对不同的移动应用属性值采取不同的属性识别算法。通常将抽取的结果统一存储为Ntriples格式。
5)基于上一步抽取好的结构化知识,更新AllegroGraph中移动应用的属性信息,同时返回一个更新文件提示原始的数据库进行移动应用图谱数据的同步更新补全。
以下进行举例说明。
一、基于字符串映射的移动应用知识图谱属性补全方法
对于inforbox中结构化的属性信息,采用基于字符串映射的属性补全方法。
具体步骤为:
1、对每一个百科知识平台,如百度百科、搜狐百科,分别建立百科知识平台中inforbox各属性字符串与移动应用知识图谱后台图数据库中的属性名称的映射表;
2、对每个移动应用对应的百科知识页面,首先抽取inforbox中的属性字符串,并与百科平台的属性字符串映射表进行比对,如果该属性字符串存在于映射表中,则从百科知识页面中继续抽取属性值,并将之补全至移动应用知识图谱中。
如图3所示的方框部分为移动应用“陌陌”在百度百科知识页面的inforbox部分,其中的“外文名”、“开发商”、“平台”、“上线时间”等属性即可以通过基于字符串映射的方法进行提取并用于补全知识图谱。
二、基于模版触发词的移动应用知识图谱属性补全方法
对于统计模型难于识别的属性特征,针对特定的属性建立有针对性的模板触发词表,如图4所示方框部分为移动应用“陌陌”在百度百科知识页面的“特色功能”部分,其中的“社交”、“发现附近人”、“即时互动”等陌陌具备的功能即可以通过基于模板触发词的方法进行提取并用于补全知识图谱。
三、基于BiLSTM-CRF的移动应用知识图谱属性补全方法
如图5中方框中所示为百科知识页面移动应用介绍性描述文字,其中涉及到的人名、地名、机构名、公司名等实体,可通过BiLSTM+CRF的方法识别提取并用于补全移动应用知识图谱。BiLSTM-CRF模型框架如图6所示。其中CRF模型的方式是对句子中每个实词的上下文信息建模,捕捉n-gram级别的语义特征。
CRF层的参数是矩阵P和A,Pi∈RK的每一维Pij都视作将字xi分类到第j个标签的打分值;在(k+2)×(k+2)的矩阵A中,Aij表示从第i个标签到第j个标签的转移得分,(k+2)的原因是每句话前后都要加入一个起始状态和中止状态。
BiLSTM属于递归神经网络(CNN),它对于序列建模有独特的优势,能积累一句话所有的信息。如果一个标签序列为y=(y1,y2,…,yn),那么模型对于句子x的标签等于y的打分为:
综上所述,借助于本发明实施例的技术方案,通过字符串映射、BiLSTM-CRF和模板触发词多种复合技术相结合的方法,对百科知识进行结构化抽取,并用于更新补全图谱数据,使得移动应用知识图谱更加完整,业务应用效果更佳。
装置实施例
根据本发明实施例,提供了一种基于百科知识的移动应用知识图谱复合型补全装置,图7是本发明实施例的基于百科知识的移动应用知识图谱复合型补全装置的示意图,如图7所示,根据本发明实施例的基于百科知识的移动应用知识图谱复合型补全装置具体包括:
筛选模块70,用于对于给定的百科站点,读取该百科站点对应的配置文件,并利用配置文件中的信息,筛选出该百科站点中与移动应用相关联的百科页面;
抓取模块72,用于利用网络爬虫抓取筛选出的所述百科页面并存储;
抽取模块74,用于针对不同的移动应用属性值采取不同的属性识别算法,从所述百科页面中进行结构化知识的抽取,并以预定格式进行存储;
所述抽取模块74具体包括:
字符串映射子模块,用于针对inforbox中结构化的属性特征,采用基于字符串映射的移动应用知识图谱属性补全方法;所述字符串映射子模块具体用于:对每一个百科知识平台,分别建立百科知识平台中inforbox各属性字符串与移动应用知识图谱后台图数据库中的属性名称的属性字符串映射表;对每个移动应用对应的百科知识页面,首先抽取inforbox中的属性字符串,并与百科平台的属性字符串映射表进行比对,如果该属性字符串存在于映射表中,则从百科知识页面中继续抽取属性值,用于补全至移动应用知识图谱中;
模版触发词子模块,用于针对移动应用功能点的属性特征,采用基于模版触发词的移动应用知识图谱属性补全方法;所述模版触发词子模块具体用于:针对特定的属性建立有针对性的模板触发词表,根据所述模板触发词表中的模板触发词进行提取,用于补全移动应用知识图谱;
BiLSTM-CRF子模块,用于针对移动应用属性实体的属性特征,采用基于BiLSTM-CRF的移动应用知识图谱属性补全方法;所述BiLSTM-CRF子模块具体用于:通过CRF模型对属性中每个实词的上下文信息建模,捕捉语义特征;通过BiLSTM根据所述语义特征,积累属性中所有的有用信息,用于补全移动应用知识图谱。
更新模块76,用于根据抽取的所述结构化知识,更新AllegroGraph中移动应用的属性信息,同时返回一个更新文件提示原始的数据库进行移动应用图谱数据的同步更新补全。
优选地,在本发明实施例中,上述装置进一步包括:
设置模块,用于给定图数据库中的移动应用名称,预先设置爬虫脚本中的所述配置文件,其中,所述配置文件用于驱动读取百科中移动应用的知识挖掘过程,所述配置文件具体包括以下至少之一:百科中移动应用所属的类别集合、移动应用名称词典、移动应用的属性词典。
本发明实施例中各个模块的具体处理可以参上上述方法实施例进行理解,在此不再赘述。
显然,本领域的技术人员应该明白,上述的本发明的各模块或各步骤可以用通用的计算装置来实现,它们可以集中在单个的计算装置上,或者分布在多个计算装置所组成的网络上,可选地,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在存储装置中由计算装置来执行,并且在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样,本发明不限制于任何特定的硬件和软件结合。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (7)

1.一种基于百科知识的移动应用知识图谱复合型补全方法,其特征在于,包括:
对于给定的百科站点,读取该百科站点对应的配置文件,并利用配置文件中的信息,筛选出该百科站点中与移动应用相关联的百科页面;
利用网络爬虫抓取筛选出的所述百科页面并存储;
针对不同的移动应用属性值采取不同的属性识别算法,从所述百科页面中进行结构化知识的抽取,并以预定格式进行存储;
根据抽取的所述结构化知识,更新AllegroGraph中移动应用的属性信息,同时返回一个更新文件提示原始的数据库进行移动应用图谱数据的同步更新补全;
其中,针对不同的移动应用属性值采取不同的属性识别算法,从所述百科页面中进行结构化知识的抽取,并以预定格式进行存储,包括:
针对inforbox中结构化的属性特征,采用基于字符串映射的移动应用知识图谱属性补全方法;
针对移动应用功能点的属性特征,采用基于模版触发词的移动应用知识图谱属性补全方法;
针对移动应用属性实体的属性特征,采用基于BiLSTM-CRF的移动应用知识图谱属性补全方法。
2.如权利要求1所述的方法,其特征在于,读取该站点对应的配置文件之前,所述方法进一步包括:
给定图数据库中的移动应用名称,预先设置爬虫脚本中的所述配置文件,其中,所述配置文件用于驱动读取百科中移动应用的知识挖掘过程,所述配置文件具体包括以下至少之一:百科中移动应用所属的类别集合、移动应用名称词典、移动应用的属性词典。
3.如权利要求1所述的方法,其特征在于,针对inforbox中结构化的属性特征,采用基于字符串映射的移动应用知识图谱属性补全方法具体包括:
对每一个百科知识平台,分别建立百科知识平台中inforbox各属性字符串与移动应用知识图谱后台图数据库中的属性名称的属性字符串映射表;
对每个移动应用对应的百科知识页面,首先抽取inforbox中的属性字符串,并与百科平台的属性字符串映射表进行比对,如果该属性字符串存在于映射表中,则从百科知识页面中继续抽取属性值,用于补全至移动应用知识图谱中。
4.如权利要求1所述的方法,其特征在于,针对移动应用功能点的属性特征,采用基于模版触发词的移动应用知识图谱属性补全方法具体包括:
针对特定的属性建立有针对性的模板触发词表,根据所述模板触发词表中的模板触发词进行提取,用于补全移动应用知识图谱。
5.如权利要求1所述的方法,其特征在于,针对移动应用属性实体的属性特征,采用基于BiLSTM-CRF的移动应用知识图谱属性补全方法具体包括:
通过CRF模型对属性中每个实词的上下文信息建模,捕捉语义特征;
通过BiLSTM根据所述语义特征,积累属性中所有的有用信息,用于补全移动应用知识图谱。
6.一种基于百科知识的移动应用知识图谱复合型补全装置,其特征在于具体包括:
筛选模块,用于对于给定的百科站点,读取该百科站点对应的配置文件,并利用配置文件中的信息,筛选出该百科站点中与移动应用相关联的百科页面;
抓取模块,用于利用网络爬虫抓取筛选出的所述百科页面并存储;
抽取模块,用于针对不同的移动应用属性值采取不同的属性识别算法,从所述百科页面中进行结构化知识的抽取,并以预定格式进行存储;
更新模块,用于根据抽取的所述结构化知识,更新AllegroGraph中移动应用的属性信息,同时返回一个更新文件提示原始的数据库进行移动应用图谱数据的同步更新补全;
其中,所述抽取模块具体包括:
字符串映射子模块,用于针对inforbox中结构化的属性特征,采用基于字符串映射的移动应用知识图谱属性补全方法;所述字符串映射子模块具体用于:对每一个百科知识平台,分别建立百科知识平台中inforbox各属性字符串与移动应用知识图谱后台图数据库中的属性名称的属性字符串映射表;对每个移动应用对应的百科知识页面,首先抽取inforbox中的属性字符串,并与百科平台的属性字符串映射表进行比对,如果该属性字符串存在于映射表中,则从百科知识页面中继续抽取属性值,用于补全至移动应用知识图谱中;
模版触发词子模块,用于针对移动应用功能点的属性特征,采用基于模版触发词的移动应用知识图谱属性补全方法;所述模版触发词子模块具体用于:针对特定的属性建立有针对性的模板触发词表,根据所述模板触发词表中的模板触发词进行提取,用于补全移动应用知识图谱;
BiLSTM-CRF子模块,用于针对移动应用属性实体的属性特征,采用基于BiLSTM-CRF的移动应用知识图谱属性补全方法;所述BiLSTM-CRF子模块具体用于:通过CRF模型对属性中每个实词的上下文信息建模,捕捉语义特征;通过BiLSTM根据所述语义特征,积累属性中所有的有用信息,用于补全移动应用知识图谱。
7.如权利要求6所述的装置,其特征在于,所述装置进一步包括:
设置模块,用于给定图数据库中的移动应用名称,预先设置爬虫脚本中的所述配置文件,其中,所述配置文件用于驱动读取百科中移动应用的知识挖掘过程,所述配置文件具体包括以下至少之一:百科中移动应用所属的类别集合、移动应用名称词典、移动应用的属性词典。
CN201910806480.3A 2019-08-29 2019-08-29 基于百科知识的移动应用知识图谱复合型补全方法及装置 Active CN110851612B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910806480.3A CN110851612B (zh) 2019-08-29 2019-08-29 基于百科知识的移动应用知识图谱复合型补全方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910806480.3A CN110851612B (zh) 2019-08-29 2019-08-29 基于百科知识的移动应用知识图谱复合型补全方法及装置

Publications (2)

Publication Number Publication Date
CN110851612A CN110851612A (zh) 2020-02-28
CN110851612B true CN110851612B (zh) 2023-08-18

Family

ID=69595534

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910806480.3A Active CN110851612B (zh) 2019-08-29 2019-08-29 基于百科知识的移动应用知识图谱复合型补全方法及装置

Country Status (1)

Country Link
CN (1) CN110851612B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112464115A (zh) * 2020-11-24 2021-03-09 北京字节跳动网络技术有限公司 一种信息展示的方法、装置以及计算机存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018019289A1 (zh) * 2016-07-29 2018-02-01 万云数码媒体有限公司 基于结构化网络知识自动生成中文本体库的方法、系统、计算机设备和计算机可读介质
CN107797991A (zh) * 2017-10-23 2018-03-13 南京云问网络技术有限公司 一种基于依存句法树的知识图谱扩充方法及系统
CN109033160A (zh) * 2018-06-15 2018-12-18 东南大学 一种知识图谱动态更新方法
CN109086391A (zh) * 2018-07-27 2018-12-25 北京光年无限科技有限公司 一种构建知识图谱的方法及系统

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018019289A1 (zh) * 2016-07-29 2018-02-01 万云数码媒体有限公司 基于结构化网络知识自动生成中文本体库的方法、系统、计算机设备和计算机可读介质
CN107797991A (zh) * 2017-10-23 2018-03-13 南京云问网络技术有限公司 一种基于依存句法树的知识图谱扩充方法及系统
CN109033160A (zh) * 2018-06-15 2018-12-18 东南大学 一种知识图谱动态更新方法
CN109086391A (zh) * 2018-07-27 2018-12-25 北京光年无限科技有限公司 一种构建知识图谱的方法及系统

Also Published As

Publication number Publication date
CN110851612A (zh) 2020-02-28

Similar Documents

Publication Publication Date Title
US10095780B2 (en) Automatically mining patterns for rule based data standardization systems
CN111767716B (zh) 企业多级行业信息的确定方法、装置及计算机设备
CN112749284B (zh) 知识图谱构建方法、装置、设备及存储介质
US10713306B2 (en) Content pattern based automatic document classification
CN109947952B (zh) 基于英语知识图谱的检索方法、装置、设备及存储介质
CN112241481A (zh) 基于图神经网络的跨模态新闻事件分类方法及系统
US11860955B2 (en) Method and system for providing alternative result for an online search previously with no result
CN113971398A (zh) 一种面向网络安全领域实体快速识别的词典构造方法
CN111522901A (zh) 文本中地址信息的处理方法及装置
CN112149387A (zh) 财务数据的可视化方法、装置、计算机设备及存储介质
CN112818200A (zh) 基于静态网站的数据爬取及事件分析方法及系统
CN113360654A (zh) 文本分类方法、装置、电子设备及可读存储介质
CN110851612B (zh) 基于百科知识的移动应用知识图谱复合型补全方法及装置
US20200293581A1 (en) Systems and methods for crawling web pages and parsing relevant information stored in web pages
TW202123026A (zh) 資料歸檔方法、裝置、電腦裝置及存儲介質
US20150193459A1 (en) Data file searching method
CN113704420A (zh) 文本中的角色识别方法、装置、电子设备及存储介质
CN112767933B (zh) 公路养护管理系统的语音交互方法、装置、设备及介质
CN115470489A (zh) 检测模型训练方法、检测方法、设备以及计算机可读介质
CN114518993A (zh) 基于业务特征的系统性能监控方法、装置、设备及介质
CN113590792A (zh) 用户问题的处理方法、装置和服务器
CN110851560B (zh) 信息检索方法、装置及设备
CN112199954A (zh) 基于语音语义的疾病实体匹配方法、装置及计算机设备
Monaco Methods for in-sourcing authority control with MarcEdit, SQL, and regular expressions
KR102550868B1 (ko) 교원 업적 검증 시스템

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant